Failed to initialize NVML driver/library version mismatch

Author Avatar
akimoto-cris 11月 19, 2018

Troubleshooting

Ubuntu 16.04 下,手贱更新了一下 apt-get 更新 vim 编辑器后,所有 DL 框架都莫名其妙找不到 GPU 了,nvidia-smi 提示 Failed to initialize NVML driver/library version mismatch

于是,在两天两夜的延长作战过程中,我尝试了几乎所有能搜索到的方法,以下这些统统无效:

  1. 无数次重启
  2. purge 掉 nvida 所有驱动和 cuda-toolkit 然后重装 cuda
  3. 重启后,rmmod nvidia-uvm, nvidia-modeset 等依赖(lsmod | grep -i nvidia 可以查具体有哪些依赖),然后再运行 nvidia-smi
  4. cat /proc/drivers/nvidia/version 找到对应的驱动版本,然后从英伟达官网下载对应驱动,手动安装(不过提示 gcc 版本不对,没装成功)

解决方法

sudo apt-get autoclean

。。。

还我周末两天…(暴毙

除后患

禁止 apt 应用偷偷更新驱动: sudo vim /etc/apt/apt.conf.d/50unattended-upgrades,

把下面大括号内的配置全部注释掉: