Failed to initialize NVML driver/library version mismatch
Troubleshooting
Ubuntu 16.04 下,手贱更新了一下 apt-get 更新 vim 编辑器后,所有 DL 框架都莫名其妙找不到 GPU 了,nvidia-smi
提示 Failed to initialize NVML driver/library version mismatch
。
于是,在两天两夜的延长作战过程中,我尝试了几乎所有能搜索到的方法,以下这些统统无效:
- 无数次重启
- purge 掉 nvida 所有驱动和 cuda-toolkit 然后重装 cuda
- 重启后,rmmod
nvidia-uvm
,nvidia-modeset
等依赖(lsmod | grep -i nvidia
可以查具体有哪些依赖),然后再运行nvidia-smi
cat /proc/drivers/nvidia/version
找到对应的驱动版本,然后从英伟达官网下载对应驱动,手动安装(不过提示 gcc 版本不对,没装成功)
解决方法
sudo apt-get autoclean
。。。
还我周末两天…(暴毙
除后患
禁止 apt 应用偷偷更新驱动: sudo vim /etc/apt/apt.conf.d/50unattended-upgrades
,
把下面大括号内的配置全部注释掉: