当我运行nvidia-smi时,我得到以下消息:

初始化NVML失败:驱动程序/库版本不匹配

一小时前,我收到了同样的消息,卸载了我的CUDA库,我能够运行nvidia-smi,得到以下结果:

之后,我从NVIDIA官方页面下载了cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb,然后简单地:

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}

现在我已经安装了CUDA,但我得到了前面提到的不匹配错误。


一些可能有用的信息:

运行cat /proc/driver/nvidia/version得到:

NVRM version: NVIDIA UNIX x86_64 Kernel Module  378.13  Tue Feb  7 20:10:06 PST 2017
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.4)

我正在运行Ubuntu 16.04.2 LTS (Xenial Xerus)。

内核发行版是4.4.0-66-generic。


当前回答

我已经重新安装了Nvidia驱动程序:在root模式下运行这些命令:

Systemctl隔离多用户。target Modprobe -r nvidia-drm 重新安装Nvidia驱动:chmod +x Nvidia - linux -x86_64 - 41010 .57.run Systemctl start graphic .target

最后检查一下nvidia-smi

感谢:

如何在Ubuntu-16.04/18.04操作系统上为RTX 2080 Ti GPU安装Nvidia驱动和CUDA-10.0 如何卸载内核模块'nvidia-drm'?

其他回答

我已经重新安装了Nvidia驱动程序:在root模式下运行这些命令:

Systemctl隔离多用户。target Modprobe -r nvidia-drm 重新安装Nvidia驱动:chmod +x Nvidia - linux -x86_64 - 41010 .57.run Systemctl start graphic .target

最后检查一下nvidia-smi

感谢:

如何在Ubuntu-16.04/18.04操作系统上为RTX 2080 Ti GPU安装Nvidia驱动和CUDA-10.0 如何卸载内核模块'nvidia-drm'?

重启或卸载驱动程序对我来说不起作用。 我把我的Nvidia驱动程序440.33.01更新到450.80.2,解决了这个问题。

sudo apt-get install nvidia-driver-450

sudo reboot

我正在运行Ubuntu 20.04 LTS (Focal Fossa),这是一个远程服务器。

令人惊讶的是,重新启动解决了这个问题(我以为我已经尝试过了)。

Robert Crovella在评论中提到的解决方案可能对其他人也有用,因为它与我第一次遇到问题时解决问题的方法非常相似。

前两个答案不能解决我的问题。我在英伟达官方论坛上找到了一个解决方案。

以下错误信息可能是由于使用不同的方法安装了两个不同版本的驱动程序而导致的。例如,通过APT和官方安装程序安装Nvidia驱动。

初始化NVML失败:驱动程序/库版本不匹配

为了解决这个问题,只需要执行以下两个命令中的一个。

sudo apt-get --purge remove "*nvidia*"
sudo /usr/bin/nvidia-uninstall

我将容器提交到Docker映像中。然后我用这个Docker映像重新创建了另一个容器,问题就解决了。