NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running

服务器重启过后,显卡失效。
使用nvidia-smi命令,显示报错如下:
在这里插入图片描述
使用nvcc -V查看CUDA还在
在这里插入图片描述
接下来可以使用

ls /usr/src | grep nvidia

查看自己安装的nvidia版本
在这里插入图片描述
然后需要cd到/usr/src目录下,执行如下命令

sudo apt install dkms

在这里插入图片描述

接着根据你自己的nvidia版本进行安装(我自己的是510.60.02)

sudo dkms install -m nvidia -v 510.60.02

安装nvidia的时候可能会报错
在这里插入图片描述
安装高版本的gcc 即可解决这个问题(此处省略这个步骤)
接着就能正常执行啦
在这里插入图片描述
nvidia-smi恢复正常
在这里插入图片描述


版权声明:本文为chengxy1998原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。