一:给电脑安装英伟达的显卡驱动。首先找到对应的系统的CUDA版本。(一定要找对应系统版本的程序,不然安装时会报错导致安装不成功)下载地址为:https://developer.nvidia.com/cuda-10.2-download-archive?
如下图所示:
本文档里面安装程序的类型为runfile(local),版本为: cuda_10.2.89_440.33.01_linux.run。当你选择好了所有的条件后,会出现基本安装程序,全选下载网址,(如下图所示:)单击鼠标右 键选择转到,浏览下载程序会自动下载本安装程序。
二:下载好cuda_10.2.89_440.33.01_linux.run程序后,拷贝到需要安装驱动的liunx服务器上,执行 sh cuda_10.2.89_440.33.01_linux.run 命令。等待一段时间,界面会出现选择框,输入accept 即可。如下图所示:
输入accept后在次等待一段时间,会出现如下界面:选择需要安装的模块。[X]为选择,[ ]为不选择。选择好后光标移动到install上,点击enter健,程序会自动开始安装,需要等待一段时间。
安装好后,界面会提示需要配置环境,如下图所示:
找到下面的两句话,使用vim 命令打开/etc/profile文件,添加进去如下图
PATH includes /usr/local/cuda-10.2/bin
LD_LIBRARY_PATH includes /usr/local/cuda-10.2/lib64, or, add /usr/local/cuda-10.2/lib64 to /etc/ld.so.conf and run ldconfig as root
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
刷新/etc/profile文件
source /etc/profile
输入nvcc –version 可以看到工具版本:
输入nvidia-smi可以看到显卡的信息:
三:问题解答
sh run安装cuda失败,日志里面错误代码:Finished with code: 256
解决方案:
- 要先禁用nouveau。步骤如下:
查看命令:
lsmod | grep nouveau
修改dist-blacklist.conf文件:
vim /lib/modprobe.d/dist-blacklist.conf
将nvidiafb注释掉:
#blacklist nvidiafb
然后添加以下语句:
blacklist nouveau
options nouveau modeset=0
屏蔽前:
屏蔽后:
注意:有时候屏蔽了nouveau后输入 lsmod | grep nouveau,界面仍然会有信息展示。可以先执行安装驱动程序的命令试试。
2.重建initramfs image步骤
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
3. 修改运行级别为文本模式
systemctl set-default multi-user.target
4. 重新启动Reboot
5.重新执行 sh cuda_10.2.89_440.33.01_linux.run
6. 输入nvidia-smi 查看信息。
四:安装 cudnn-10.2-linux-x64-v7.6.5.32.tgz
打开cudnn下载网址:https://developer.nvidia.com/cudnn
点击下载cuDNN,这里需要你注册登录。注册登录后选择适合cuda10.2的cudnn7.6..5进行下载:
在第三行里面的cudnn library for linux 上右击转到,会新弹出一个页面,浏览器下载程序会自动下载压缩包。
把下载好的与cuda匹配的cudnn压缩包下载到本地后上传到服务器上。例如cudnn-10.2-linux-x64-v7.6.5.32.tgz
终端输入:tar -xzvf cudnn-10.2-linux-x64-v7.6.5.32.tgz进行解压。解压后如图所示,产生一个cuda的文件夹。
进入解压好的cuda文件夹里面。cd cuda 然后在终端输入以下命令将文件复制到CUDA中:
sudo cp include/cudnn.h /usr/local/cuda/include
sudo cp lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
终端输入:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2,如下显示即安装成功:
至此,cuda+cudnn的安装到此全部完成。