Ubuntu18.04配置cuda踩坑记录

CUDA官网下载:cuda下载地址
系统:Ubuntu18.04

1.下载cuda安装包

根据自己的系统一步步选择
在这里插入图片描述
*不需要再安装nvidia驱动了,因为cuda现在自带驱动

2.验证显卡,检查gcc、kernel版本

lspci | grep -i nvidia
gcc -v  #查询gcc版本

没有gcc的话使用sudo apt install build-essential安装,Ubuntu18.04默认版本为7.5.0

uname -r  #查询内核版本

3.禁用nouveau

使用lsmod | grep nouveau,若有输出则要禁用
先打开一个文件,

vim /etc/modprobe.d/blacklist-nouveau.conf

文件是空的,所以直接写入就行:

blacklist nouveau
options nouveau modeset=0

关闭文件执行:

sudo update-initramfs -u

重启系统:sudo reboot
重新查看lsmod | grep nouveau,没有输出则禁用成功

4.关闭用户界面

sudo service lightdm stop

不关闭用户界面安装驱动时会报错(centos系统不用关闭)

5.安装cuda

sudo sh cuda_10.1.105_418.39_linux.run

安装时勾选所有选项,会自动安装驱动
等待很久,结果却显示:

Completed with errors. See log at /var/log/cuda-installer.log for details.

?????一脸懵逼
查询日志,发现是安装驱动时内核部分出错了,在网上查了很久,试了很多办法都不管用,当事人就是很懵T T
于是索性更改cuda版本到11.0

sudo sh cuda_11.0.2_450.51.05_linux.run

结果显示:

===========
= Summary =
===========

Driver:   Installed
Toolkit:  Installed in /usr/local/cuda-11.0/
Samples:  Installed in /home/c611/, but missing recommended libraries

Please make sure that
 -   PATH includes /usr/local/cuda-11.0/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-11.0/lib64, or, add /usr/local/cuda-11.0/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.0/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall

竟然就成了!!!
使用nvidia-smi以及nvcc --version检查,成功输出~

6.更改环境变量

进入环境变量,vim ~/.bashrc,在底部加上:

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

更新环境变量:source ~/.bashrc
现在可以查询到cuda版本:cat /usr/local/cuda/version.txt

重启系统:sudo reboot *重启后会自动开启用户界面

完成!芜湖~


版权声明:本文为weixin_43719427原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。