ubuntu18.04安装cuda、cudnn、pytorch-gpu

cuda安装

参考博客
https://blog.csdn.net/mbdong/article/details/121926316
https://mp.weixin.qq.com/s/ZTzfC7xp8PVMvOONVIiK6g
https://blog.csdn.net/qq_54556560/article/details/125408793 该博客同时包含pycharm教程

通过:

nvidia-smi

查看NVIDIA驱动和推荐的cuda版本,Linux上驱动安装可以参照网上教程.
本环境为GTX-1650显卡,采用nvidia-470驱动,安装cuda11.4版本.Anaconda版本为1.9.12
CUDA版本下载: https://developer.nvidia.com/cuda-toolkit-archive
CUDNN版本下载:https://developer.nvidia.com/rdp/cudnn-archive

wget https://developer.download.nvidia.com/compute/cuda/11.4.3/local_installers/cuda_11.4.3_470.82.01_linux.run
chmod -x cuda_11.4.3_470.82.01_linux.run 
sudo sh cuda_11.4.3_470.82.01_linux.run 

安装选项中去掉显卡驱动安装的勾选,在已经安装显卡驱动的情况下,避免与已有驱动程序的冲突。

在这里插入图片描述

安装之后默认会产生/usr/local/cuda目录,其中包含已安装的CUDA内容,可以通过

cat /usr/local/cuda/version.json

查看安装的版本信息。可以通过运行samples下的程序检查是否安装有效,如下

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make ./deviceQuery
./deviceQuery

进入目录,编译生成程序,然后运行程序。出现类似如下的信息

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CZ73lroc-1657641003898)(/home/yzl/.config/Typora/typora-user-images/image-20220711234847368.png)]

出现result=pass说明通过.

在.bashrc中添加:

export PATH=/usr/local/cuda-11.4/bin${PATH:+:$PATH}}    
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

$ nvcc -V

就能够显示安装的CUDA版本信息。

img

选择cuDNN Library for Linux (x86_64) 选项,下载后得到cudnn-11.4-linux-x64-v8.2.4.15.tgz文件,进行解压

$ tar -zxvf cudnn-11.4-linux-x64-v8.2.4.15.tgz

解压后产生cuda目录,里面包含cuDNN的库文件、头文件等内容,其中包含目录

include - cuDNN库头文件
lib64 - cuDNN库文件

把相应的库文件和头文件复制到CUDA目录,即安装完成。

$ sudo cp cuda/lib64/* /usr/local/cuda-11.4/lib64
$ sudo cp cuda/include/* /usr/local/cuda-11.4/include

运行:(注意复制到cuda-11.4和cuda安装位置相同,网上教程有点混乱)

sudo chmod a+r /usr/local/cuda-11.4/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-11.4/lib64/libcudnn*

给所有用户添加读的权限.

通过指令

cat /usr/local/cuda-11.4/include/cudnn_version.h

可以查看cuDNN的版本信息。

pytorch-gpu安装

pytorch官网找匹配的版本

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ygQb9Hro-1657641003899)(/home/yzl/.config/Typora/typora-user-images/image-20220712003525529.png)]

没有CUDA11.4版本,安装11.3版本.(实测可用)

在anaconda环境中输入(本文为pytorch环境):

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

测试安装是否正确,终端依次输入:

python
import torch

显示torch版本:

torch.version

查看gpu是否可用:

print(torch.cuda.is_available())

输入一个矩阵运算:

import torch as t
x = t.rand(5,3)
y = t.rand(5,3)
if t.cuda.is_available():
x = x.cuda()
y = y.cuda()
print(x+y)

pytorch-cpu安装(不用gpu,只用cpu)

activate在anaconda中创建的环境,运行

conda install pytorch torchvision cpuonly -c pytorch

测试是否安装成功

import torch
print(torch.__version__)

在这里插入图片描述

卸载cuda

To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-11.4/bin


版权声明:本文为sroman原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。