Pytorch刚更新到1.9,今天就简单的尝试了一下,发现之前1.8中的很多bug都已经修复了(之前torch1.8+CUDA11问题较多),推荐使用。
PyTorch官网:https://pytorch.org/
查询NVIDIA GPU算力(可跳过)
通过如下链接可以查询到NVIDIA显卡对应的算力,如果你的GPU型号不在表中,可能GPU太老,或者算力太低。
https://developer.nvidia.com/cuda-gpus#collapseOne

创建虚拟环境
在安装之间,强烈建议使用conda创建一个新的虚拟环境,这样就不会对你之前的环境照成影响。这里以创建torch1.9为例:
- 这里创建一个名为
torch1.9的虚拟环境,python使用3.8的版本
conda create -n torch1.9 python=3.8
- 创建完成后,激活虚拟环境(注:后续的操作都是在该虚拟环境下进行)
conda activate torch1.9
在线安装(CPU/GPU)
首先进入PyTorch官网:https://pytorch.org/

安装CPU版本
接着选择对应的系统(Your OS)这里以Linux为例,安装方式(Package)这里以Pip为例,还有计算平台(安装CPU就选择CPU即可),接着在Run this Command中会提供对应的安装指令。

这里直接基于刚刚创建好的虚拟环境进行安装(注意:由于使用conda创建的虚拟环境这里直接用pip不用pip3),官方默认安装了torch、torchvision以及torchaudio三个包,假如你不需要使用torchaudio这个包,就把torchaudio==0.9.0指令删掉:
pip install torch==1.9.0+cpu torchvision==0.10.0+cpu torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html
安装GPU版本
通过官方的提示可以看到,torch1.9GPU是支持CUDA10.2和CUDA11.1的,这里以CUDA11.1为例。
检查GPU驱动版本
这里直接在NVIDIA官网,看下CUDA版本以及GPU驱动的对应关系:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
通过上表可以发现,如果要使用CUDA11.1,那么需要将显卡的驱动更新至455.23或以上(Linux x86_64环境)。关于如何更新GPU驱动,本文不做赘述。
接着选择对应的系统(Your OS)这里以Linux为例,安装方式(Package)这里以Pip为例,还有计算平台(CPU/GPU)这里以CUDA11.1为例,接着在Run this Command中会提供对应的安装指令。

这里直接基于刚刚创建好的虚拟环境进行安装(注意:由于使用conda创建的虚拟环境这里直接用pip不用pip3),官方默认安装了torch、torchvision以及torchaudio三个包,假如你不需要使用torchaudio这个包,就把torchaudio==0.9.0指令删掉:
pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html
安装完成后,进入python环境,检查CUDA是否可用,调用torch.cuda.is_available()返回True说明CUDA环境可用。

离线安装(CPU/GPU)
有些时候,可能你的服务器无法连接外网,此时需要提前准备好需要安装的whl文件,那么我们这里就以torch和torchvision为例(注意安装torch前需要提前安装好numpy包)。刚刚我们在线安装时发现安装指令最后有个网址,https://download.pytorch.org/whl/torch_stable.html,没错就是官方存放所有的安装包,所以我们可以直接去那里下载。
安装CPU版本
这里以Linux系统以及python3.8为例,下载下面用红色框框住的文件:


我们在这里可以找到我们需要的torch-1.9.0+cpu-cp38-cp38-linux_x86_64.whl以及torchvision-0.10.0+cpu-cp38-cp38-linux_x86_64.whl两个文件即可。注意,cp38表示python3.8的编译环境,linux_x86_64表示x86的平台64位操作系统。下载完成后,我们将这两个文件传入你的离线主机(服务器)中。接着进入刚刚用conda创建好的虚拟环境后依次安装whl包:
pip install torch-1.9.0+cpu-cp38-cp38-linux_x86_64.whl
以及
pip install torchvision-0.10.0+cpu-cp38-cp38-linux_x86_64.whl
安装GPU版本
这里以Linux系统CUDA11.1以及python3.8为例,下载下面用红色框框住的文件:

我们在这里可以找到我们需要的torch-1.9.0+cu111-cp38-cp38-linux_x86_64.whl以及torchvision-0.10.0+cu111-cp38-cp38-linux_x86_64.whl两个文件即可。注意,cu111代表CUDA11.1,cp38表示python3.8的编译环境,linux_x86_64表示x86的平台64位操作系统。下载完成后,我们将这两个文件传入你的离线主机(服务器)中。接着进入刚刚用conda创建好的虚拟环境后依次安装whl包:
pip install torch-1.9.0+cu111-cp38-cp38-linux_x86_64.whl
以及
pip install torchvision-0.10.0+cu111-cp38-cp38-linux_x86_64.whl