tensorflow 配置
1、查看选择tensorflow版本
https://tensorflow.google.cn/install/source
选择对应的tensorflow版本,确定对应的cuda和cudnn版本
比如选择tensorflow-gpu-1.15.0版本
2、查看cuda版本
输入cuda版本查看指令
nvcc -V
当版本不对时候,需要卸载并重新安装对应版本
cuda卸载指令
# --purge选项会将配置文件、数据库等删除
sudo apt-get autoremove --purge cuda
# 查看安装了哪些cuda相关的库,可以用以下指令
sudo dpkg -l |grep cuda
将版本卸载干净后,继续安装新版本,参考官方,比如cuda10.0
https://developer.nvidia.com/cuda-toolkit-archive
10.0的在线安装版本指令
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
安装完成后,修改环境变量
$ sudo vim ~/.bashrc
输入如下指令(注意版本号要修改为自己当前版本,如下8.0需要更改)
export PATH="/usr/local/cuda-8.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:$LD_LIBRARY_PATH"
输入如下指令是环境变量立即生效
$ source ~/.bashrc
利用nvcc -V指令来查看当前版本
注意可能需要重启使得显卡生效sudo reboot
3、安装对应的cudnn
https://developer.nvidia.com/zh-cn/cudnn
需要注册才能下载,选择对应的版本下载,示意图如下,本次选择v7.4
解压对应的tgz文件
tar zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz -C ./
然后将对应文件放在对应位置
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
查看cudnn版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

激活创建conda环境
conda create -n tensorflow python=3.6
source activate tensorflow #激活tensorflow环境
安装tensorflow
使用pip安装tensorflow
pip install tensorflow-gpu==1.15
安装完后,进入python环境,输入:import tensorflow
发现报错,报错非法指令 (核心已转储),
搜原因是高版本的使用AVX指令,服务器不支持AVE指令,方法:
1、降版本(1.6以下)
2、源码编译
3、conda安装
选择conda安装
先安装cuda版本(如果不进行这一步,可能因为cuda版本问题,无法安装tensorflow,报错)
conda install cudatoolkit=10.0
安装tensorflow
conda install tensorflow-gpu==1.15.0
验证
进入python环境
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
sess.run(hello)
版权声明:本文为qq_43056684原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。