tensorflow 配置

tensorflow 配置

1、查看选择tensorflow版本

https://tensorflow.google.cn/install/source
在这里插入图片描述
选择对应的tensorflow版本,确定对应的cuda和cudnn版本
比如选择tensorflow-gpu-1.15.0版本

2、查看cuda版本

输入cuda版本查看指令
nvcc -V
在这里插入图片描述

当版本不对时候,需要卸载并重新安装对应版本

cuda卸载指令

 # --purge选项会将配置文件、数据库等删除
 sudo apt-get autoremove --purge cuda

# 查看安装了哪些cuda相关的库,可以用以下指令
sudo dpkg -l |grep cuda

将版本卸载干净后,继续安装新版本,参考官方,比如cuda10.0

https://developer.nvidia.com/cuda-toolkit-archive

10.0的在线安装版本指令

sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

安装完成后,修改环境变量

$ sudo vim ~/.bashrc

输入如下指令(注意版本号要修改为自己当前版本,如下8.0需要更改)

export PATH="/usr/local/cuda-8.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-8.0/lib:$LD_LIBRARY_PATH"

输入如下指令是环境变量立即生效

$ source ~/.bashrc

利用nvcc -V指令来查看当前版本
注意可能需要重启使得显卡生效sudo reboot

3、安装对应的cudnn

https://developer.nvidia.com/zh-cn/cudnn
需要注册才能下载,选择对应的版本下载,示意图如下,本次选择v7.4
在这里插入图片描述
解压对应的tgz文件

tar zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz -C ./

然后将对应文件放在对应位置

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
 
sudo chmod a+r /usr/local/cuda/include/cudnn.h
 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

查看cudnn版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

在这里插入图片描述

激活创建conda环境

conda create -n tensorflow python=3.6
source activate tensorflow	 #激活tensorflow环境

安装tensorflow

使用pip安装tensorflow

pip install tensorflow-gpu==1.15

安装完后,进入python环境,输入:import tensorflow
发现报错,报错非法指令 (核心已转储),
搜原因是高版本的使用AVX指令,服务器不支持AVE指令,方法:
1、降版本(1.6以下)
2、源码编译
3、conda安装
选择conda安装
先安装cuda版本(如果不进行这一步,可能因为cuda版本问题,无法安装tensorflow,报错)

conda install cudatoolkit=10.0 

安装tensorflow

conda install tensorflow-gpu==1.15.0

验证

进入python环境

import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
sess.run(hello)

版权声明:本文为qq_43056684原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。