LINUX系统下:Cuda+Cudnn+Tensorflow-GPU环境配置学习总结

2023-11-06

1.cuda+cudnn安装

1.1下载cuda

1.1.1查看系统支持的cuda版本(可以安装低于该版本的,不能超过该版本)

nvidia-smi

1.1.2下载cuda

cuda历史版下载

1.2.3安装

1.找到下载的cuda文件所在的文件夹,运行下面命令安装文件

sudo sh cuda_版本号_linux.run

2.安装完成后配置环境变量

sudo vim ~/.bashrc

#输入i,修改环境变量配置
#在末尾添加环境变量
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

#按住Esc推出编辑,:,保存输入:wq,不保存:q

# 更新环境变量配置
source ~/.bashrc

3.查看是否安装成功

nvcc -V

4.显示版本号安装成功

1.2下载cudnn

1.2.1下载与cuda相对应的版本的cudnn

x​​​​cudnn历史版下载

1.2.2切换到下载文件所在目录,解压该文件

tar -xzvf cudnn-版本号-linux-x64-版本号.tgz

解压完后在该路径下,执行

#将cuda/include/cudnn.h文件复制到usr/local/cuda/include文件夹
sudo cp include/cudnn.h /usr/local/cuda/include/  
#将cuda/lib64/下所有文件复制到/usr/local/cuda/lib64文件夹中
sudo cp lib64/libcudnn* /usr/local/cuda/lib64/
#并添加读取权限
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

在该路径下查看是否有cudnn文件,查看cudnn.h文件里面cudnn版本好和你安装是否一致,一致则安装成功,未成功可以在操作一次

#路径:/usr/local/cuda/include/cudnn.h
#打开文件下拉查看下面的符号,下面组合起来就是版本号
#define CUDNN_MAJOR 7
#define CUDNN_MINOR 6
#define CUDNN_PATCHLEVEL 5

 2.Anconda下虚拟环境创建和tensorflow-gpu安装

2.1Anoconda下创建虚拟环境

2.1.1创建虚拟环境

#conda create -n 环境名字(自己命名) 环境版本名字(慎重选择,最好是该系统已有python版本)
conda create -n TensorFlow_2.4 python=3.7
#查看已经创建的所有环境
conda env list
#删除不想要的虚拟环境 conda remove -n 环境名字 --all
conda remove -n TensorFlow_2.4 --all
#如果运行还存在,尝试运行sudo -s 切换用户从$-># 再执行该命令

激活创建的虚拟环境,才能把之后的要安装的包,安装在自己创建的虚拟环境中

#激活虚拟环境conda activate 环境名称
conda activate TensorFlow_2.4
#退出虚拟环境
source deactivate

 2.1安装tensorflow-gpu

2.1.1查找该系统下可以安装的tensorflow-gpu版本

conda search tensorflow-gpu

找到自己想安装的版本执行

#pip install tensorflow-gpu==选择版本号,没有版本号要求直接执行conda install tensorflow-gpu
conda install tensorflow-gpu==2.3.0 

3.tensorflow-gpu对应的python,cuda和cudnn选择

tensorflow-gpu对应python,cuda,cudnn版本查看链接

 

4.安装多个cuda版本

4.1配置.bashrc

#通过修改软连接的方式切换cuda版本
#环境配置写成,注意不要加cuda的版本号

#export PATH=$PATH:/usr/local/cuda/bin
#export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
#export CUDA_HOME=$CUDA_HOME:/usr/local/cuda

4.2.如果.bashrc中使用的软连接方式,切换版本的步骤如下

#进入到安装cuda所在的目录,淡蓝色的cuda文件夹就是软连接,在文件管理器中查看的话,图标有一个黑色箭头

# cd /usr/local

#删除原有的cuda软链接
#为了方便下次再次使用该版本的软连接,我一般是备份当前软连接,102表示这是cuda10.2的软连接备份

# sudo mv cuda cuda102

#建立新的软连接

# sudo ln -s /usr/local/cuda-9.2 /usr/local/cuda

#使用哪个版本则需改为
sudo mv cuda100 cuda

#测试是否成功
nvcc -V

注意:第一次使用某个版本的cuda时都需要经过创建新软连接文件的步骤,后续更改时,相当于将对应版本软连接的备份更名成cuda即可。无需频繁操作.bashrc文件,毕竟配置文件一不小心搞乱了,就麻烦了。

参考链接:多版本cuda安装及灵活切换详细教程_Fzc_PCL的博客-CSDN博客_安装多版本cuda

4.3卸载不要的CUDA版本

1.使用cuda自带的卸载工具进行卸载。
cd /usr/local/cuda/bin 
#在该路径下找到带uninstall_cuda文件运行以下两种卸载文件
sudo ./cuda-uninstaller
sudo ./uninstall_cuda_9.0.pl
2.使用命令卸载具体版本,可以加版本号
sudo apt-get remove cuda
sudo apt autoremove
sudo apt-get remove cuda*
#然后切换到CUDA所在目录
cd /usr/local/
sudo rm -r cuda-11.0

 5.下载安装包慢切换镜像源

conda更改镜像源
添加国内源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --set show_channel_urls yes
换回默认源:
conda config --remove-key channels

在pycharm中可能出现无法下载其他包的情况,可以试试把镜像源换回来能不能解决

其他镜像源链接汇总

中科大镜像:https://pypi.mirrors.ustc.edu.cn/simple

豆瓣镜像:http://pypi.douban.com/simple/

阿里镜像:https://mirrors.aliyun.com/pypi/simple/

百度镜像:https://mirror.baidu.com/pypi/simple

 上面参考了很多人文章和自己这两天遇见的坑,供以后学习参考

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

LINUX系统下:Cuda+Cudnn+Tensorflow-GPU环境配置学习总结 的相关文章

随机推荐