Ubuntu安装CUDA和CUDNN教程

2023-05-16

一、NVIDIA显卡驱动的安装

首先安装Linux系统的NVIDIA驱动，有两种方法，我们先说第一种方法

方法一：从官网上下载NVIDIA驱动程序进行安装

1.禁用nouveau驱动

nouveau，是一个自由及开放源代码显卡驱动程序，是为Nvidia的显示卡所编写，也可用于属于系统芯片的NVIDIA Tegra系列，此驱动程序是由一群独立的软件工程师所编写。但是nouveau开源驱动基本上是不能正常使用的，性能极低。

首先编辑文件 blacklist.conf：

sudo nano /etc/modprobe.d/blacklist.conf

移动光标，在最后一行添加以下代码：

blacklist nouveau
options nouveau modeset=0

然后ctrl + O保存文件

2.更新内核文件(注意备份文件)

注意备份文件，还需要注意自己系统的内核文件，不同版本的ubuntu不一样

sudo cp /boot/initrd.img-4.18.0-10-generic /boot/initrd.img-4.18.0-10-generic.bak

sudo update-initramfs -u

重启电脑

sudo shutdown -r now

3.进入BIOS设置，关闭Secure boot 设置

进入 Secure Boot Menu，将Secure Boot Control 设置为disabled

4.从NVIDIA官网下载对应的run文件

NVIDIA显卡驱动官网链接
比如说我的笔记本上的显卡是1060GTX，然后选择对应的显卡驱动软件
NVIDIA程序驱动下载图片
然后进行安装

sudo bash NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau-check -no-opengl-files

参数的含义如下：
-no-x-check：安装驱动时关闭X服务
-no-nouveau-check：安装驱动时禁用nouveau
-no-opengl-files：只安装驱动文件，不安装OpenGL文件
这样再reboot，就不会出现循环登录的问题。

方法二：使用ubuntu ppa源上的仓库软件安装驱动程序

首先禁用nouveau，然后更新内核文件，关闭Secure Boot设置，操作与上面一致。用ppa源上的仓库软件进行安装的不同之处在于下一步。
首先我们列举出可用显卡信息

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update #更新一下源
ubuntu-drivers devices

它会列举出显卡驱动的信息，选择你想要安装的显卡驱动信息，例如安装以下显卡驱动信息：

sudo apt-get install nvidia-driver-418

或者安装对于ubuntu系统的显卡驱动，自动安装驱动程序：

sudo ubuntu-drivers autoinstall

重启电脑，即可以安装成功

检查NVIDIA显卡驱动程序是否安装成功

启动nvidia-settings 进行查看

启动nvidia-smi检查驱动程序是否安装成功

二、CUDA安装方法

1.GCC降级安装

因为编译cuda程序需要GCC版本低一点的编译器，否则会有以下的一些错误：

Error: unsupported compiler: 8.2.0. Use --override to override this check.

所以我们这里使用GCC4.8版本的编译器

sudo apt-get install gcc-4.8
sudo apt-get install g++-4.8

查看是否安装成功

cd /usr/bin
ls -l gcc*
ls -l g++*

在ubuntu19.04系统上，链接在对应系统的gcc-8版本，其他系统可能会在比gcc-4.8版本更高的版本上，所以需要改为链接到gcc-4.8上：

sudo mv gcc gcc.bak
sudo ln -s gcc-4.8 gcc
sudo mv g++ g++.bak
sudo ln -s g++-4.8 g++

查看版本号

gcc -v
g++ -v

2.安装CUDA

下载CUDA run文件，CUDA下载链接，

选择对应的文件进行下载

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo bash cuda_10.2.89_440.33.01_linux.run

注意！！！！安装时候会提示安装它提示安装的显卡驱动，一定要选择no，否则会出现显卡驱动冲突，无法进入桌面环境。
若在安装过程中缺少一些库文件，例如libGL.so等等文件，可能会出现有些库文件出错，如下错误：

Missing recommended library: libGLU.so
Missing recommended library: libX11.so
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
Missing recommended library: libGL.so

无法安装cuda，解决方法如下，安装对应的库文件：

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev libgles2-mesa-dev

配置CUDA对应的环境变量，编辑文件bashrc

nano ~/.bashrc

并添加以下内容

export PATH=/usr/local/cuda-10.0/bin${PATH:+:$PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

使得文件生效

source ~/.bashrc

查看cuda 是否安装成功以及是否添加到环境变量当中

nvcc -V

3.安装cudnn

官网下载cudnn文件，并解压，注意对应版本的cuda的cudnn，这里是cuda10.0对应的文件

tar -xzvf cudnn-10.0-linux-x64-v7.4.1.5.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

查看cuda是否安装成功以及是否添加到环境变量当中，cudnn是否安装成功

cat  /usr/local/cuda/version.txt
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

至此，CUDA即可安装到系统当中。
在使用过程中会出现一下的问题：

/sbin/ldconfig.real: /usr/local/cuda-10.2/targets/x86_64-linux/lib/libcudnn.so.7 is not a symbolic link

首先打开libcudnn.so.7所在的目录.

cd cd /usr/local/cuda-9.0/lib64/

这里会发现发现libcudnn.so.7 和libcudnn.so.7.6.5 两个文件，但理论上只有一个libcudnn.so.7.6.5.

解决方法是创建一个软连接方式：

sudo mv libcudnn.so.7 libcudnn.so.7.bak
sudo ln -sf /usr/local/cuda-10.2/lib64/libcudnn.so.7.6.5 /usr/local/cuda-10.2/lib64/libcudnn.so.7
sudo ldconfig #更新软件源

遇到的问题

在安装CUDNN的时候会遇到cudnn_version.h找不到的情况，这需要在第3小结修改以下的复制命令

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include

这样就会有对应的文件了。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)