ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

2023-05-16

一、安装nvidia_driver

1、在软件和更新中选择一个可用的驱动

2.1首先我们需要添加源

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

2.2选择一个版本安装即可（如1，我选择安装510）

sudo apt install nvidia-driver-510

2.3 重启电脑后终端输入

nvidia-smi

查看驱动信息

二、安装CUDA

1、官网找到自己的版本（如2.3版本信息中，我510驱动对应的cuda_11.6）

CUDA Toolkit Archive | NVIDIA Developer 选择runfile格式的CUDA文件下载

2、选择环境，并根据官网步骤安装

3、下载完成后，解压，并运行上图中的命令，会有条款，接受即可。

3.1注意安装CUDA的时候不要安装驱动（因为在第一步我们已经安装过了）

3.2添加环境变量

sudo gedit ~/.bashrc

在打开的txt文件末尾加

export CUDA_HOME=/usr/local/cuda 
export PATH=$PATH:$CUDA_HOME/bin 
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存，退出。终端执行

source ~/.bashrc

3.3 验证cuda

3.3.1

11.6版本cuda的安装目录/usr/local/cuda-11.6/samples里只有一个txt文件，大致意思是告诉你新版本的cuda，samples中内容需要自己在github下载。

由于github下载过慢，在此放上gitee链接

git clone https://gitee.com/liwuhaoooo/cuda-samples.git

在samples文件夹下打开终端执行上述语句。

大概率无权访问，此时在cuda-11.6文件夹下打开终端

su
输入密码切换超级用户
chmod 777 samples

再次执行git clone 就可以了。

3.3.2

进入/usr/local/cuda-11.6/samples/cuda-samples/Samples

cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery

输出

则安装成功。

三、安装cuDNN

1、

进入NVIDIA cuDNN | NVIDIA Developer注册，并选择合适的版本下载（cuDNN Library for Linux），然后解压；

2、

并进入到/home/lwh/Downloads/cudnn-11.3-linux-x64-v8.2.1.32目录，运行以下命令：

sudo cp cuda/include/cudnn.h /usr/local/cuda-11.6/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.6/lib64
sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

若无权访问，像3.3.1一样，分别更改include和lib64文件夹权限。

四、验证GPU可用

import torch
print(torch.cuda.is_available())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Ubuntu18

NVIDIA

Driver

510 CUDA

ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x 的相关文章

CUDA：如何检查计算能力是否正确？

使用较高计算能力编译的 CUDA 代码将在计算能力较低的设备上完美执行很长一段时间然后有一天在某些内核中默默地失败我花了半天时间追寻一个难以捉摸的错误结果发现构建规则已经sm 21而该设备 Tesla C2050 是2 0 是否有任何
使用 CUDA __device__ 函数时出现链接器错误 2005 和 1169（多重定义的符号）（默认情况下应内联）

这个问题与以下问题有很大关系 A 如何将CUDA代码分成多个文件 https stackoverflow com questions 2090974 how to separate cuda code into multiple files
Golang调用CUDA库

我正在尝试从 Go 代码中调用 CUDA 函数我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
Nvidia Theano docker 镜像不可用

尝试运行 docker 命令 nvidia docker run d p 8888 8888 e PASSWORD 123abcChangeThis theano secure start notebook sh Then open you
当我有表面声明时，如何为 sm_1X 和 sm_2X 编译 CUDA 程序

我正在编写一个使用表面重新采样并写入纹理来提高性能的库 surface
CUDA 中的广义霍夫变换 - 如何加快分箱过程？

正如标题所示我正在对并行计算机视觉技术进行一些个人研究使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换我遇到的唯一问题是在投票过程中我调用atomicAdd 来防止多个同时写入操作但我似乎没有获得太多的性能效率我在网上搜索
如何优化这个 CUDA 内核

我已经分析了我的模型似乎该内核约占我总运行时间的 2 3 我一直在寻找优化它的建议代码如下 global void calcFlux double concs double fluxes double dt int idx blockI
CUDA Visual Studio 2010 Express 构建错误

我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程我花了一段时间来设置环境然后我刚刚编写了我的第一个程序 helloWorld cu 目前
CUDA 估计 2D 网格数据的每块线程数和块数

首先我要说的是我已经仔细阅读了所有类似的问题确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
Nvcc 的版本与 CUDA 不同

我安装了 cuda 7 但是当我点击 nvcc version 时它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
无法在 CUDA 中执行设备内核

我正在尝试在全局内核中调用设备内核我的全局内核是矩阵乘法我的设备内核正在查找乘积矩阵每列中的最大值和索引以下是代码 device void MaxFunction float Pd float max int x threadIdx
CUDA 常量内存是否应该被均匀地访问？

我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化如果是如何确保所有线程同时访问同一地址既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化是的这缓存本身每
在 __device/global__ CUDA 内核中动态分配内存

根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页可
使用 CUDA 进行逐元素向量乘法

我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量向量乘法内核代码插入如下 multiplyElementwise 它工作正常但由于我注意到其他看似简单的操作如缩放向量在 CUBLAS 或 CULA 等库中进行了
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
Alsa 带有来自调制解调器的 PCM 接口

我有一个基于 imx28 CPU 的定制板 CPU 的串行端口连接到调制解调器的 PCM 输出我必须为调制解调器的 PCM 接口开发一个驱动程序使其成为 ALSA SoC 的一部分您能指出内核树中与我的设置重新组合的一些驱动程序吗
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
cudaMemcpy() 与 cudaMemcpyFromSymbol()

我试图找出原因cudaMemcpyFromSymbol 存在似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分但这也可以使用 nonSymbo
如何在 GTX 560 及更高版本上使用 OpenGL 进行立体 3D？

我正在使用在 Windows 7 上运行的开源触觉和 3D 图形库 Chai3D 我重写了该库以使用 Nvidia nvision 执行立体 3D 我将 OpenGL 与 GLUT 一起使用并使用 glutInitDisplayMode

随机推荐

用51单片机IIC协议OLED显示汉字

接线如下 xff1a IIC协议 xff1a xff08 IIC全称Inter Integrated Circuit 集成电路总线 xff09 由PHILIPS公司在80年代开发的两线式串行总线 xff0c 用于连接微控制器及其外围设备 I
Linux中的open()、write()与read()函数，超详细

open xff08 xff09 函数 xff1a int open const char pathname int flags mode t mode 使用open函数需要的头文件 xff1a include lt sys types h
C语言结构体对齐，超详细，超易懂

结构体对齐规则结构体的第一个成员总是存放在结构体变量开辟的空间的起始地址其它成员变量要存储在一个名叫对齐数的整数倍的地址结构体总大小为最大对齐数的整数倍 xff0c 结构体内每一个变量都会产生一个对齐数 xff0c 取其最大的对齐数如果是
51单片机之串口通信、WiFi模块、蓝牙模块、4G模块

目录串口通信全双工通信 xff08 打电话 xff09 TTL电平 UART 字节帧串口相关的寄存器串口的工作模式蓝牙模块HC 08 HC 08的AT指令编辑 WiFi模块ESP8266 配置WiFi模块作为客户端连入当前局域网
STM32单片机之温湿度检测系统（DTH11、OLED、LCD1602）

LCD1602 LCD1602引脚第 1 脚 VSS 为电源地第 2 脚 VDD 接 5V 正电源第 3 脚 VL 为液晶显示器对比度调整端接正电源时对比度最弱 xff0c 接地时对比度最高 xff0c 对比度过高时会产生鬼影 x
C_records

1 include inlcude lt file h gt include file h lt gt 从编译器指定目录查找从当前目录查找 xff0c 未发现再从指定目录查找 2 enum enum TYPE A B C 注意内部 xff
STM32之智能小车，手把手从0到1，模块化编程

小车介绍本博文将会从0到1实现一个智能小车 xff0c 该小车实现功能 xff1a 1 摇头避障模式 2 跟随模式 3 循迹模式 4 小车测速并显示在OLED屏幕 5 语音控制小车等等硬件组成 STM32F103开发板小车套件 L91
STM32之增量式编码器电机测速

STM32之增量式编码器电机测速编码器编码器种类按监测原理分类光电编码器霍尔编码器按输出信号分类增量式编码器绝对式编码器编码器参数分辨率精度最大响应频率信号输出形式编码器倍频 STM32的编码器模式编码器模式编码器的计数方向仅在TI
STM32之MPU6050获取欧拉角

STM32之MPU6050获取欧拉角 MPU6050MPU6050特点MPU6050电路图以及框图MPU6050框图MPU6050电路图 MPU6050相关寄存器电源管理寄存器1 xff08 0x6B xff09 陀螺仪配置寄存器 xff0
Postman(接口测试工具)

目录一基本介绍 1 Postman 是什么 2 Postman 快速入门 2 1快速入门需求说明二 Postman 完成 Controller 层测试需要的代码 xff1a Java类 request jsp success jsp
QT网络编程TCP/UDP开发流程制作网络调试助手

目录标题一开发基础知识1 QT的网络编程 TCP和UDP2 网络编程接口1 listen2 connect 二 TCP编程1 TCP服务端实现流程2 TCP客户端实现流程三 UDP编程四源码1 TCP服务端2 TCP客户端3 UDP
Vscode 运行C++文件无法显示输出

一情况是 xff1a 运行简单的HelloWodld cpp程序能在终端显示结果 xff0c 如下 xff1a include lt iostream gt using namespace std int main cout lt lt
Jetson nx或其他aarch64 使用anaconda虚拟环境构建GPU版本的Pytorch cuda可用的前提下完整教程

一 Anaconda 下载安装包首先 xff0c 到anaconda官网下载安装包 xff0c 注意不是下载平常linux系统所用的安装包 xff0c 而是下载ARM架构的安装包 xff0c 若使用其他的版本会提示版本不符合无法安装安装
11-C语言对寄存器的封装

1 xff1a 仅通过指针进行封装 xff1a 编译可能出错 xff0c 这个地方只是表示思路在基地址基础上加上偏移地址 define GPIOF BASE 0x40021400 define GPIOF BASE 0x40021400
13-寄存器编写程序入门

与51单片机对比 xff0c 32单片机控制寄存器要复杂的多 xff1b 在51单片机中 xff0c 可以直接控制端口的高低电平 xff1b 然而32单片机却不可以 xff0c 因为32为了减小功耗 xff0c 默认情况下这些时钟都是关闭的
C++两个类头文件互相包含

在构造自己的类时 xff0c 有可能会碰到两个类之间的相互引用问题 xff0c 例如 xff1a 定义了类A类B xff0c A中使用了B定义的类型 xff0c B中也使用了A定义的类型 class A int i B b class B
【手拉手带你准备电赛】April Tag标记跟踪（3D定位）详解

目录关于April Tag April Tag介绍 April Tag分类 April Tag标记跟踪原理 April Tag标记跟踪代码分析 April Tag标记跟踪测试结果相关内容解惑梯度图像关于April Tag April
VS 无法打开源文件＜WinSock2.h＞＜stdio.h＞等

一重装SDK 1 在开始菜单栏打开 VS installer xff1b 在出现的页面中选择修改 2 修改SDK 注意左侧左侧红色方框中的内容不要点在右侧安装详细信息一栏找到使用C 43 43 桌面开发取消勾选已安装的SDK
error: #error PCL requires C++14 or above

运行带有PCL库的文件时报错 error PCL requires C 43 43 14 or above 解决办法 xff1a 找到工程里所有依赖于PCL的功能包 xff0c 改它们对应的CMakelists txt文件具体修改方法 x
ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

一安装nvidia driver 1 在软件和更新中选择一个可用的驱动 2 1首先我们需要添加源 sudo add apt repository ppa graphics drivers ppa sudo apt update 2 2

ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x 的相关文章

随机推荐

热门标签