ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

2023-05-16

一、安装nvidia_driver

1、在  软件和更新  中选择一个可用的驱动

2.1首先我们需要添加源

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

2.2选择一个版本安装即可(如1,我选择安装510)

sudo apt install nvidia-driver-510

2.3 重启电脑后终端输入

nvidia-smi

查看驱动信息

二、安装CUDA

1、官网找到自己的版本(如2.3版本信息中,我510驱动对应的cuda_11.6)

CUDA Toolkit Archive | NVIDIA Developer    选择runfile格式的CUDA文件下载

2、选择环境,并根据官网步骤安装

3、下载完成后,解压,并运行上图中的命令,会有条款,接受即可。

3.1注意安装CUDA的时候不要安装驱动(因为在第一步我们已经安装过了)

3.2添加环境变量

sudo gedit ~/.bashrc

 在打开的txt文件末尾加

export CUDA_HOME=/usr/local/cuda 
export PATH=$PATH:$CUDA_HOME/bin 
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存,退出。终端执行

source ~/.bashrc

3.3  验证cuda

3.3.1    

11.6版本cuda的安装目录/usr/local/cuda-11.6/samples里只有一个txt文件,大致意思是告诉你新版本的cuda,samples中内容需要自己在github下载。

由于github下载过慢,在此放上gitee链接

git clone https://gitee.com/liwuhaoooo/cuda-samples.git

在samples文件夹下打开终端执行上述语句。

大概率无权访问,此时在cuda-11.6文件夹下打开终端

su
输入密码切换超级用户
chmod 777 samples

再次执行git clone 就可以了。

3.3.2

进入/usr/local/cuda-11.6/samples/cuda-samples/Samples

cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery

输出

则安装成功。

三、安装cuDNN

1、

进入NVIDIA cuDNN | NVIDIA Developer注册,并选择合适的版本下载(cuDNN Library for Linux),然后解压;

2、

并进入到/home/lwh/Downloads/cudnn-11.3-linux-x64-v8.2.1.32目录,运行以下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda-11.6/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.6/lib64
sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

若无权访问,像3.3.1一样,分别更改include和lib64文件夹权限。

四、验证GPU可用

import torch
print(torch.cuda.is_available())

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x 的相关文章

  • CUDA:如何检查计算能力是否正确?

    使用较高计算能力编译的 CUDA 代码将在计算能力较低的设备上完美执行很长一段时间 然后有一天在某些内核中默默地失败 我花了半天时间追寻一个难以捉摸的错误 结果发现构建规则已经sm 21而该设备 Tesla C2050 是2 0 是否有任何
  • 使用 CUDA __device__ 函数时出现链接器错误 2005 和 1169(多重定义的符号)(默认情况下应内联)

    这个问题与以下问题有很大关系 A 如何将CUDA代码分成多个文件 https stackoverflow com questions 2090974 how to separate cuda code into multiple files
  • Golang调用CUDA库

    我正在尝试从 Go 代码中调用 CUDA 函数 我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
  • 如何将CUDA时钟周期转换为毫秒?

    我想用一些代码来测量时间within我的内核需要 我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
  • Nvidia Theano docker 镜像不可用

    尝试运行 docker 命令 nvidia docker run d p 8888 8888 e PASSWORD 123abcChangeThis theano secure start notebook sh Then open you
  • 当我有表面声明时,如何为 sm_1X 和 sm_2X 编译 CUDA 程序

    我正在编写一个使用表面 重新采样并写入纹理 来提高性能的库 surface
  • CUDA 中的广义霍夫变换 - 如何加快分箱过程?

    正如标题所示 我正在对并行计算机视觉技术进行一些个人研究 使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换 我遇到的唯一问题是在投票过程中 我调用atomicAdd 来防止多个同时写入操作 但我似乎没有获得太多的性能效率 我在网上搜索
  • 如何优化这个 CUDA 内核

    我已经分析了我的模型 似乎该内核约占我总运行时间的 2 3 我一直在寻找优化它的建议 代码如下 global void calcFlux double concs double fluxes double dt int idx blockI
  • CUDA Visual Studio 2010 Express 构建错误

    我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程 我花了一段时间来设置环境 然后我刚刚编写了我的第一个程序 helloWorld cu 目前
  • CUDA 估计 2D 网格数据的每块线程数和块数

    首先我要说的是 我已经仔细阅读了所有类似的问题 确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
  • Nvcc 的版本与 CUDA 不同

    我安装了 cuda 7 但是当我点击 nvcc version 时 它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库 但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
  • 无法在 CUDA 中执行设备内核

    我正在尝试在全局内核中调用设备内核 我的全局内核是矩阵乘法 我的设备内核正在查找乘积矩阵每列中的最大值和索引 以下是代码 device void MaxFunction float Pd float max int x threadIdx
  • CUDA 常量内存是否应该被均匀地访问?

    我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存 我是否需要担心每个线程访问相同的地址以进行优化 如果是 如何确保所有线程同时访问同一地址 既然它都会被缓存 我是否需要担心每个线程访问相同的地址以进行优化 是的 这缓存本身每
  • 在 __device/global__ CUDA 内核中动态分配内存

    根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页 可
  • 使用 CUDA 进行逐元素向量乘法

    我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量 向量乘法 内核代码插入如下 multiplyElementwise 它工作正常 但由于我注意到其他看似简单的操作 如缩放向量 在 CUBLAS 或 CULA 等库中进行了
  • 有没有一种有效的方法来优化我的序列化代码?

    这个问题缺乏细节 因此 我决定创建另一个问题而不是编辑这个问题 新问题在这里 我可以并行化我的代码吗 还是不值得 https stackoverflow com questions 17937438 can i parallelize my
  • Alsa 带有来自调制解调器的 PCM 接口

    我有一个基于 imx28 CPU 的定制板 CPU 的串行端口连接到调制解调器的 PCM 输出 我必须为调制解调器的 PCM 接口开发一个驱动程序 使其成为 ALSA SoC 的一部分 您能指出内核树 中与我的设置重新组合的一些驱动程序吗
  • CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

    与 CUDA 的任何事情一样 最基本的事情有时也是最难的 所以 我只想将变量从 CPU 复制到 GPUconstant变量 我很难过 这就是我所拥有的 constant int contadorlinhasx d int main int
  • cudaMemcpy() 与 cudaMemcpyFromSymbol()

    我试图找出原因cudaMemcpyFromSymbol 存在 似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分 但这也可以使用 nonSymbo
  • 如何在 GTX 560 及更高版本上使用 OpenGL 进行立体 3D?

    我正在使用在 Windows 7 上运行的开源触觉和 3D 图形库 Chai3D 我重写了该库以使用 Nvidia nvision 执行立体 3D 我将 OpenGL 与 GLUT 一起使用 并使用 glutInitDisplayMode

随机推荐

  • 用51单片机IIC协议OLED显示汉字

    接线如下 xff1a IIC协议 xff1a xff08 IIC全称Inter Integrated Circuit 集成电路总线 xff09 由PHILIPS公司在80年代开发的两线式串行总线 xff0c 用于连接微控制器及其外围设备 I
  • Linux中的open()、write()与read()函数,超详细

    open xff08 xff09 函数 xff1a int open const char pathname int flags mode t mode 使用open函数需要的头文件 xff1a include lt sys types h
  • C语言结构体对齐,超详细,超易懂

    结构体对齐规则 结构体的第一个成员总是存放在结构体变量开辟的空间的起始地址其它成员变量要存储在一个名叫对齐数的整数倍的地址结构体总大小为最大对齐数的整数倍 xff0c 结构体内每一个变量都会产生一个对齐数 xff0c 取其最大的对齐数如果是
  • 51单片机之串口通信、WiFi模块、蓝牙模块、4G模块

    目录 串口通信 全双工通信 xff08 打电话 xff09 TTL电平 UART 字节帧 串口相关的寄存器 串口的工作模式 蓝牙模块HC 08 HC 08的AT指令 编辑 WiFi模块ESP8266 配置WiFi模块作为客户端连入当前局域网
  • STM32单片机之温湿度检测系统(DTH11、OLED、LCD1602)

    LCD1602 LCD1602引脚 第 1 脚 VSS 为电源地 第 2 脚 VDD 接 5V 正电源 第 3 脚 VL 为液晶显示器对比度调整端 接正电源时对比度最弱 xff0c 接地时对比度最高 xff0c 对比度过高时会产生 鬼影 x
  • C_records

    1 include inlcude lt file h gt include file h lt gt 从编译器指定目录查找 从当前目录查找 xff0c 未发现再从指定目录查找 2 enum enum TYPE A B C 注意内部 xff
  • STM32之智能小车,手把手从0到1,模块化编程

    小车介绍 本博文将会从0到1实现一个智能小车 xff0c 该小车实现功能 xff1a 1 摇头避障模式 2 跟随模式 3 循迹模式 4 小车测速并显示在OLED屏幕 5 语音控制小车等等 硬件组成 STM32F103开发板 小车套件 L91
  • STM32之增量式编码器电机测速

    STM32之增量式编码器电机测速 编码器编码器种类按监测原理分类光电编码器霍尔编码器 按输出信号分类增量式编码器绝对式编码器 编码器参数分辨率精度最大响应频率信号输出形式 编码器倍频 STM32的编码器模式编码器模式编码器的计数方向仅在TI
  • STM32之MPU6050获取欧拉角

    STM32之MPU6050获取欧拉角 MPU6050MPU6050特点MPU6050电路图以及框图MPU6050框图MPU6050电路图 MPU6050相关寄存器电源管理寄存器1 xff08 0x6B xff09 陀螺仪配置寄存器 xff0
  • Postman(接口测试工具)

    目录 一 基本介绍 1 Postman 是什么 2 Postman 快速入门 2 1快速入门需求说明 二 Postman 完成 Controller 层测试 需要的代码 xff1a Java类 request jsp success jsp
  • QT网络编程TCP/UDP开发流程 制作网络调试助手

    目录标题 一 开发基础知识1 QT的网络编程 TCP和UDP2 网络编程接口1 listen2 connect 二 TCP编程1 TCP服务端实现流程2 TCP客户端实现流程 三 UDP编程四 源码1 TCP服务端2 TCP客户端3 UDP
  • Vscode 运行C++文件无法显示输出

    一 情况是 xff1a 运行简单的HelloWodld cpp程序能在终端显示结果 xff0c 如下 xff1a include lt iostream gt using namespace std int main cout lt lt
  • Jetson nx或其他aarch64 使用anaconda虚拟环境构建GPU版本的Pytorch cuda可用的前提下完整教程

    一 Anaconda 下载安装包 首先 xff0c 到anaconda官网下载安装包 xff0c 注意不是下载平常linux系统所用的安装包 xff0c 而是下载ARM架构的安装包 xff0c 若使用其他的版本会提示版本不符合无法安装 安装
  • 11-C语言对寄存器的封装

    1 xff1a 仅通过指针进行封装 xff1a 编译可能出错 xff0c 这个地方只是表示思路 在基地址基础上加上偏移地址 define GPIOF BASE 0x40021400 define GPIOF BASE 0x40021400
  • 13-寄存器编写程序入门

    与51单片机对比 xff0c 32单片机控制寄存器要复杂的多 xff1b 在51单片机中 xff0c 可以直接控制端口的高低电平 xff1b 然而32单片机却不可以 xff0c 因为32为了减小功耗 xff0c 默认情况下这些时钟都是关闭的
  • C++两个类头文件互相包含

    在构造自己的类时 xff0c 有可能会碰到两个类之间的相互引用问题 xff0c 例如 xff1a 定义了类A类B xff0c A中使用了B定义的类型 xff0c B中也使用了A定义的类型 class A int i B b class B
  • 【手拉手 带你准备电赛】April Tag标记跟踪(3D定位)详解

    目录 关于April Tag April Tag介绍 April Tag分类 April Tag标记跟踪原理 April Tag标记跟踪代码分析 April Tag标记跟踪测试结果 相关内容解惑 梯度图像 关于April Tag April
  • VS 无法打开源文件<WinSock2.h> <stdio.h> 等

    一 重装SDK 1 在开始菜单栏打开 VS installer xff1b 在出现的页面中选择 修改 2 修改SDK 注意左侧左侧红色方框中的内容不要点 在右侧 安装详细信息 一栏找到 使用C 43 43 桌面开发 取消勾选已安装的SDK
  • error: #error PCL requires C++14 or above

    运行带有PCL库的文件时报错 error PCL requires C 43 43 14 or above 解决办法 xff1a 找到工程里所有依赖于PCL的功能包 xff0c 改它们对应的CMakelists txt文件 具体修改方法 x
  • ubuntu18.04安装nvidia_driver_510+cuda_11.6+cudnn_11.x

    一 安装nvidia driver 1 在 软件和更新 中选择一个可用的驱动 2 1首先我们需要添加源 sudo add apt repository ppa graphics drivers ppa sudo apt update 2 2