ubuntu18.04安装cuda-10.0和cudnn-7.4.2

2023-05-16

安装cuda-10.0

1. gcc 版本

Ubuntu18.04默认gcc/g++ 7.3版本，如果安装cuda 9并不支持,gcc/g++7，所以先降级至6或6以下。我自己的gcc是7.5.0,安装过程没有报错，看来CUDA10是支持7.5.0的。

2.安装cuda依赖

sudo apt-get install freeglut3 freeglut3-dev libxi-dev libxmu-dev

3.在官网下载cuda“run”file

下载cuda10.0

4.cd到cuda10.0文件夹，运行 runfile

sudo sh cuda_10.0.130_410.48_linux.run

如果已经正确安装驱动，注意第二个问题选择"n"

You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.26?
(y)es/(n)o/(q)uit: n

Install the CUDA 10.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-10.0 ]:

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: n

Install the CUDA 10.0 Samples?
(y)es/(n)o/(q)uit: y

Enter CUDA Samples Location
 [ default is /home/kinghorn ]: /usr/local/cuda-9.2

5.安装 cuBLAS patch

sudo sh cuda_10.0.130.1_linux.run

6.配置环境

6.1 如果需要多版本cuda共存

这个方法可以让你切换不同的cuda环境，当你需要哪cuda环境时候激活即可。在某个路径中写个脚本，名为cuda10.0-env

export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDADIR=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64

激活环境

source cuda10.0-env

6.2只需要一个cuda环境，无需切换，直接在~/.bashrc

export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/64:$LD_LIBRARY_PATH

7.检查版本

nvcc -V

或者

cat /usr/local/cuda/version.txt

如果出现的版本信息没错，即安装成功。

cudnn7.4安装

1.解压文件

tar -zxvf cudnn-10.0-linux-x64-v7.4.2.24.tgz

2.在终端输入

sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64

 #修改权限
sudo chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*

3.检查cudnn版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Ubuntu18

CUDA

cuDNN

ubuntu18.04安装cuda-10.0和cudnn-7.4.2 的相关文章

使用非均匀节点优化 CUDA 内核插值

原问题我有以下内核使用非均匀节点执行插值我想对其进行优化 global void interpolation cufftDoubleComplex Uj double points cufftDoubleComplex result i
如何获取要执行的 PTX 文件

我知道如何生成 ptx文件来自 cu以及如何生成 cubin文件来自 ptx 但我不知道如何获得最终的可执行文件更具体地说我有一个sample cu文件编译为sample ptx 然后我使用 nvcc 来编译sample ptx to
nvcc fatal：安装 cuda 9.1+caffe+openCV 3.4.0 时不支持 gpu 架构“compute_20”

我已经安装了CUDA 9 1 cudnn 9 1 opencv 3 4 0 caffe 当我尝试跑步时make all j8 in caffe目录下出现这个错误 nvcc fatal 不支持的 GPU 架构 compute 20 我尝试过
无法从静态初始化代码启动 CUDA 内核

我有一个在其构造函数中调用内核的类如下所示标量场 h include
构建 Erlang 服务器场（用于业余爱好项目）最便宜的方法是什么？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案假设我们有一个本质上并行的问题需要用 Erlang 软件来解决我们有很多并行进程每个进程都执行顺序代码不是数字运算并且我们向它们投入的 C
Ubuntu 11.10/12.04 上的 CUDA“无兼容设备”错误

一段时间以来我一直在尝试在我的笔记本电脑上设置 Ubuntu 环境来进行 CUDA 编程我目前双启动 Windows 8 和 Ubuntu 12 04 并想在 Ubuntu 上安装 CUDA 5 该笔记本电脑配有 GeForce GT
是否可以在设备函数中调用cufft库调用？

我在主机代码中使用 cuFFT 库调用它们工作正常但我想从内核调用 cuFFT 库早期版本的 CUDA 没有这种支持但是有了动态并行性这可能吗如果有任何关于如何实现这一目标的示例那就太好了尽管在 Kepler cc 3 5
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
cudaMemcpyToSymbol 与 cudaMemcpy [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我试图找出
如何用Go语言的cgo编译Cuda源码？

我用 cuda c 编写了一个简单的程序它可以在 eclipse nsight 上运行这是源代码 include
在新线程中调用支持 CUDA 的库

我编写了一些代码并将其放入它自己的库中该库使用 CUDA 在 GPU 上进行一些处理我正在使用 Qt 构建 GUI 前端作为加载 GUI 的一部分我调用 CUresult res CUdevice dev CUcontext ctx
CUDA：如何在设备上填充动态大小的向量并将其内容返回到另一个设备函数？

我想知道哪种技术可以填充设备上的动态大小数组 int row 在下面的代码中然后返回其内容以供另一个设备函数使用为了将问题置于上下文中下面的代码尝试使用在 GPU 上运行的高斯勒让德求积来跨越勒让德多项式基组中的任意函数 incl
寻找 CUDA 中的最大值

我正在尝试在 CUDA 中编写代码来查找最大值对于给定的一组数字假设您有 20 个数字并且内核在 2 个块每块 5 个线程上运行现在假设 10 个线程同时比较前 10 个值并且thread 2找到最大值因此线程 2 正在更新
同时使用 2 个 GPU 调用 cudaMalloc 时性能较差

我有一个应用程序可以在用户系统上的 GPU 之间分配处理负载基本上每个 GPU 都有一个 CPU 线程来启动一个GPU处理间隔当由主应用程序线程定期触发时考虑以下图像使用 NVIDIA 的 CUDA 分析器工具生成作为示例GPU
CUDA 中的广义霍夫变换 - 如何加快分箱过程？

正如标题所示我正在对并行计算机视觉技术进行一些个人研究使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换我遇到的唯一问题是在投票过程中我调用atomicAdd 来防止多个同时写入操作但我似乎没有获得太多的性能效率我在网上搜索
如何并行从数组中删除零值

如何使用 CUDA 并行有效地从数组中删除零值有关零值数量的信息是预先可用的这应该可以简化这项任务重要的是数字必须保持源数组中的顺序当被复制到结果数组时 Example 该数组将例如包含以下值 0 0 19 7 0 3 5 0 0
Cuda 6.5 找不到 - libGLU。（在 ubuntu 14.04 64 位上）

我已经在我的ubuntu上安装了cuda 6 5 我的显卡是 GTX titan 当我想要制作 cuda 样本之一时模拟粒子我收到这条消息 gt gt gt WARNING libGLU so not found refer to C
cuda中内核的并行执行

可以说我有三个全局数组它们已使用 cudaMemcpy 复制到 GPU 中但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配以便分配页面锁定的内存而不是简单的全局分配 int a 100 b 100 c 100 cu
CUDA、NPP 滤波器

CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像但不断出现错误我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

这是一个关于编程的概念问题总而言之我有两个数组向量我需要对一个数组向量进行排序并将更改传播到另一个数组向量中这样如果我对 arrayOne 进行排序则对于排序中的每个交换 arrayTwo 也会发生同样的情况现在我知

随机推荐

使用jni-rs实现Rust与Android代码互相调用

本篇主要是介绍如何使用jni rs 有关jni rs内容基于版本0 20 0 xff0c 新版本写法有所不同入门用法在Rust库交叉编译以及在Android与iOS中使用中我简单说明了jni rs及demo代码 xff0c 现在接着补充
Android 13 变更及适配攻略

准备工作首先将我们项目中的 targetSdkVersion和compileSdkVersion 升至 33 影响Android 13上所有应用 1 通知受限对新安装的应用的影响 xff1a 如果用户在搭载 Android 13 或更高
洛谷 P1185 绘制二叉树

一道极为恐怖的模拟题 xff0c 以定义函数的方式确定每个点的x xff0c y就能轻松的做出这道题 xff0c 参考神犇题解洛谷 P1185 KH 39 s blog 洛谷博客遇到这种题估计就是放弃了 AC代码 xff08 抄的 xf
洛谷 P3366 【模板】最小生成树#Kruskal+并查集

说了最小生成树 xff0c 那么就用经典的Prim或者Kruskal xff0c 不过Prim实现代码有点多 xff0c 这里用Kruskal举例注意事项 1 Kruskal是用来找最小生成树的根据树的定义可以知道树是无向图所以Kr
STM32MP157AAA3裸机点灯(汇编)

STM32MP157AAA3裸机点灯汇编 MP157的A7核裸机点灯使用的开发板为华清远见的MP157开发板 xff0c 默认板内emmc已经烧写好了uboot 这篇就只记录一下汇编点灯过程 xff0c uboot等内容暂不涉及 xff
用tkinter写出you-get下载器界面，并用pyinstaller打包成exe文件

写在前面 xff1a 本文为笔者最早于 2019 05 11 23 15 以 64 拼命三郎的身份发表于博客园本文为原创文章 xff0c 转载请标明出处一 you get介绍 you get是一个基于 python3 的下载工具 xf
Linux网络协议栈4--bridge收发包

bridge 是linux上的虚拟交换机 xff0c 具有交换机的功能网卡收到包后 xff0c 走到 netif receive skb core后 xff0c 剥完vlan找到vlan子接口 xff08 如果有的话 xff09 xff0
linux redis启动时报错WARNING overcommit_memory is set to 0! Background save may fail under low memory con

报错 xff1a WARNING overcommit memory is set to 0 Background save may fail under low memory condition To fix this issue add
STM32编程语言介绍

STM32入门100步第8期编程语言介绍杜洋洋桃电子上一期我们在电脑上安装好了KEIL软件 xff0c 也新建了工程 xff0c 在工程中安装了固件库准备工作完成后 xff0c 接着就是在工程中编写程序了只有程序使ARM内核有
VMware虚拟机安装Linux教程(超详细)

写给读者为了帮助Linux系统初学者学习的小伙伴更好的学习 xff0c VMware虚拟机是不可避免的 xff0c 因此下载安装VMware和完成Linux的系统安装是非常必要的接下来 xff0c 我们就来系统的学习一下VMware虚
Markdown中的LaTeX公式——希腊字母详解

若要在Markdown中使用 xff0c 则在两个美元符号之间敲入对应LaTeX代码实现公式行显示效果 xff0c 若为公式块 xff0c 则要在四个美元符号中间敲入 xff0c 类似Markdown代码行和代码块共24个希腊字母 xff
FFmpeg学习（一）-- ffmpeg 播放器的基础

FFmpeg学习 xff08 一 xff09 FFmpeg学习 xff08 二 xff09 FFmpeg学习 xff08 三 xff09 FFmpeg的的是一套可以用来记录 xff0c 转换数字音频 xff0c 视频 xff0c 并能将其转
ios Instruments之Allocations

文章目录一 span class hljs function Allocations 监测内存分配 span 1 简介 2 如何使用一 Allocations 1 简介性能优化中使用Instruments Allocations工具进
linux-Centos-7-64位：4、 mysql安装

从最新版本的Linux系统开始 xff0c 默认的是 Mariadb而不是MySQL xff01 这里依旧以mysql为例进行展示 1 先检查系统是否装有mysql rpm qa span class hljs string style c
Win10 WSL忘记用户密码,重置密码

win10中WSL登录是不用密码的 xff0c 当需要使用用户权限但是忘记密码的时候 xff0c 可以使用如下办法以root身份登录WSL并重置密码 1 以管理员身份打开 PowerShell 2 输入命令 wsl exe user roo
51单片机定时时间的计算

单片机根据计时计数模式的不同 xff0c 来进行计算 M1 M0 工作模式说明 0 0 0 13位计时计数器 xff08 8192 xff09 0 1 1 16位计时计数器 xff08 65536 xff09 1 0 2 8位计时计数器
Go语言之禅

本文翻译自Go社区知名Gopher和博主Dave Cheney的文章 The Zen of Go 本文来自我在GopherCon Israel 2020上的演讲文章很长如果您希望阅读精简版 xff0c 请移步到the zen of go
UIScrollView及其子类停止滚动的监测

作为iOS中最重要的滑动控件 UIScrollView居然没有停止滚动的Delegate方法这有点蛋疼但是我们可以根据滚动状态来判断是否滚动 span class hljs preprocessor pragma mark scroll
PCL库中Marching Cubes（移动立方体）算法的解析

PCL库中Marching Cubes xff08 移动立方体 xff09 算法解析 1 Marching Cubes算法的原理这里不再赘述 xff0c 不懂的话 xff0c 提供一下文献资源 xff1a 链接 xff1a MARCHING
ubuntu18.04安装cuda-10.0和cudnn-7.4.2

安装cuda 10 0 1 gcc 版本 Ubuntu18 04默认gcc g 43 43 7 3版本 xff0c 如果安装cuda 9并不支持 gcc g 43 43 7 xff0c 所以先降级至6或6以下我自己的gcc是7 5 0 安