ubuntu16.04 安装CUDA8.0,cudnn5.1v

2023-11-01

安装cuda8.0之前安装好nvidia的显卡驱动，下载好cuda8.0版本的，网址：https://developer.nvidia.com/cuda-80-ga2-download-archive.
这里写图片描述

1.1
安装命令：

sudo dpkg -i cuda-repo-ubuntu1604-8-0-rc_8.0.27-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda#出现问题手敲

1.2
可降级可不降级，根据情况而定：
ubuntu的gcc编译器是5.4.0，然而cuda8.0不支持5.0以上的编译器，因此需要降级，把编译器版本降到4.9：

在terminal中执行：

sudo apt-get install gcc-4.9 gcc-5 g++-4.9 g++-5

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10

sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30

sudo update-alternatives --set cc /usr/bin/gcc

sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30

sudo update-alternatives --set c++ /usr/bin/g++

1.3添加环境变量

执行命令:

sudo gedit /etc/profile

添加内容如下：

PATH=/usr/local/cuda-8.0/bin:$PATH   
export PATH  
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:/lib

保存并退出
然后使之立刻生效
执行命令：

source /etc/profile

1.4添加lib库路径
执行命令：

sudo gedit /etc/ld.so.conf.d/cuda.conf

添加如下内容：

/usr/local/cuda-8.0/lib64

保存并退出
然后使之立刻生效
执行命令：

sudo ldconfig

1.5验证安装:先重启
执行命令：

nvcc -V

2接下来是安装cudnn:
首先在https://developer.nvidia.com/cudnn官网上下载（注意版本，必须是5.1）
2.1解压：

tar zxvf cudnn-8.0-linux-x64-v5.1.tgz

2.2然后执行

cd cuda  
sudo cp lib64/lib* /usr/local/cuda/lib64/  
sudo cp include/cudnn.h /usr/local/cuda/include/

2.3会出现cuda这个文件夹，更新链接。

cd /usr/local/cuda/lib64/  
sudo rm -rf libcudnn.so libcudnn.so.5  
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5  
sudo ln -s libcudnn.so.5 libcudnn.so

3-cuda8.0和cudnn5.1V就装好了，然后就是安装pyenv和pyenv install anaconda2/3,再pip install tensorflow/pytorch等等.参考我的其他博客。

借鉴：https://www.cnblogs.com/xujianqing/p/6142963.html
http://blog.csdn.net/binglel/article/details/70230276

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

环境搭建

CUDA

ubuntu16.04 安装CUDA8.0,cudnn5.1v 的相关文章

无法从静态初始化代码启动 CUDA 内核

我有一个在其构造函数中调用内核的类如下所示标量场 h include
如何在 gitlab-ci docker 执行器中使用 cuda

我们正在使用 gitlab 持续集成来构建和测试我们的项目最近其中一个项目添加了 CUDA 的要求以启用 GPU 加速我不想改变我们的管道 docker 和 gitlab ci 对我们来说运行良好所以我想以某种方式让 docker
为什么GK110有192个核心和4个扭曲？

我想感受一下开普勒的架构但这对我来说没有意义如果一个 warp 有 32 个线程其中 4 个被调度执行则意味着 128 个核心正在使用 64 个核心处于空闲状态白皮书中提到了独立指令那么64核是为这些指令保留的吗如果是这样
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
cudaMemcpyToSymbol 的问题

我正在尝试复制到恒定内存但我不能因为我对 cudaMemcpyToSymbol 函数的用法有误解我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
“计算能力”是什么意思？ CUDA？

我是CUDA编程新手对此了解不多您能告诉我 CUDA 计算能力是什么意思吗当我在大学服务器上使用以下代码时它向我显示了以下结果 for device 0 device lt deviceCount device cudaDevic
CUDA 中的广义霍夫变换 - 如何加快分箱过程？

正如标题所示我正在对并行计算机视觉技术进行一些个人研究使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换我遇到的唯一问题是在投票过程中我调用atomicAdd 来防止多个同时写入操作但我似乎没有获得太多的性能效率我在网上搜索
如何确定完整的 CUDA 版本 + 颠覆版本？

Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用但是从 CUDA 11 1 开始该文件不再存在我如何在 Linux 上通过命令行确定并检查 path t
运行时 API 应用程序中的 cuda 上下文创建和资源关联

我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联我知道这是由驱动程序 API 在幕后完成的但我想了解一下创作的时间线首先我知道 cudaRegisterFatBinary 是第一个 cuda a
如何在 CUDA 中执行多个矩阵乘法？

我有一个方阵数组int M 10 以便M i 定位第一个元素i th 矩阵我想将所有矩阵相乘M i 通过另一个矩阵N 这样我就收到了方阵数组int P 10 作为输出我看到有不同的可能性分配不同元素的计算M i 到不同的线程例如我
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
如何在cmake中添加cuda源代码的定义

我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译例如 CMakeLists txt project Test add definitions D WINDOW
在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗？

CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
TensorRT 多线程

我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它其中 Cuda 上下文与所有线程一起使用在单个线程中一切正常我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
从 CUDA 设备写入输出文件

我是 CUDA 编程的新手正在将 C 代码重写为并行 CUDA 新代码有没有一种方法可以直接从设备写入输出数据文件而无需将数组从设备复制到主机我假设如果cuPrintf存在一定有地方可以写一个cuFprintf 抱歉如果答案已经
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

这是一个关于编程的概念问题总而言之我有两个数组向量我需要对一个数组向量进行排序并将更改传播到另一个数组向量中这样如果我对 arrayOne 进行排序则对于排序中的每个交换 arrayTwo 也会发生同样的情况现在我知
如何为 CUDA 内核选择网格和块尺寸？

这是一个关于如何确定CUDA网格块和线程大小的问题这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段见下文我
无法在内存位置找到异常源：cudaError_enum

我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I

随机推荐

C++：vector中的resize()函数 VS reserve()函数

写代码的时候无意错用了这两个函数导致测试的时候程序运行崩溃发现这两个函数还是有区别的 void reserve size type n reserver函数用来给vector预分配存储区大小即capacity的值但是没有给这段内存
三款开源工具让你的演示脱颖而出

本文转载至 http blog callmewhy com 2014 07 02 three open source tools to make your presentations pop 不论是在商业圈还是在学术界演示都是生活中不可或
共享内存设计原理-shm

POSIX的shm open 在 dev shm 下打开一个文件用mmap 映射到进程自己的内存地址 System V的shmget 得到一个共享内存对象的id 用shmat 映射到进程自己的内存地址目前这里主要看 System V的设
VS无法打开源文件 "xxx.h" 问题

项目属性 gt 配置属性 gt C C gt 常规 gt 附加包含目录 gt ProjectDir 即可
Qt QFrame

QFrame类是带有边框部件的基类 lineWidth调整边框边界线的宽度 midLineWidth是在边框中插入一条线的宽度用于营造3D效果此效果只有在Box HlineVline凸起或者凹陷时有效 QFrame NoFrame 不绘
【手拉手带你准备电赛】解答小课堂——为什么要使能时钟

大家在代码编写过程中也发现了当我们涉及到外设时总是需要使能其对应的时钟那么为什么要使能时钟呢直接用不是更简单确实直接使用IO 代码量可以小那么一丢丢你可能会说代码量算什么这是老师少考我们一个考点是我们可能不挂科的问题手
Java数组排序：Java sort()方法

在 Java 中实现数组排序的方式很多除了利用 Arrays 类的 sort 方法外还可以编写自定义方法来实现自己的排序算法本文介绍如何使用 Arrays 类提供的 sort 方法来对数组进行排序使用 java util Array
一款基于Latex语法和MathJax渲染的零基础公式编辑器，数学公式插件

零基础即可编辑公式支持自定义编辑器配置和风格支持二次编辑公式支持作为插件和富文本编辑器一起使用介绍基于Latex语法和MathJax渲染的公式编辑器插件易用可二次编辑内容可视化标题为什么会开发该插件之前调研过很多开源的公
log4j2配置参数详解

1 概述 JAVA常用的日志收集api和实现框架都有多种不同的api和实现框架之间怎么相互兼容都比较复杂不过大部分的日志框架实现也都提供了对其他日志收集方式的兼容和切换可以参考slf4j jcl jul log4j1 log4j2 l
CentOS 8:Cannot prepare internal mirrorlist: No URLs in mirrorlist

问题在Centos 8上因为要安装mysql5 7 需要使用yum命令但执行yum命令时报错 No URLs in mirrorlist 经查阅资料后发现从2022年1月31日起 CentOS开发团队将会移除官方镜像源上关于CentO
Linq按日期年月日分组

var body db tbl worklist AsQueryable WorkOrderHomePageResponse model new WorkOrderHomePageResponse DateTime startDate Da
element-UI表格table实现表格行的动态合并

本文主要举个项目中真实实例方便各位跟我一样在实际项目开发中碰到的需求功能的开发可直接拿来使用的饿了么table组件官方实例 http element cn eleme io zh CN component table 在实际开发过程中
IDEA导入Eclipse项目

在学习编程中经常需要导入其他项目这些项目中通常包含由Eclipse编写的项目对于经常使用IDEA开发而不熟悉Eclipse的程序员往往是比较头疼的所以将自己导入项目的经验总结出来供大家学习参考编译器版本 IntelliJ ID
HJ2 计算某字母出现次数（Java）

假期在刷牛客网上的真题此题源自华为机试题库文章目的在于记录学习心得如有错误欢迎指正原题如下描述写出一个程序接受一个由字母数字和空格组成的字符串和一个字母然后输出输入字符串中该字母的出现次数不区分大小写字符串长度小于5
6.830 / 6.814: Syllabus 2021 - MIT Lab 1 - SimpleDB

文章目录 1 参考链接 2 SimpleDB Architecture and Implementation Guide 2 2Fields and Tuples 2 3Catalog 2 4BufferPool 2 5HeapFile a
零基础如何快速入门学python？python全套学习路线总结

前言学习任何一门语言都是从入门 1年左右通过不间断练习达到熟练水准 3到5年少数人最终能精通语言成为执牛耳者他们是金字塔的最顶层虽然万事开头难但好的开始是成功的一半今天这篇文章就来谈谈如何开始入门Python 只要方向对了
HTML +CSS制作QQ登录页面

用a link color FF0000 未访问的链接 a visited color 00FF00 已访问的链接 a hover color FF00FF 鼠标移动到链接上 a active color 0000FF 超链接为了方便一直
免费Midjourney来袭

发现一个镜像站和之前发的镜像站不一样这个集成了midjourney和chatgpt 且免翻相信给很多很多用户都提供了便利吧先把网站贴出来有兴趣的伙伴可以玩一玩关于以图生图现在网站支持本地上传图片啦非常方便可以生成同种风格
Redis 未授权访问漏洞

转自 https www ichunqiu com vm 59321 1 实验需了解 Redis是一个高性能的key value数据库 Redis暴露在公网即绑定在0 0 0 0 6379 目标IP公网可访问并且在没有开启相关认证和添加
ubuntu16.04 安装CUDA8.0,cudnn5.1v

安装cuda8 0之前安装好nvidia的显卡驱动下载好cuda8 0版本的网址 https developer nvidia com cuda 80 ga2 download archive 1 1 安装命令 sudo dpkg i

ubuntu16.04 安装CUDA8.0,cudnn5.1v

ubuntu16.04 安装CUDA8.0,cudnn5.1v 的相关文章

随机推荐

热门标签