ubuntu16.04 安装CUDA8.0,cudnn5.1v

2023-11-01

安装cuda8.0之前安装好nvidia的显卡驱动,下载好cuda8.0版本的,网址:https://developer.nvidia.com/cuda-80-ga2-download-archive.
这里写图片描述

1.1
安装命令:

sudo dpkg -i cuda-repo-ubuntu1604-8-0-rc_8.0.27-1_amd64​.deb
sudo apt-get update
sudo apt-get install cuda#出现问题手敲 

1.2
可降级可不降级,根据情况而定:
ubuntu的gcc编译器是5.4.0,然而cuda8.0不支持5.0以上的编译器,因此需要降级,把编译器版本降到4.9:

在terminal中执行:

sudo apt-get install gcc-4.9 gcc-5 g++-4.9 g++-5

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10

sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30

sudo update-alternatives --set cc /usr/bin/gcc

sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30

sudo update-alternatives --set c++ /usr/bin/g++ 

1.3添加环境变量

执行命令:

sudo gedit /etc/profile

添加内容如下:

PATH=/usr/local/cuda-8.0/bin:$PATH   
export PATH  
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:/lib 

保存并退出
然后使之立刻生效
执行命令:

source /etc/profile

1.4添加lib库路径
执行命令:

sudo gedit /etc/ld.so.conf.d/cuda.conf

添加如下内容:

/usr/local/cuda-8.0/lib64

保存并退出
然后使之立刻生效
执行命令:

sudo ldconfig

1.5验证安装:先重启
执行命令:

nvcc -V 

2接下来是安装cudnn:
首先在https://developer.nvidia.com/cudnn官网上下载(注意版本,必须是5.1)
2.1解压:

tar zxvf cudnn-8.0-linux-x64-v5.1.tgz

2.2然后执行

cd cuda  
sudo cp lib64/lib* /usr/local/cuda/lib64/  
sudo cp include/cudnn.h /usr/local/cuda/include/

2.3会出现cuda这个文件夹,更新链接。

cd /usr/local/cuda/lib64/  
sudo rm -rf libcudnn.so libcudnn.so.5  
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5  
sudo ln -s libcudnn.so.5 libcudnn.so

3-cuda8.0和cudnn5.1V就装好了,然后就是安装pyenv和pyenv install anaconda2/3,再pip install tensorflow/pytorch等等.参考我的其他博客。

借鉴:https://www.cnblogs.com/xujianqing/p/6142963.html
http://blog.csdn.net/binglel/article/details/70230276

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ubuntu16.04 安装CUDA8.0,cudnn5.1v 的相关文章

  • 无法从静态初始化代码启动 CUDA 内核

    我有一个在其构造函数中调用内核的类 如下所示 标量场 h include
  • 如何在 gitlab-ci docker 执行器中使用 cuda

    我们正在使用 gitlab 持续集成来构建和测试我们的项目 最近 其中一个项目添加了 CUDA 的要求以启用 GPU 加速 我不想改变我们的管道 docker 和 gitlab ci 对我们来说运行良好 所以我想以某种方式让 docker
  • 为什么GK110有192个核心和4个扭曲?

    我想感受一下开普勒的架构 但这对我来说没有意义 如果一个 warp 有 32 个线程 其中 4 个被调度 执行 则意味着 128 个核心正在使用 64 个核心处于空闲状态 白皮书中提到了独立指令 那么64核是为这些指令保留的吗 如果是这样
  • 如何在 CUDA 应用程序中构建数据以获得最佳速度

    我正在尝试编写一个简单的粒子系统 利用 CUDA 来更新粒子位置 现在 我定义的粒子有一个对象 该对象的位置由三个浮点值定义 速度也由三个浮点值定义 更新粒子时 我向速度的 Y 分量添加一个常量值以模拟重力 然后将速度添加到当前位置以得出新
  • 如何将CUDA时钟周期转换为毫秒?

    我想用一些代码来测量时间within我的内核需要 我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
  • cudaMemcpyToSymbol 的问题

    我正在尝试复制到恒定内存 但我不能 因为我对 cudaMemcpyToSymbol 函数的用法有误解 我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
  • “计算能力”是什么意思? CUDA?

    我是CUDA编程新手 对此了解不多 您能告诉我 CUDA 计算能力 是什么意思吗 当我在大学服务器上使用以下代码时 它向我显示了以下结果 for device 0 device lt deviceCount device cudaDevic
  • CUDA 中的广义霍夫变换 - 如何加快分箱过程?

    正如标题所示 我正在对并行计算机视觉技术进行一些个人研究 使用 CUDA 我尝试实现 GPGPU 版本的霍夫变换 我遇到的唯一问题是在投票过程中 我调用atomicAdd 来防止多个同时写入操作 但我似乎没有获得太多的性能效率 我在网上搜索
  • 如何确定完整的 CUDA 版本 + 颠覆版本?

    Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用 但是 从 CUDA 11 1 开始 该文件不再存在 我如何在 Linux 上通过命令行确定并检查 path t
  • 运行时 API 应用程序中的 cuda 上下文创建和资源关联

    我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联 我知道这是由驱动程序 API 在幕后完成的 但我想了解一下创作的时间线 首先 我知道 cudaRegisterFatBinary 是第一个 cuda a
  • 如何在 CUDA 中执行多个矩阵乘法?

    我有一个方阵数组int M 10 以便M i 定位第一个元素i th 矩阵 我想将所有矩阵相乘M i 通过另一个矩阵N 这样我就收到了方阵数组int P 10 作为输出 我看到有不同的可能性 分配不同元素的计算M i 到不同的线程 例如 我
  • cuda中有模板化的数学函数吗? [复制]

    这个问题在这里已经有答案了 我一直在寻找 cuda 中的模板化数学函数 但似乎找不到 在普通的 C 中 如果我调用std sqrt它是模板化的 并且将根据参数是浮点数还是双精度数执行不同的版本 我想要这样的 CUDA 设备代码 我的内核将真
  • 如何在cmake中添加cuda源代码的定义

    我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译 例如 CMakeLists txt project Test add definitions D WINDOW
  • 在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗?

    CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
  • TensorRT 多线程

    我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它 其中 Cuda 上下文与所有线程一起使用 在单个线程中一切正常 我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
  • 从 CUDA 设备写入输出文件

    我是 CUDA 编程的新手 正在将 C 代码重写为并行 CUDA 新代码 有没有一种方法可以直接从设备写入输出数据文件 而无需将数组从设备复制到主机 我假设如果cuPrintf存在 一定有地方可以写一个cuFprintf 抱歉 如果答案已经
  • CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

    与 CUDA 的任何事情一样 最基本的事情有时也是最难的 所以 我只想将变量从 CPU 复制到 GPUconstant变量 我很难过 这就是我所拥有的 constant int contadorlinhasx d int main int
  • 如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

    这是一个关于编程的概念问题 总而言之 我有两个数组 向量 我需要对一个数组 向量进行排序 并将更改传播到另一个数组 向量中 这样 如果我对 arrayOne 进行排序 则对于排序中的每个交换 arrayTwo 也会发生同样的情况 现在 我知
  • 如何为 CUDA 内核选择网格和块尺寸?

    这是一个关于如何确定CUDA网格 块和线程大小的问题 这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段 见下文 我
  • 无法在内存位置找到异常源:cudaError_enum

    我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常 内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I

随机推荐

  • C++:vector中的resize()函数 VS reserve()函数

    写代码的时候无意错用了这两个函数 导致测试的时候 程序运行崩溃 发现这两个函数还是有区别的 void reserve size type n reserver函数用来给vector预分配存储区大小 即capacity的值 但是没有给这段内存
  • 三款开源工具让你的演示脱颖而出

    本文转载至 http blog callmewhy com 2014 07 02 three open source tools to make your presentations pop 不论是在商业圈还是在学术界 演示都是生活中不可或
  • 共享内存 设计原理-shm

    POSIX的shm open 在 dev shm 下打开一个文件 用mmap 映射到进程自己的内存地址 System V的shmget 得到一个共享内存对象的id 用shmat 映射到进程自己的内存地址 目前这里主要看 System V的设
  • VS无法打开 源 文件 "xxx.h" 问题

    项目属性 gt 配置属性 gt C C gt 常规 gt 附加包含目录 gt ProjectDir 即可
  • Qt QFrame

    QFrame类是带有边框部件的基类 lineWidth调整边框边界线的宽度 midLineWidth是在边框中插入一条线的宽度 用于营造3D效果 此效果只有在Box HlineVline凸起或者凹陷时有效 QFrame NoFrame 不绘
  • 【手拉手 带你准备电赛】解答小课堂——为什么要使能时钟

    大家在代码编写过程中也发现了 当我们涉及到外设时 总是需要使能其对应的时钟 那么为什么要使能时钟呢 直接用不是更简单 确实 直接使用IO 代码量可以小那么一丢丢 你可能会说 代码量算什么 这是老师少考我们一个考点 是我们可能不挂科的问题 手
  • Java数组排序:Java sort()方法

    在 Java 中实现数组排序的方式很多 除了利用 Arrays 类的 sort 方法外 还可以编写自定义方法来实现自己的排序算法 本文介绍如何使用 Arrays 类提供的 sort 方法来对数组进行排序 使用 java util Array
  • 一款基于Latex语法和MathJax渲染的零基础公式编辑器,数学公式插件

    零基础即可编辑公式 支持自定义编辑器配置和风格 支持二次编辑公式 支持作为插件和富文本编辑器一起使用 介绍 基于Latex语法和MathJax渲染的公式编辑器插件 易用 可二次编辑 内容可视化 标题为什么会开发该插件 之前调研过很多开源的公
  • log4j2配置参数详解

    1 概述 JAVA常用的日志收集api和实现框架都有多种 不同的api和实现框架之间怎么相互兼容都比较复杂 不过大部分的日志框架实现也都提供了对其他日志收集方式的兼容和切换 可以参考slf4j jcl jul log4j1 log4j2 l
  • CentOS 8:Cannot prepare internal mirrorlist: No URLs in mirrorlist

    问题 在Centos 8上因为要安装mysql5 7 需要使用yum命令 但执行yum命令时报错 No URLs in mirrorlist 经查阅资料后发现 从2022年1月31日起 CentOS开发团队将会移除官方镜像源上关于CentO
  • Linq按日期年月日分组

    var body db tbl worklist AsQueryable WorkOrderHomePageResponse model new WorkOrderHomePageResponse DateTime startDate Da
  • element-UI表格table实现表格行的动态合并

    本文主要举个项目中真实实例 方便各位跟我一样在实际项目开发中碰到的需求功能的开发 可直接拿来使用的 饿了么table组件官方实例 http element cn eleme io zh CN component table 在实际开发过程中
  • IDEA导入Eclipse项目

    在学习编程中 经常需要导入其他项目 这些项目中通常包含由Eclipse编写的项目 对于经常使用IDEA开发而不熟悉Eclipse的程序员 往往是比较头疼的 所以将自己导入项目的经验总结出来 供大家学习参考 编译器版本 IntelliJ ID
  • HJ2 计算某字母出现次数(Java)

    假期在刷牛客网上的真题 此题源自华为机试题库 文章目的在于记录学习心得 如有错误欢迎指正 原题如下 描述 写出一个程序 接受一个由字母 数字和空格组成的字符串 和一个字母 然后输出输入字符串中该字母的出现次数 不区分大小写 字符串长度小于5
  • 6.830 / 6.814: Syllabus 2021 - MIT Lab 1 - SimpleDB

    文章目录 1 参考链接 2 SimpleDB Architecture and Implementation Guide 2 2Fields and Tuples 2 3Catalog 2 4BufferPool 2 5HeapFile a
  • 零基础如何快速入门学python?python全套学习路线总结

    前言 学习任何一门语言都是从入门 1年左右 通过不间断练习达到熟练水准 3到5年 少数人最终能精通语言 成为执牛耳者 他们是金字塔的最顶层 虽然万事开头难 但好的开始是成功的一半 今天这篇文章就来谈谈如何开始入门Python 只要方向对了
  • HTML +CSS制作QQ登录页面

    用a link color FF0000 未访问的链接 a visited color 00FF00 已访问的链接 a hover color FF00FF 鼠标移动到链接上 a active color 0000FF 超链接为了方便 一直
  • 免费Midjourney来袭

    发现一个镜像站 和之前发的镜像站不一样 这个集成了midjourney和chatgpt 且免翻 相信给很多很多用户都提供了便利吧 先把网站贴出来 有兴趣的伙伴可以玩一玩 关于以图生图 现在网站支持本地上传图片啦 非常方便 可以生成同种风格
  • Redis 未授权访问漏洞

    转自 https www ichunqiu com vm 59321 1 实验需了解 Redis是一个高性能的key value数据库 Redis暴露在公网 即绑定在0 0 0 0 6379 目标IP公网可访问 并且在没有开启相关认证和添加
  • ubuntu16.04 安装CUDA8.0,cudnn5.1v

    安装cuda8 0之前安装好nvidia的显卡驱动 下载好cuda8 0版本的 网址 https developer nvidia com cuda 80 ga2 download archive 1 1 安装命令 sudo dpkg i