Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考）

2023-11-05

这是个失败的版本，既然记录下来了，就保留下来，总体来说没错，只是可能CUDA版本不合适。

可以参考下。

一. 安装CUDA

1. 下载 https://developer.nvidia.com/cuda-downloads

2. 正常安装

出现这个问题。。不懂。。我还是继续了

后来大概弄懂了：

首先，CUDA不是驱动，这里的“This graphics driver"让我以为CUDA是显卡驱动，坑爹，其实应该是CUDA里面自带了驱动程序，这个驱动程序不适合我的显卡（GTX 1060），因此上面说如果建议我保留自己的显卡驱动，也就是继续安装时不要安装CUDA带来的显卡驱动。

于是继续：

发现确实电脑自己的版本还更新，就把显卡驱动勾去掉，再继续安装，一路默认下去。

3. 添加环境变量：

安装完毕后，可以看到系统中多了 CUDA_PATH 和 CUDA_PATH_V8_0 两个环境变量，接下来，还要在系统中添加以下几个环境变量：

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0.

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\x64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

然后，在系统变量 PATH 的末尾添加：

;%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;

4. 重启电脑

二. VS2013与CUDA关联（不知道这步是有什么用，CUDA里面的Sample用VS打开都可以直接运行，都不用关联）

1. 新建win32控制台程序-空项目

2. 右键源文件，新建CUDA源文件：

3. 右键项目->生成依赖项->生成自定义，勾选CUDA8.0***选项：

4. 右键项目->属性->配置属性->VC++目录，添加以下两个包含目录：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\common\inc

再添加两个库目录：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\common\lib\x64

5.右键项目->属性->配置属性->链接器->常规->附加库目录，添加

$(CUDA_PATH_V8_0)\lib\$(Platform)

6. 右键项目->属性->配置属性->链接器->输入->附加依赖项，添加

cublas.lib

cublas_device.lib

cuda.lib

cudadevrt.lib

cudart.lib

cudart_static.lib

cufft.lib

cufftw.lib

curand.lib

cusparse.lib

nppc.lib

nppi.lib

npps.lib

nvblas.lib

nvcuvenc.lib

nvcuvid.lib

OpenCL.lib

注意：这里后来把nvcuvenc.lib删掉了，否则一直出错。

7. 右键之前创建的源文件，点击属性，选择项类型 CUDA C/C++：

8. 打开配置管理器（运行按钮旁边下拉框），选择X64平台

9. 测试代码：

/** * addition: C = A + B. * * This sample is a very basic sample that implements element by element * vector addition. It is the same as the sample illustrating Chapter 2 * of the programming guide with some additions like error checking. */

#include <stdio.h>

#include <iostream> // For the CUDA runtime routines (prefixed with "cuda_")

#include <cuda_runtime.h>

/** * CUDA Kernel Device code * * Computes the vector addition of A and B into C. The 3 vectors have the same * number of elements numElements. */

__global__ void Add(int a, int b, int *c) {

*c = a + b;

}

int main() {

int c;

int *devc;

cudaError_t err = cudaSuccess;

err = cudaMalloc((void **)&devc, sizeof(int));

if (err != cudaSuccess) {

fprintf(stderr, "Failed to allocate device vector A (error code %s)!\n", cudaGetErrorString(err));

exit(EXIT_FAILURE);

}

Add << <1, 1 >> >(2, 7, devc);

err = cudaMemcpy(&c, devc, sizeof(int), cudaMemcpyDeviceToHost);

if (err != cudaSuccess) {

fprintf(stderr, "Failed to allocate device vector A (error code %s)!\n", cudaGetErrorString(err));

exit(EXIT_FAILURE);

}

printf("2+7=%d\n", c);

cudaFree(devc);

system("pause");

return 0;

}

三. 安装配置Caffe

1. 下载Caffe和第三方包

2015/02/25 微软制作了一个caffe的windows版：

https://github.com/yyz051/caffe-windows

第三方：

http://pan.baidu.com/s/1bSzvKa

解压后放在Caffe里的3rdparty文件夹里

2. 将3rdparty/bin添加到环境变量PATH中

3. 运行./src/caffe/proto/extract_proto.bat批处理文件来生成caffe.pb.h和caffe.pb.cc两个C++文件，和caffe_pb2.py这个python使用的文件。

4. 打开./buildVS2013/MainBuilder.sln，打开之后切换编译模式至Release X64模式，如果现实加载失败，可能是CUDA版本不一致，用记事本将各个文件夹下的.vcxproj文件里的CUDA版本号换成自己的版本号。（搜索7.5, 全部替换成8.0）

5. 之后编译出错：有很多类似的错误

error: function “atomicAdd(double *, double)” has already been defined

查找原因估计是CUDA版本问题，还是用7.5版本。。这个笔记--卒

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考）的相关文章

cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用？

假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部主上下文被压入堆栈事实上这似乎是不一致的我编写了这个程序在具有单个设备的机器上运行 i
在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗？

CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
cuda中内核的并行执行

可以说我有三个全局数组它们已使用 cudaMemcpy 复制到 GPU 中但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配以便分配页面锁定的内存而不是简单的全局分配 int a 100 b 100 c 100 cu
如何为 CUDA 内核选择网格和块尺寸？

这是一个关于如何确定CUDA网格块和线程大小的问题这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段见下文我
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
如何在 Caffe 中从头开始训练 ResNet101 模型？

我正在使用深度实验室 v2 https bitbucket org aquariusjay deeplab public ver2Caffe 版本以便进行语义分割我可以使用 imagenet 模型微调 ResNet101 但无法使用自定
内联 PTX 汇编代码强大吗？

我看到一些代码示例人们在 C 代码中使用内联 PTX 汇编代码 CUDA工具包中的文档提到PTX很强大为什么会这样呢如果我们在 C 代码中使用这样的代码我们会得到什么好处内联 PTX 使您可以访问未通过 CUDA 内在函数公开的指
将 nvidia 运行时添加到 docker 运行时

我正在运行虚拟机GCP配备特斯拉 GPU 并尝试部署一个PyTorch基于应用程序使用 GPU 加速我想让 docker 使用这个 GPU 可以从容器访问它我设法在主机上安装了所有驱动程序并且该应用程序在那里运行良好但是当我尝试在
cuda 文件组织的有效方式：.cpp .h .cu .cuh .curnel 文件

cuda最容易理解最高效的代码组织是什么经过一番调查后我发现 cuda 函数声明应位于 cuh 文件中实现位于 cu 文件中内核函数实现位于 curnel 文件中其他 C 内容通常在 cpp 和 h 文件中最近我发布了一个问题
PyInstaller 是否包含 CUDA

我正在开发一个Python脚本我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
有没有好的 GLSL 哈希函数？

所以我对这个问题的古老评论仍然得到了支持 GLSL rand 这一行代码的起源是什么 https stackoverflow com questions 12964279 whats the origin of this glsl rand
在没有 SurfaceView 的 Android 上获取 GPU 信息

在Android上有没有一种方法可以在不创建SurfaceView的情况下获取GPU信息我不想使用 OpenGL 绘制任何内容但我只需要获取硬件信息例如供应商 OpenGL ES 版本可用扩展等抱歉我不知道如何在 Androi
如何在GPU支持下运行python代码

我创建了一个 Flask 服务用于接受以相机 URL 作为参数的请求用于在相机框架中查找对象桌子椅子等我已经在 Flask 中编写了用于接受 POST 请求的代码 app route rest detectObjects meth
CUDA NSight 未随 Windows 8 上的 CUDA 5.0 安装文件一起安装？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案据我所知 Nvidia 网站上没有 Nsight Eclipse 的下载链接它说它将由 CUDA 5 安装本机安装但并没有随CUDA安装一起安装
用于计算邻居列表的最佳 GPU 算法

给定 3D 中数千个点的集合我需要获取落在某个截止值以欧几里得距离而言内的每个粒子的邻居列表并且如果可能的话从最近到最远排序在 CUDA 或 OpenCL 语言中哪种 GPU 算法最快我所知道的最快的 GPU MD 代码之一
CUDA 添加矩阵的行

我试图将 4800x9600 矩阵的行加在一起得到一个 1x9600 的矩阵我所做的是将 4800x9600 分成 9 600 个矩阵每个矩阵长度为 4800 然后我对 4800 个元素进行缩减问题是这真的很慢有人有什么建议吗
NVCC 警告级别

我希望 NVCC 将以下警告视为错误 warning calling a host function foo from a host device function bar NVCC 文档 NVIDIA CUDA 编译器驱动程序 NVCC
摆脱异步 cuda 流执行期间的忙等待

我正在寻找一种方法如何摆脱以下代码中主机线程中的忙等待不要复制该代码它仅显示我的问题的想法它有许多基本错误 cudaStream t steams S N for int i 0 i lt S N i cudaStreamCreat
使用 GPU 进行 Matlab 卷积

我用gpuArray尝试了matlab的卷积函数conv2 convn 例如 convn gpuArray rand 100 100 10 single gpuArray rand 5 single 并将其与 cpu 版本 convn ra

随机推荐

《substrate 快速入门与开发实战》

视频地址 https www bilibili com video BV1C4411U7Rv substrate的升级过程编写的runtime代码 gt 编译后得到runtime的wasm二进制文件 gt 通过链上的治理模块发送升级ru
关于nodejs中使用fluent-ffmpeg模块、ffmpeg工具的使用心得

类人猿Blog 欢迎来到我的博客您好这是本人第一次写博客请多多指教 nodejs中使用 fluent ffmpeg 详细方法和系统配置适应于 windows和 linux 特别是在 redhat6 x中得以验证通过简介我们都知道
对于c++中模板函数的一点体会

何为模板函数从字面上就可以看出来模板函数必须具备通用性举个简单却很实用的例子交换两个值的函数Swap 交换两个字符型void Swap char a char b 交换两个整型void Swap int a int b 交换两个浮点型
【RabbitMQ教程】“Hello World”工作队列模式

目录前言 Hello World 工作队列模式介绍消息模型入门案例代码示例自动ACK 消息确认机制自动ACK存在的问题演示手动ACK 前言 1 将 Hello World工作队列模式单独抽出来细讲目的是借助这个模式好好讲一下
PostgreSQL出现死锁该如何解决

目录什么是数据库死锁定位死锁死锁可能原因及解决办法 1 索引使用不当导致的死锁问题 2 不同事务之间的访问顺序问题避免死锁的建议附数据库中常见的死锁原因与解决方案总结什么是数据库死锁在操作系统领域当中死锁指的是两个或者两
linux下飞鸽传书,ipmsg的安装（支持中文名文件传输，以及文件夹传输）

一下载飞鸽传书 http www ipmsg org archive g2ipmsg 0 9 5 tar gz 二解压 tar zxvf g2ipmsg 0 9 5 tar gz cd g2ipmsg 0 9 5 三修改参数使它
linux 固定 ip 地址

文章目录查看当前ip 修改配置文件查看当前ip ip addr ifconfig 修改配置文件 vim etc sysconfig network scripts ifcfg ens33 原来是这样的 TYPE Ethernet PRO
软件测试-面试题

1 什么是需求文档测试测试需求中是否存在逻辑矛盾以及需求在技术上是否可以实现 2 什么是设计文档测试测试设计是否符合全部需求以及设计是否合理 3 什么是测试 Alpha测试测试是由一个用户在开发环境下进行的测试也可以是公司内部的
SpringBoot 集成Redisson 提示：java.lang.ClassNotFoundException: **.redis.connection.ReactiveRedisConnec

SpringBoot 集成Redisson 提示如下错误信息 Caused by java lang ClassNotFoundException org springframework data redis connection Reac
Vue安装less报错

使用npm安装less 指定版本为5 npm install save less less loader 5 报错 npm ERR code ERESOLVE npm ERR ERESOLVE unable to resolve depen
渗透测试面试题--日更（1-9day）

day one 1 拿到一个待检测的web站渗透测试思路答 1 信息收集获取域名的whois信息获取注册者的邮箱姓名电话等查服务器的旁站以及子域名站点因为主站一般比较难所以可以先看看旁站有没有通用cms或者其他漏洞查看服务器
华为OD机试真题-单词接龙-2023年OD统一考试（B卷）

题目描述单词接龙的规则是可用于接龙的单词首字母必须要前一个单词的尾字母相同当存在多个首字母相同的单词时取长度最长的单词如果长度也相等则取字典序最小的单词已经参与接龙的单词不能重复使用现给定一组全部由小写字母组成单词数组并指
基于高德地图API — 绘制热力图初尝试

初次了解高德地图并尝试在地图的基础上绘制热力图官方传送链接高德开放平台前提准备点击注册开发者账号登录成功后点击左侧菜单栏应用管理如图所示点击添加获取API 服务平台一项请选择 Web 端 JSAPI 回到页面引入文
基于DAC0832的信号发生器设计与实现（源码+原理图+PCB）

摘要本课题设计了一个基于DAC0832的信号发生器使之输出不同频率的正弦波三角波锯齿波和方波并通过按键切换不同的波形也可以改变频率以及频率变化的步进本方案选择了DAC0832作为核心芯片并与51单片机结合设计出一款建议的高
共识算法1--工作量证明机制简介及算法实现

共识算法1 工作量证明机制简介及算法实现所谓共识机制是通过特殊节点的投票在很短的时间内完成对交易的验证和确认对一笔交易如果利益不相干的若干个节点能够达成共识我们就可以认为全网对此也能够达成共识 1 当前已有多种常见的共识机制
【GO】详解GOROOT和GOPATH

GOROOT 其实就是golang 的安装路径当你安装好golang之后其实这个就已经有了 GOPATH 作用存放sdk以外的第三方类库自己收藏的可复用的代码目录结构 GOPATH目录约定有三个子目录 3 src存放源代码比如 g
蚀刻后残留物和光刻胶去除技术

摘要在未来几代器件中去除光刻胶和残留物变得非常关键在前端线后离子注入源极漏极扩展使用PR来阻断部分电路导致PR基本上硬化并且难以去除在后端线 BEOL 蚀刻中除低k材料的情况下去除抗蚀剂和残留物的选择性非常具有挑战性介绍
uniapp select 多选选择器封装

前言作者想实现的功能类似一个uniapp选择器但是可以选择多个值同时又可以单选和全选在uniapp 的UI框架去找发现没有类似的最后在uniapp 的插件市场找到了这个multiple select 里面的功能比较全实现了单选全
MySQL 多表连接查询

交叉连接特点又称笛卡尔乘积将多张表中的数据行一一对应连接在一起结果集的数据行数相当于多张表数据行数相乘后的结果语法格式 select 字段列表 from 表1 表2 表3 where 连接条件1 and 连接条件2 注释
Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考）

这是个失败的版本既然记录下来了就保留下来总体来说没错只是可能CUDA版本不合适可以参考下一安装CUDA 1 下载 https developer nvidia com cuda downloads 2 正常安装出现这个问题

Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考）

Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考） 的相关文章

随机推荐

热门标签

Windows7下安装Caffe(GPU)：试了很久的失败版本（可参考）的相关文章