CUDA 7.5 安装及配置(WIN7 64 英伟达G卡 VS2013)

2023-11-05

第一步

下载cuda 7.5最新版本

https://developer.nvidia.com/cuda-downloads

第二步

运行安装程序，安装过程中选择自定义

第三步

安装完毕，可以看到系统中多了CUDA_PATH和CUDA_PATH_V7_5两个环境变量，接下来，还要添加以下几个环境变量

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5.
（这个文件夹是隐藏的，可以在工具->查看中设置显示隐藏文件夹）

CUDA_LIB_PATH = %CUDA_PATH%\lib\x64

CUDA_BIN_PATH = %CUDA_PATH%\bin

CUDA_SDK_BIN_PATH = %CUDA_SDK_PATH%\bin\x64

CUDA_SDK_LIB_PATH = %CUDA_SDK_PATH%\common\lib\x64

然后，在系统变量 PATH 的末尾添加：

;%CUDA_LIB_PATH%;%CUDA_BIN_PATH%;%CUDA_SDK_LIB_PATH%;%CUDA_SDK_BIN_PATH%;

第四步

保存以使环境变量生成有效

第五步

打开VS2013并且建立一个空的win32控制台项目：

附近选项，选择“空项目”打钩

第六步

右键源文件->添加-》新建项

再打开的对话框中新建一个CUDA格式的源文件（如果你只要调用CUDA库编写程序而不需要自行调用核函数分配块，线程的话也可以建立.cpp文件）：

第七步

右键工程-->生产依赖项-->生成自定义-->勾上CUDA 7.5

第八步

右键项目 -> 属性 -> 配置属性 -> VC++目录，添加以下两个包含目录：

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\include

C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\common\inc

再添加以下两个库目录：
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib\x64
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5\common\lib\x64

第九步

右键项目 -> 属性 -> 配置属性 ->连接器 -> 常规 -> 附加库目录，添加以下目录：

$(CUDA_PATH_V7_5)\lib\$(Platform)

如下图所示：

第十步

右键项目 -> 属性 -> 配置属性 ->连接器 -> 输入 -> 附加依赖项，添加以下库：

cublas.lib;cublas_device.lib;cuda.lib;cudadevrt.lib;cudart.lib;cudart_static.lib;cufft.lib;cufftw.lib;curand.lib;cusolver.lib;cusparse.lib;nppc.lib;nppi.lib;npps.lib;nvblas.lib;nvcuvid.lib;nvrtc.lib;OpenCL.lib;

第十一步

右键项目 -> 属性，如下图所示：

第十二步

打开配置管理器，如下图所示：

点击新建，如下图所示：选择X64

环境搭建完毕

上代码：

#include <stdio.h>
#include <iostream>
#include <cuda_runtime.h>
__global__ void Add(int a, int b, int *c)
{
*c = a + b;
}
int main()
{
int c;
int *devc;
cudaError_t err = cudaSuccess;
err = cudaMalloc((void **)&devc, sizeof(int));
if (err != cudaSuccess)
{
fprintf(stderr, "Faild!\n", cudaGetErrorString(err));
exit(EXIT_FAILURE);
}
Add <<<1, 1 >> >(2, 4, devc);
err = cudaMemcpy(&c, devc, sizeof(int), cudaMemcpyDeviceToHost);
if (err != cudaSuccess)
{
fprintf(stderr, "Faild!\n", cudaMemcpyDeviceToHost);
exit(EXIT_FAILURE);
}
printf("2+4 = %d\n", c);
cudaFree(devc);
system("pause");
return 0;
}

输出如下测试成功！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA 7.5 安装及配置(WIN7 64 英伟达G卡 VS2013) 的相关文章

warp 如何与原子操作一起工作？

warp 中的线程在物理上并行运行因此如果其中一个称为线程 X 启动原子操作其他线程会做什么等待这是否意味着当线程 X 被推入原子队列时所有线程都将等待获得访问权限互斥体并对受该互斥体保护的内存执行一些操作然后再释放互
如何在arch linux中降级到cuda 10.0？

我想在 arch linux 中将我的 cuda 10 1 降级到 cuda 10 0 因为 TensorFlow 仅需要 cuda 10 0 我在 arch Linux 的 CUDA 10 1 上安装了tensorflow 但我不知道te
GPU 上非原子写入的保证很弱吗？

OpenCL 和 CUDA 包含原子操作已有好几年了尽管显然并非每个 CUDA 或 OpenCL 设备都支持这些操作但是我的问题是关于由于非原子写入而共存种族的可能性假设网格中的多个线程都写入全局内存中的同一位置我们是否可以保
如何获取要执行的 PTX 文件

我知道如何生成 ptx文件来自 cu以及如何生成 cubin文件来自 ptx 但我不知道如何获得最终的可执行文件更具体地说我有一个sample cu文件编译为sample ptx 然后我使用 nvcc 来编译sample ptx to
加强托管线程和操作系统线程之间的关系（CUDA 用例）

Problem 我正在尝试创建一个与 net 良好集成的 CUDA 应用程序设计目标是拥有多个可以从托管代码调用的 CUDA 函数数据还应该能够在函数调用之间保留在设备上以便可以将其传递给多个 CUDA 函数重要的是每个单独的数据
如何在 Linux 中分析 PyCuda 代码？

我有一个简单的经过测试的 pycuda 应用程序正在尝试对其进行分析我尝试过 NVidia 的 Compute Visual Profiler 它运行该程序 11 次然后发出以下错误 NV Warning Ignoring the
CUDA错误：在python中使用并行时初始化错误

我的代码使用 CUDA 但运行速度仍然很慢因此我将其更改为使用 python 中的多处理 pool map 并行运行但我有CUDA ERROR initialization error 这是函数 def step M self ite
将 GPUJPEG 项目移植到 Windows

我目前正在尝试移植 GPUJPEG 在 Sourceforge 上 http sourceforge net projects gpujpeg 库基于 CUDA 从 Unix 到 Windows 现在我被卡住了我不知道发生了什么或为什么
Cuda Bayer/CFA 去马赛克示例

我编写了一个 CUDA4 Bayer 去马赛克例程但它比在 16 核 GTS250 上运行的单线程 CPU 代码慢块大小是 16 16 图像暗淡是 16 的倍数但更改此值并不会改善它我做了什么明显愚蠢的事情吗 calling rou
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
cudaMallocManaged() 返回“不支持的操作”

在 CUDA 6 0 中尝试托管内存给了我operation not supported打电话时cudaMallocManaged include cuda runtime h include
为什么numba cuda调用几次后运行速度变慢？

我正在尝试如何在 numba 中使用 cuda 然而我却遇到了与我预想不同的事情这是我的代码 from numba import cuda cuda jit def matmul A B C Perform square matrix m
传递给 CUDA 的结构中的指针

我已经搞砸了一段时间了但似乎无法正确处理我正在尝试将包含数组的对象复制到 CUDA 设备内存中然后再复制回来但当我遇到它时我会跨过那座桥 struct MyData float data int dataLen void copyT
如何确定完整的 CUDA 版本 + 颠覆版本？

Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用但是从 CUDA 11 1 开始该文件不再存在我如何在 Linux 上通过命令行确定并检查 path t
如何并行从数组中删除零值

如何使用 CUDA 并行有效地从数组中删除零值有关零值数量的信息是预先可用的这应该可以简化这项任务重要的是数字必须保持源数组中的顺序当被复制到结果数组时 Example 该数组将例如包含以下值 0 0 19 7 0 3 5 0 0
运行时 API 应用程序中的 cuda 上下文创建和资源关联

我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联我知道这是由驱动程序 API 在幕后完成的但我想了解一下创作的时间线首先我知道 cudaRegisterFatBinary 是第一个 cuda a
CUDA 估计 2D 网格数据的每块线程数和块数

首先我要说的是我已经仔细阅读了所有类似的问题确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
CUDA 常量内存是否应该被均匀地访问？

我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化如果是如何确保所有线程同时访问同一地址既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化是的这缓存本身每
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
尝试构建我的 CUDA 程序时出现错误 MSB4062

当我尝试构建我的第一个 GPU 程序时出现以下错误有什么建议可能会出什么问题吗错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务无法从程序集 C Program 加载文件 M

随机推荐

Unity接入TopOn聚合广告平台SDK【聚合了穿山甲，优量汇(腾讯广告)，快手，Mintegral，sigmob等各大广告平台SDK】

TopOn聚合穿山甲优量汇快手 Mintegral各大广告SDK教程接了好几家SDK 都有亿点点蛋疼直到遇到了TopOn TopOn的文档和SDK相当齐全包括Android IOS Unity Cocos2dx CocosCrea
数据库动态加载省市区信息，实现三级联动

本文转载自 http my oschina net zhengweishan blog 402483 摘要动态的从数据库加载全国省市区后台使用的是SpringMvc 前台使用的是bootstrap页面展示 demo源码下载地址 http
Qt安装包+安装配置说明（强烈推荐，小白专用）

链接 https pan baidu com s 1zrhLUP sjWgCQdrFacDQCQ 提取码 uie5内附赠详细安装说明可以信我获取
es7合并数组相关报错Uncaught (in promise) TypeError: Invalid attempt to spread non-iterable instance...

方法一 let o1 a 1 b 2 c 3 let o2 o1 d 4 o2 a 1 b 2 c 3 d 4 let arr1 0 1 2 let arr2 arr1 3 arr2 0 1 2 3 方法二 let o1 a 1 b 2 c
科普:java与C++的区别

Java与C 是两种广泛使用的编程语言它们在某些方面存在不同之处本文将详细介绍Java与C 的区别一 C 与Java的历史 C 语言是由Bjarne Stroustrup在20世纪80年代初期开发的一种面向对象编程语言它是C语言的扩
服务器CPU占用率高，如何排查？

1 定位进程登录服务器执行top命令查看CPU占用情况 top 2 定位线程如果进程23456占用率高 top Hp23456 进行定位线程 3 定位代码通过top命令我们目前已经定位到导致CPU使用率较高的具体线程比如线程4
电脑如何进入bios模式_电脑BIOS是什么？到底有什么用？如何进入电脑BIOS

BIOS是英文 Basic Input Output System 的缩略语直译过来后中文名称就是基本输入输出系统其实它是一组固化到计算机内主板上一个ROM芯片上的程序它保存着计算机最重要的基本输入输出的程序系统设置信息开机后
Python3 + Pymysql + mysql 连接方法

准备材料 1 host地址 127 0 0 1 2 端口号 3306 3 用户名 root 4 密码 5 数据库名 information persons 6 python3 的pymysql库正式开始查询 1 首先导入pymysql包
C99和C89

这是c0conut同学的一份作业也可以理解为总结为了保留这份作业写了博客我尽量使自己写得简单好懂有趣 C99与C89的亲子关系就如DOM结构一般 C99与C89之间也充满温情老父亲C89顾名思义出生于89年也被称为ANSI C
validator 重写方法报错

javax validation ConstraintDeclarationException HV000151 A method overriding another method must not redefine the parame
windows常用命令大全

作者介绍作者小刘在C站每天分享课堂笔记一起努力共赴美好人生夕阳下是最美的绽放目录运行框命令 cmd中 Windows运行中快捷键运行框命令 shutdown s t 后家秒数计划关机任务 migwiz Window
x-oss-process_OSS中的同理心-重要

x oss process 我不花很多时间在开放源码项目的整个工作日和许多晚上上我对OSS的使用形成了一种或两种意见特别是在为项目做贡献时作为一个使用Github之类的工具的社区我们已经走了很长一段路这使得在野外发布OSS项目
什么是区块链？

什么是区块链今天给大家讲解我们区块链的第一课我们要学习区块链首先我们必须得了解什么是区块链只有理解了区块链的概念我们才能入门区块链接下来我会从浅入深的带着大家去理解区块链的含义首先我们从字面上来理解区块链包含着两层含义
kvm虚拟化技术

前言 kvm是一种虚拟化技术使用概念 kvm是linux内核的模块它需要CPU支持采用硬件辅助虚拟化技术Intel VT AMD V 内存的相关技术如Intel的EPT和AMD的RVI 是底层虚拟化内核模块检查cpu是否支持虚拟化
大学c语言程序设计题库选择题,黑龙江大学C语言程序设计试题库程序单选.doc

单选题 46 若输入ab 程序运行结果为 main static char a 2 scanf s a printf c c a 1 a 2 C A a b B a C b D 程序出错 47 若有说明 int a 3 4 0 则下面正确的
Hadoop HA集群两个NameNode都是standby或者主NameNode是standby，从NameNode是active的情况集锦

文章目录背景架构 HDFS HA配置错误原因解决方案方案一方案二方案三首先查看自己各参数文件是否配置出错后记补充 failover transitionToActive 常用端口号及配置文件常用端口号 hadoop3
服务器上传图片不显示,网站后台上传图片失败或不显示的原因

这四年多以来比尔云做过近百个网站发现好多网站后台上传图片都会出现一些错误也不管这个程序是ASP的还是PHP的对于为什么网站后台上传图片失败今天比尔云结合自己的经验给大家总结一下大家以后在搞网站时遇到相应的问题就好解决了第一件事
Fine-tuning Large Enterprise Language Models via Ontological Reasoning

本文是LLM系列文章针对 Fine tuning Large Enterprise Language Models via Ontological Reasoning 的翻译基于本体论推理的大型企业语言模型微调摘要 1 引言 2 微调
十大图像数据标注工具大合集

给大家推荐十大标注工具 1 常见的标注方法人工数据标注的好处是标注结果比较可靠自动数据标注一般都需要二次复核避免程序错误外包数据标注很多时候会面临数据泄密与流失风险 2 人工标注工具可以分为客户端与WEB端标注工具推荐使用
CUDA 7.5 安装及配置(WIN7 64 英伟达G卡 VS2013)

第一步下载cuda 7 5最新版本 https developer nvidia com cuda downloads 第二步运行安装程序安装过程中选择自定义第三步安装完毕可以看到系统中多了CUDA PATH和CUDA PATH

CUDA 7.5 安装及配置(WIN7 64 英伟达G卡 VS2013)

CUDA 7.5 安装及配置(WIN7 64 英伟达G卡 VS2013) 的相关文章

随机推荐

热门标签