vs2017 配置cuda 项目

2023-10-28

在这里记录一下，我用vs2017配置cuda项目过程中的种种问题，具体总结归类可分为如下几个步骤：

一、增加.cu源码拓展类型

打开VS, 依次打开工具=》选项=》文本编辑器=》文件拓展名，新增扩展名 .cu 编辑器 Microsoft Visual C++ 添加

二、搜索，设置 cuda -<version>的生成模板

右键点击具体项目， -》生成依赖项=》生成自定义

选择具体 CUDA 模板。

如果没有列表中没有，点击 “查找现有的”。在cuda的安装目录下:

默认安装的，一般在: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\extras\visual_studio_integration\MSBuildExtensions

添加进来就行，然后选择，确定。

或者在工具=》选项=》项目和解决方案=》vc++项目设置=》生成自定义搜索路径

将刚才的路径填上。

工具=》选项=》项目和解决方案=》vc++项目设置=》要包括的拓展名

将 .cu 加上，用分号 ; 隔开

三、.cu文件类型设置

新建一个.cu文件，点击右键属性。项类型选择 cuda c/c++, 确定完成，

往后，添加.cu文件时，配置具体的项类型即可。在此界面，可配置部分cuda 参数，例如，编译成32位还是64位目标程序。

启动编译，则VS调用 nvcc 编译器，编译device代码

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

VS2017

项目配置

vs2017 配置cuda 项目的相关文章

cuda简单应用程序适用于32位而不适用于64位

我的简单 cuda helloworld 应用程序在 Windows 10 上使用 Visual Studio 2015 社区构建 32 位时运行良好但是如果我在 64 位中构建它则不会执行 GPU 特斯拉K40c 工具包 CUDA
使用常量内存打印地址而不是cuda中的值

我试图在代码中使用常量内存并从内核分配常量内存值而不是使用 cudacopytosymbol include
如何在 gitlab-ci docker 执行器中使用 cuda

我们正在使用 gitlab 持续集成来构建和测试我们的项目最近其中一个项目添加了 CUDA 的要求以启用 GPU 加速我不想改变我们的管道 docker 和 gitlab ci 对我们来说运行良好所以我想以某种方式让 docker
为什么GK110有192个核心和4个扭曲？

我想感受一下开普勒的架构但这对我来说没有意义如果一个 warp 有 32 个线程其中 4 个被调度执行则意味着 128 个核心正在使用 64 个核心处于空闲状态白皮书中提到了独立指令那么64核是为这些指令保留的吗如果是这样
Ubuntu 11.10/12.04 上的 CUDA“无兼容设备”错误

一段时间以来我一直在尝试在我的笔记本电脑上设置 Ubuntu 环境来进行 CUDA 编程我目前双启动 Windows 8 和 Ubuntu 12 04 并想在 Ubuntu 上安装 CUDA 5 该笔记本电脑配有 GeForce GT
是否可以在设备函数中调用cufft库调用？

我在主机代码中使用 cuFFT 库调用它们工作正常但我想从内核调用 cuFFT 库早期版本的 CUDA 没有这种支持但是有了动态并行性这可能吗如果有任何关于如何实现这一目标的示例那就太好了尽管在 Kepler cc 3 5
寻找 CUDA 中的最大值

我正在尝试在 CUDA 中编写代码来查找最大值对于给定的一组数字假设您有 20 个数字并且内核在 2 个块每块 5 个线程上运行现在假设 10 个线程同时比较前 10 个值并且thread 2找到最大值因此线程 2 正在更新
“计算能力”是什么意思？ CUDA？

我是CUDA编程新手对此了解不多您能告诉我 CUDA 计算能力是什么意思吗当我在大学服务器上使用以下代码时它向我显示了以下结果 for device 0 device lt deviceCount device cudaDevic
cuda cpu功能-gpu内核重叠

我在尝试开发以练习 CUDA 的 CUDA 应用程序时遇到并发问题我想通过使用 cudaMemecpyAsync 和 CUDA 内核的异步行为来共享 GPU 和 CPU 之间的工作但我无法成功重叠 CPU 执行和 GPU 执行它与主机
cuda 共享内存 - 结果不一致

我正在尝试并行缩减以对 CUDA 中的数组求和目前我传递一个数组来存储每个块中元素的总和这是我的代码 include
Visual Studio - 过滤掉 nvcc 警告

我正在编写 CUDA 程序但收到令人讨厌的警告 Warning Cannot tell what pointer points to assuming global memory space 这是来自 nvcc 我无法禁用它有没有办法过
MPI+CUDA 与纯 MPI 相比有何优势？

加速应用程序的常用方法是使用 MPI 或更高级别的库例如在幕后使用 MPI 的 PETSc 并行化应用程序然而现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃更大的问题感兴
如何优化这个 CUDA 内核

我已经分析了我的模型似乎该内核约占我总运行时间的 2 3 我一直在寻找优化它的建议代码如下 global void calcFlux double concs double fluxes double dt int idx blockI
CUDA Visual Studio 2010 Express 构建错误

我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程我花了一段时间来设置环境然后我刚刚编写了我的第一个程序 helloWorld cu 目前
如何在 CUDA 中执行多个矩阵乘法？

我有一个方阵数组int M 10 以便M i 定位第一个元素i th 矩阵我想将所有矩阵相乘M i 通过另一个矩阵N 这样我就收到了方阵数组int P 10 作为输出我看到有不同的可能性分配不同元素的计算M i 到不同的线程例如我
如何在cmake中添加cuda源代码的定义

我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译例如 CMakeLists txt project Test add definitions D WINDOW
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
cuda中内核的并行执行

可以说我有三个全局数组它们已使用 cudaMemcpy 复制到 GPU 中但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配以便分配页面锁定的内存而不是简单的全局分配 int a 100 b 100 c 100 cu
CUDA、NPP 滤波器

CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像但不断出现错误我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
无法在内存位置找到异常源：cudaError_enum

我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I

随机推荐

"通配符"和"正则表达式"的区别

通配符是系统level的而正则表达式需要相关工具的支持 egrep awk vi perl 在文本过滤工具里都是用正则表达式比如像awk sed等是针对文件的内容的通配符多用在文件名上比如查找find ls cp 等等 1 通配
ipad连接电脑_一个从windows传文件到ipad的方法

动机写这篇文章的起因是想用ipad看存在windows上的视频于是就琢磨了下windows系统传文件到ipad的方法一个比较好的办法是用iCloud传但是条件受限一方面 iCloud只有5G的存储空间另一方面家里没网只能靠4
技术溢出

1 企业和国家都是一个虚拟的主题是由人们的想象构成 2 国家只是在体量多样性上高于企业而已 3 管理企业和管理国家理论上没有区别只是使命感不同企业是为了盈利而产生的政党是为了人民而服务的后来有的企业开始服务于人民有的政党开始逐
Linux必学知识（超全）

Linux 一 Linux 的介绍二 CentOS 安装技术难点网络配置三种方式理解 2 1虚拟机的三种网络配置方式的说明 2 2 Centos 终端的使用和联网 2 2 1在 centos 的 ff 可以联网可以和外部的 ip 联通
【尚硅谷-Java学习】回形数

回形数题目描述输入整数n 生成n n的二维数组元素按照顺时针顺序从1递增例如输入3 得到 1 2 3 8 9 4 7 6 5 思路定义四个变量up down left right 分别表示数组的最上面最下面最左最右的索引从
第十四届蓝桥杯（第二期）模拟赛试题与题解 C++

第十四届蓝桥杯第二期模拟赛试题与题解 C 试题A 题解位运算试题B 题解闰年判断试题C 题解枚举判断试题D 题解动态规划问题E 题解记忆化搜索试题F 题解计算试题G 题解哈希集合试题H 题解后缀回文试题I
增加肌肉记忆，码一遍龙哥的pytorch示例： ex_001, matMul；ex_002, autograd；ex_003, 线性函数的 gradient descent ＜梯度下降最简示例＞

import torch import time print torch version print torch cuda is available a torch randn 1024 8 16 1000 b torch randn 10
Java类型转换工具类（十六进制—bytes互转、十进制—十六进制互转，String—Double互转）...

数据类型转换工具类 author cyf public class NumConvertUtil bytes 转16进制字符串 param bArray return public static final String bytesToHe
ubuntu下安装QT与环境变量的添加

1 4 Qt在Linux下安装 Qt在Linux系统里的安装要稍微复杂一些因为Linux发行版众多所以安装过程有些差异由于Linux系统都可以自行安装 GNU 工具集对应Windows系统里的MinGW 所以Qt在Linux系统里的
git推送新项目

在命令窗口中输入 git init 在 Gitee 中我们刚刚新建的仓库里去复制仓库的地址在命令窗口中输入 git remote add origin 你的仓库地址在命令窗口中输入 git pull origin master 在命
基础算法：高精度减法

高精度减法两个长正整数的减法减数被减数差如果不是两个长正整数要考虑给出的数本身有负号的情况用一个位置来专门保存负号 include
适配国产数据库 GBase（南大通用mysql版）

这篇帖子主要是记一下踩过的坑文章目录 1 数据库安装 2 sql迁移 mysql gt gbase 2 1 注意编码格式统一 3 适配pagehelper mybatis plus 3 1 适配pagehelper 4 语法坑 5 其他坑
python重复元素判定，编写一个函数，接受列表作为参数，如果一个元素在列表中出现不止一次，则返回True，但不要改变原来列表的值。同时编写调用这个函数和测试结果的程序

def Lbpd a 定义函数Lbpd a a a split 对参数a按照空格进行分词 if len a len set a 利用集合的不重复性比较列表a和集合a的长度 return False 这是非重复序列如相同则返回非重复序列
windows7系统做文件服务器拒绝,简单几步解决win10系统gpsvc提示服务登录失败拒绝访问的问题...

gpsvc是一个重要的系统程序这个文件是随着win10系统在你的电脑中安装的时候一同形成的最近有用户在使用win10系统时登录gpsvc却出现了提示服务登录失败拒绝访问的情况那么如何解决win10系统gpsvc提示服务登录失败拒绝访
<30天自制操作系统>第八天

花了将近1周时间来理清之前模糊的概念感觉思路清晰了很多今天是八天内容中的最后一天以后的内容就不会每天都写文章了今天的内容还是关于鼠标的控制但是是让它真正的动起来在主函数中我们取得了鼠标的数据 for io cli if fif
学习MATLAB的第一天，梳理一些见到的函数。1.matlab中sin、cos、tan三角函数问题。2.abs函数。3.vpa函数。4.disp函数。5.class函数。6.logical函数。

1 matlab中sin cos tan三角函数问题在MATLAB中三角函数sin cos tan都是以弧度为单位的例如sin 在括号中输入的数系统默认为输入的是弧度值若想要输入角度值可以采用以下两种方法 a 采用sind cosd
Git SourceTree 冲突解决方案

Git现在越来越火很多人都从Svn迁移到Git上面 Git让我们更加与世界接轨不再是局域网的程序猿特别是掌握了Git之后会发现它真的很好用本文对Git中比较烦人的冲突进行了详细的说明希望能帮助那些刚接触Git的程序猿亮点
javaScript基础面试题 --- == 与 ===有什么不同？

与有什么不同比较的是数值通过ValueOf方法做隐式转换比较的是数据类型和数值全部都是true console log 1 1 true console log true 1 true console log null und
openwrt中添加自定义驱动模块

1 make menuconfig中的 kernel modules 其中的各个配置选项来自于下面目录中的 mk文件 root localhost openwrt openwrt trunk package kernel linux mod
vs2017 配置cuda 项目

在这里记录一下我用vs2017配置cuda项目过程中的种种问题具体总结归类可分为如下几个步骤一增加 cu源码拓展类型打开VS 依次打开工具选项文本编辑器文件拓展名新增扩展名 cu 编辑器 Microsoft Visual

热门标签