确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中

2023-11-23

我使用 CMake 作为我的代码的构建系统，其中涉及 CUDA。我正在考虑将决定哪个任务自动化compute_XX and arch_XX我需要传递给我的 nvcc 以便为我当前计算机上的 GPU 进行编译。

有没有办法做到这一点：
1. 使用 NVIDIA GPU 部署套件？
2. 没有 NVIDIA GPU 部署套件？
有 CMake 的吗FindCUDA帮助您确定这些开关的值？

我的策略是编译并运行一个 bash 脚本来探测卡并返回 cmake 的 gencode。灵感来自于芝加哥大学 SLURM。要处理错误或多个 GPU 或其他情况，请根据需要进行修改。

在项目文件夹中创建一个文件 cudaComputeVersion.bash 并确保它可以从 shell 执行。放入该文件中：

#!/bin/bash

# create a 'here document' that is code we compile and use to probe the card
cat << EOF > /tmp/cudaComputeVersion.cu
#include <stdio.h>
int main()
{
cudaDeviceProp prop;
cudaGetDeviceProperties(&prop,0);
int v = prop.major * 10 + prop.minor;
printf("-gencode arch=compute_%d,code=sm_%d\n",v,v);
}
EOF

# probe the card and cleanup
/usr/local/cuda/bin/nvcc /tmp/cudaComputeVersion.cu -o /tmp/cudaComputeVersion
/tmp/cudaComputeVersion
rm /tmp/cudaComputeVersion.cu
rm /tmp/cudaComputeVersion

在你的 CMakeLists.txt 中输入：

# at cmake-build-time, probe the card and set a cmake variable
execute_process(COMMAND ${CMAKE_CURRENT_SOURCE_DIR}/cudaComputeVersion.bash OUTPUT_VARIABLE GENCODE)
# at project-compile-time, include the gencode into the compile options
set(CUDA_NVCC_FLAGS ${CUDA_NVCC_FLAGS}; "${GENCODE}")

# this makes CMake all chatty and allows you to see that GENCODE was set correctly
set(CMAKE_VERBOSE_MAKEFILE TRUE)

cheers

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

CMake

buildautomation

Detection

确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中的相关文章

编辑 CMakeLists.txt 以使用 -fPIC 进行编译

我正在尝试为名为 libnifalcon 的 NOVINT Falcon 安装驱动程序我使用 cmake 创建 make 文件但是当我运行 make 时出现错误 Linking CXX shared library lib libnif
grpc找不到protobuf库

我检查了 grpc 安装并完成了构建和安装现在当我尝试 find package gRPC CONFIG REQUIRED I get CMake Error at CMakeLists txt 15 find package Found
CMake 占位符如何工作？

在 CMake 的支持库中您将看到如下所示的命令定义 set CMAKE ASM ASM DIALECT COMPILE OBJECT
为什么 CMake 没有检测到对我生成的文件的依赖关系？

我正在尝试使用自定义命令生成标头每次重建时都应更新标头以便包含它的源文件也将被重建实际命令是一个脚本但这里是一个简化版本这是我的项目 CMakeLists txt cmake minimum required VERSION 2
CXX 编译器标识未知

我们在使用 Visual Studio 2012 在 Windows 7 64 位下使用 CMake v2 8 12 编译项目时遇到问题 CMake 给我们提供了以下错误我们已经尝试使用管理员权限从 Visual Studio 命令行启动
使用 CUDA 进行逐元素向量乘法

我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量向量乘法内核代码插入如下 multiplyElementwise 它工作正常但由于我注意到其他看似简单的操作如缩放向量在 CUBLAS 或 CULA 等库中进行了
设置 CMake OBJECT 库的输出目录

在我的 CMake 文件中我指定了一个对象库 add library core OBJECT sourcefiles 我在共享库中进一步引用了这组目标文件 add library sharedlib SHARED
CUDA 矩阵加法时序，按行与按行比较按栏目

我目前正在学习 CUDA 并正在做一些练习其中之一是实现以 3 种不同方式添加矩阵的内核每个元素 1 个线程每行 1 个线程和每列 1 个线程矩阵是方阵并被实现为一维向量我只需用以下命令对其进行索引 A N row col 直觉
cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用？

假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部主上下文被压入堆栈事实上这似乎是不一致的我编写了这个程序在具有单个设备的机器上运行 i
在 cudaFree() 之前需要 cudaDeviceSynchronize() 吗？

CUDA 版本 10 1 帕斯卡 GPU 所有命令都发送到默认流 void ptr cudaMalloc ptr launch kernel lt lt lt gt gt gt ptr cudaDeviceSynchronize Is th
CMake 错误：CMake 无法找到与“MinGW Makefiles”对应的构建程序

我正在尝试使用 cmake 为 c 构建 Box2D 库当我运行 cmake gui 时出现错误 CMake Error CMake was unable to find a build program corresponding to
cuda中内核的并行执行

可以说我有三个全局数组它们已使用 cudaMemcpy 复制到 GPU 中但 c 中的这些全局数组尚未使用 cudaHostAlloc 分配以便分配页面锁定的内存而不是简单的全局分配 int a 100 b 100 c 100 cu
cmake MSYS Makefiles 生成器丢失

我通过 pacman 安装了 cmake 3 2 3 当我尝试从 msys64 shell 中使用它时出现错误 cmake G MSYS Makefiles CMake Error Could not create named genera
CMake：如何将 .def 文件添加到 Visual Studio 项目过滤器？

如何将 def 文件添加到 Visual Studio 项目过滤器 filters文件 Visual Studio 使用 def 文件 CMake代码 set a src a cpp a def add library a SHARED a
构建错误：depfile 有多个输出路径 ninja：构建停止：子命令失败

我在使用需要 CMake 支持的 JNI 代码构建 Java 项目时遇到此错误该项目使用Android Studio构建并得到NDK CMake和LLVM的支持这些是 CMake 使用的以下标志我实际上使用了作为 C 项目创建的项目
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
如何使用 CUDA/Thrust 对两个数组/向量根据其中一个数组中的值进行排序

这是一个关于编程的概念问题总而言之我有两个数组向量我需要对一个数组向量进行排序并将更改传播到另一个数组向量中这样如果我对 arrayOne 进行排序则对于排序中的每个交换 arrayTwo 也会发生同样的情况现在我知
CMake Xcode生成器创建了一个无法构建的项目

我有一个使用 CMake 构建系统的 C 项目我使用 MacBook Pro 进行开发因此当我使用终端时一切都非常顺利我可以构建我的项目然而今天我发现我可以在使用 CMake 生成器创建相应的项目后使用 Xcode gt cma
如何在 C++ 项目的 Cmake 文件上添加 Mac OS 框架

我正在尝试将外部库 Vulkan 添加到我的项目中这个库是预编译的并且有一个框架我的项目树 build source Entry main cpp include ext vulkan macos include lib Framewo
CMake“项目”指令的正确用法是什么

我有一个很大的代码库它构建了几十个库和几个可执行文件代码库按层次结构进行分解并且几乎在每个级别都构建了库我已经仔细检查并在每个目录中放置了一个 CMakeLists txt 文件来构建每个库在每个 CMakeLists txt 中

随机推荐

服务器端 Blazor 不提供 HttpClient 进行注入

当我尝试注入 HttpClient 时我在 razor 页面中收到错误未处理的承诺拒绝错误 System InvalidOperationException 无法为类型上的属性 Http 提供值没有类型为 System Net H
使用 Visual Studio 开发服务器时如何让 Web 服务使用固定端口号？

我有一个 ASP NET 网站和一个 Windows 窗体应用程序我的网络服务的位置是 http localhost 12312 MyWebSiteFolder WSFile asmx 问题是端口号不断变化如果我重新打开解决方案它会
在获取聊天历史记录时，我没有从 Openfire 获取用户历史记录

我通过在 open fire 中安装 open fire 插件来从 openfire 获取历史记录并尝试了这段代码 let iq1 DDXMLElement name iq iq1 addAttribute withName type st
Kotlin中如何在延迟后调用函数？

如标题有没有办法在延迟例如1秒后调用函数Kotlin 还有一个选项可以使用Handler gt postDelayed Handler postDelayed doSomethingHere 1000
处理可选的 python 字典字段

我正在处理加载到 Python 字典中的 JSON 数据其中很多都有可选字段其中可能包含字典之类的东西 dictionary1 required value1 one value2 two optional value1 one dic
使 Java 类通用，但仅适用于两种或三种类型

我很惊讶在 stackoverflow 上找不到这个问题我只能将其归咎于我的谷歌搜索不佳无论如何都要指出重复的问题这是一个玩具类它返回与您放入其中的内容相反的内容目前它适用于整数但只需要非常小的更改即可适用于字符串 public
如何在SceneKit中从Collada文件中分离出多个动画

我正在将第三方 dae Collada 文件作为场景加载到 SceneKit 项目中 dae 文件中有许多不同的动画设置在不同的时间帧我试图弄清楚如何将它们分开并通过引用名称引用每个单独的动画 dae 文件中没有易于理解的参考名称动
如何从 Jupyter 4.x 获取 IPython 配置文件行为？

官方建议运行 IPython Notebook 服务器并通过以下方式创建配置文件 ipython profile create nbserver 正如推荐的http ipython org ipython doc 1 interacti
DropCreateDatabaseAlways 未调用种子

我在自定义数据库初始值设定项上调用 Seed 方法时遇到问题我正在使用 EF 5 0 并具有以下代码 public static class MyDatabase public static void Initialize Databas
是否可以使用gdb和qemu同时调试linux用户空间程序和内核空间？

到目前为止使用 gdb qemu 我可以单步执行 Linux 内核源代码是否可以同时调试用户空间程序例如将程序从用户空间单步执行到内核空间这样我就可以通过发出以下命令来观察 qemu 监视器上寄存器的变化info register
在 foreach 循环内手动增加枚举器

我在 foreach 循环内有一个嵌套的 while 循环我想在满足特定条件时无限期地推进枚举器为此我尝试将枚举器转换为 IEnumerator 如果它位于 foreach 循环中则必须如此然后在转换的对象上调用 MoveNext
网络编程：是否维护套接字？

我目前正在将 API 从 C 转换为具有网络组件的 Java C 版本似乎在使用其类期间保持输入和输出流以及套接字打开它是否正确记住应用程序根据用户输入发送命令和接收事件为每个消息打开一个新的套接字流是否更明智我正在维护一个 S
如何在 JavaScript 中取消移动或添加到参数对象的开头

我刚刚学会了弹出第一个元素的约定arguments array 我还了解到这实际上是一个Object 现在我需要做相反的事情我需要使用一个unshift将值添加到开头的操作arguments数组或Object就像一个数组这可能吗我试
R 中 stri_detect_regex 错误

我收到此错误 stri detect regex string pattern opts regex opts pattern 中的错误正则表达式模式中的括号嵌套不正确 U REGEX MISMATCHED PAREN 当我运行代码时 f
画布中的矩形尺寸错误

我正在实现一个颜色选择器渲染有问题当我打电话时c fillRect 0 0 100 80 该矩形的大小是 103x42 像素而不是 100x80 这里有什么问题吗此外矩形是抗锯齿的我是否需要将位置偏移 0 5 0 5 以避免 A
线性 SVM 模型的权重（在 R 中）？

Using kernlab我用如下代码训练了一个模型 my model lt ksvm result f1 f2 f3 data gold kernel vanilladot 由于它是一个线性模型我更喜欢在运行时将分数计算为特征值的简单加
CXF/ JAX-RS ：从拦截器返回自定义响应

当REST调用过程中发生异常时我们需要返回自定义的错误代码和错误消息我们创建了一个异常映射器提供程序它适用于应用程序代码中的异常但是当 CXF 代码发生异常时例如我编写的 CustomValidationInterceptor
如何在可变参数模板中匹配空参数包

我有代码 template
在 Xamarin.Forms 中使用 Thread.Sleep

我想执行以下操作 MainPage new ContentPage Content new StackLayout Children new Button Text Thread Sleep Command new Command gt T
确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中

我使用 CMake 作为我的代码的构建系统其中涉及 CUDA 我正在考虑将决定哪个任务自动化compute XX and arch XX我需要传递给我的 nvcc 以便为我当前计算机上的 GPU 进行编译有没有办法做到这一点使用 NV

确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中

确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中 的相关文章

随机推荐

热门标签

确定 nvcc 需要哪些 gencode（compute_、arch_）值 - 在 CMake 中的相关文章