cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

2023-11-19

初学CUDA，使用的NVIDIA显卡是Tesla K80, 安装的是cuda8.0

写了一个简单的测试程序，使用nvcc编译，指令如下： nvcc cudaPrintDeviceInfo.cu -o cudaPrintDeviceInfo

本以为会很顺利地生成执行文件。但还是出现了warning:

nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).

查阅了一些资料，发现这只是提示build target 2.0, 2.1被弃用了。

如果不想让这些提示出现，只需要在编译时加上一个参数，表示基于自己显卡的计算能力选择build target即可。

Tesla K80支持CUDA compute ability 3.7, 因此在编译时使用如下命令：

nvcc -arch=sm_35 cudaPrintDeviceInfo.cu -o cudaPrintDeviceInfo

即可解决问题。

可参考： http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#warp-examples-broadcast

其中Application Compatibility部分有如下解释：

YES！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

nvcc warning

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法的相关文章

如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
某些子网格未使用 CUDA 动态并行执行

我正在尝试 CUDA 5 0 GTK 110 中的新动态并行功能我遇到了一个奇怪的行为即我的程序没有返回某些配置的预期结果不仅是意外的而且每次启动都会出现不同的结果现在我想我找到了问题的根源似乎当生成太多子网格时某些子网格由
如何用Go语言的cgo编译Cuda源码？

我用 cuda c 编写了一个简单的程序它可以在 eclipse nsight 上运行这是源代码 include
Golang调用CUDA库

我正在尝试从 Go 代码中调用 CUDA 函数我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
CUDA：如何在设备上填充动态大小的向量并将其内容返回到另一个设备函数？

我想知道哪种技术可以填充设备上的动态大小数组 int row 在下面的代码中然后返回其内容以供另一个设备函数使用为了将问题置于上下文中下面的代码尝试使用在 GPU 上运行的高斯勒让德求积来跨越勒让德多项式基组中的任意函数 incl
用于类型比较的 Boost 静态断言

以下问题给我编译器错误我不知道如何正确编写它 struct FalseType enum value false struct TrueType enum value true template
Cuda Bayer/CFA 去马赛克示例

我编写了一个 CUDA4 Bayer 去马赛克例程但它比在 16 核 GTS250 上运行的单线程 CPU 代码慢块大小是 16 16 图像暗淡是 16 的倍数但更改此值并不会改善它我做了什么明显愚蠢的事情吗 calling rou
为什么 gcc 和 NVCC (g++) 会看到两种不同的结构大小？

我正在尝试将 CUDA 添加到 90 年代末编写的现有单线程 C 程序中为此我需要混合两种语言 C 和 C nvcc 是 c 编译器问题在于 C 编译器将结构视为特定大小而 C 编译器将相同的结构视为略有不同的大小那很糟我对此感
“计算能力”是什么意思？ CUDA？

我是CUDA编程新手对此了解不多您能告诉我 CUDA 计算能力是什么意思吗当我在大学服务器上使用以下代码时它向我显示了以下结果 for device 0 device lt deviceCount device cudaDevic
同时使用 2 个 GPU 调用 cudaMalloc 时性能较差

我有一个应用程序可以在用户系统上的 GPU 之间分配处理负载基本上每个 GPU 都有一个 CPU 线程来启动一个GPU处理间隔当由主应用程序线程定期触发时考虑以下图像使用 NVIDIA 的 CUDA 分析器工具生成作为示例GPU
CUDA素数生成

当数据大小增加超过 260k 时我的 CUDA 程序停止工作它不打印任何内容有人能告诉我为什么会发生这种情况吗这是我的第一个 CUDA 程序如果我想要更大的素数如何在 CUDA 上使用大于 long long int 的数据类型
多个进程可以共享一个 CUDA 上下文吗？

这个问题是 Jason R 的后续问题comment https stackoverflow com questions 29964392 multiple cuda contexts for one device any sense co
cuda cpu功能-gpu内核重叠

我在尝试开发以练习 CUDA 的 CUDA 应用程序时遇到并发问题我想通过使用 cudaMemecpyAsync 和 CUDA 内核的异步行为来共享 GPU 和 CPU 之间的工作但我无法成功重叠 CPU 执行和 GPU 执行它与主机
cuda 共享内存 - 结果不一致

我正在尝试并行缩减以对 CUDA 中的数组求和目前我传递一个数组来存储每个块中元素的总和这是我的代码 include
CUDA线程执行顺序

我有一个 CUDA 程序的以下代码 include
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
__device__ __constant__ 常量

有什么区别吗在 CUDA 程序中定义设备常量的最佳方法是什么在 C 主机设备程序中如果我想将常量定义在设备常量内存中我可以这样做 device constant float a 5 constant float a 5 问题 1
cudaMemcpy() 与 cudaMemcpyFromSymbol()

我试图找出原因cudaMemcpyFromSymbol 存在似乎 symbol func 可以做的所有事情 nonSymbol cmd 也可以做 symbol func 似乎可以轻松移动数组或索引的一部分但这也可以使用 nonSymbo
“gld/st_throughput”和“dram_read/write_throughput”指标之间有什么区别？

在 CUDA 可视化分析器版本 5 中我知道 gld st requested throughput 是应用程序请求的内存吞吐量然而当我试图找到硬件的实际吞吐量时我很困惑因为有两对似乎合格的指标它们是 gld st throug
CUDA 5.0错误LNK2001：cuda方法无法解析的外部符号

我的链接器有错误 1 gt ManifestResourceCompile 1 gt All outputs are up to date 1 gt kernel cu obj error LNK2001 unresolved extern

随机推荐

linux下安装中文输入法及vim支持中文的方法

最近折腾Ubuntu 之前一直是用英文显示系统输入法也是Ubuntu14默认的拼音一开始也没觉得不好可是在vim编辑文档时需要添加注释这就显得十分不方便所以花点时间来解决这个问题一开始是想找vim如何支持中文的方法网络上的各
Springboot Maven显示缺少org.junit.jupiter.api

原因 spring boot 2 2 之前使用的是 Junit4 而后续的使用的是Junit5 导致缺少包解决方法导入包
C语言-多选题

C语言多选题 1 若有字符串char string和缓冲区char buf MAX LEN string非空并且缓冲区长度MAX LEN大于string的长度则将字符串string复制到缓冲区buf 下列做法正确的是 AB A spri
CentOS 7查看磁盘空间

CentOS如何查看硬盘大小 CentOS是一种基于Linux的操作系统主要用于服务器端应用在服务器管理中硬盘大小是一个非常重要的指标查看硬盘大小可以帮助系统管理员有效地管理硬盘空间和避免硬盘满了的情况方法一使用df命令 df命
Unity 用脚本操作常用UI控件（上）

控件介绍在界面系统的术语中将一个具有独立状态外观和操作的对象称为控件例如常用的交互控件有按钮输入框滑动条等常见的非交互式控件有文本标签图片等 Unity采用了父子物体和组件的设计思想其每个界面控件往往也是由游戏物体挂载
虚拟内存的最大容量与实际容量区别

虚拟内存的最大容量与实际容量区别 1 概念介绍虚拟内存的最大容量是计算机的地址结构 CPU寻址范围决定的虚拟内存的实际容量是内存与外存之和 CPU寻址范围两者的最小值 2 例题介绍某计算机的地址结构是64位按字节编址内存大小51
找准边界，吃定安全

潜在的网络威胁网络安全挑战层出不穷如何确保网络安全山石云景赋能中小企业安全运营让安全更有效找准边界吃定安全往期文章从访问控制谈起再看零信任模型威胁情报加持泛边界下的全局主动防御体系如何着手流量剧增看山石网科如何打
UWB与蓝牙AOA定位技术简要对比

1 UWB基本原理 UWB 超宽带技术是基于IEEE802 15 4a z标准的利用纳秒级窄脉冲进行数据传输的无线通信技术主要服务于微位置 micro location a person s placement to within a
java中如何将Long类型转为Integer类型

注意不能直接在前面加个 int 而是将Long型转换为int型这里的Long型是包装类型 Long a 10 int b a intValue 即long intValue
Hx711调试过程

1 体重板子最开始出现的问题无法下载程序指示灯不亮解决办法检查电源复位晶振发现晶振还有 boot键坏了 2 问题下载进程序以后板子通过串口发到电脑上的数据不变解决办法先是查了关于HX711的各种资料了解到 HX711芯片
pycharm内存不足时如何修改设置？

Help gt Find Action gt type VM Options gt Click Edit Custom VM Options Pycharm 2016 2 will open the appropriate vmoption
MFC中操作Word文档

首先我们需要导入word类库电脑上需要安装了word 左击项目点击类向导添加类 C 选择类型库中的MFC类本文章案例可点击下载然后选择文件位置选择从office安装目录中找到MSWORD OLB文件然后点击 gt gt 添加所
源码探索-ArrayList

ArrayList 继承与实现关系数组的相关属性 ArrayList底层是一个Object 数组既然是数组那么底层的工具类大多是会用到Arrays工具类去实现函数探索来看看构造函数有三个构造函数分别对应不同的生成内容来看看添
linux 2.6.30 内核编译提示 ‘make[1]: *** [arch/x86/vdso/vdso.so.dbg] Error 1’ 错误

linux 2 6 30 编译出现如下错误解决方案打开 linux 2 6 30 arch x86 vdso Makefile 文件 1 修改28行将 m elf x86 64 修改为 m64 2 修改72行将 m elf i386
语音识别学习记录 [再谈频率混叠（定量分析、离散采样后频谱的周期延拓）]

前几天在语音识别学习记录传说中的频率混叠和Nyquist定理定性理解中简单理解了一下频率混叠的原因但是也发现了很多不明白的问题 1 为什么信号经过傅里叶变换后在频域是关于y轴对称的这个问题的回答已经写在语音识别学习记录信号经傅里
vue的指令

Vue 的指令一 Vue 的指令 1 指令的概念指令 Directives 是 vue 为开发者提供的模板语法用于辅助开发者渲染页面的基本结构 vue 中的指令按照不同的用途可以分为如下 6 大类内容渲染指令属性绑定指令事件绑定
SQL 查询指定行数的数据。

今天遇到一个关于查询指定行数的数据的sql查询语句问题突然发现以前没怎么接触过刚才想起来了赶紧看了下文档又上网搜了下有了下面的东西不知道有没有什么地方不对 oracle 先看一下文档中关于any和all的例子很不错噢 An
Pytorch 深度强化学习模型训练速度慢

最近一直在用Pytorch来训练深度强化学习模型但是速度一直很慢 Gpu利用率也很低一起初开始在训练参数 batch size 200 graph size 40 epoch size 100000 训练速度一个epoch要4h 人麻
node学习openai库入门及使用（一）

第一章 node学习openai库入门及使用一文章目录第一章 node学习openai库入门及使用一前言一 node js的openai库是什么二使用步骤 1 引入库 2 发送请求总结前言众所周知目前chatgpt已
cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

初学CUDA 使用的NVIDIA显卡是Tesla K80 安装的是cuda8 0 写了一个简单的测试程序使用nvcc编译指令如下 nvcc cudaPrintDeviceInfo cu o cudaPrintDeviceInfo 本以为

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法 的相关文章

随机推荐

热门标签

cuda8.0使用nvcc编译程序出现warning:The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated的解决办法的相关文章