CUDA 使用解释器还是编译器？

2024-02-28

这是一个有点愚蠢的问题，但我想知道 CUDA 使用解释器还是编译器？我很想知道，因为我不太确定 CUDA 如何设法让源代码在具有不同计算能力的两张卡上运行。

来自维基百科 http://en.wikipedia.org/wiki/CUDA:

程序员使用“C for CUDA”（具有 Nvidia 扩展和某些限制的 C），通过 PathScale Open64 C 编译器进行编译。

所以，你的答案是：它使用编译器。

并谈谈它可以在多张卡上运行的原因（source http://developer.nvidia.com/cuda-faq):

CUDA C/C++ 提供了一种抽象，它是您表达程序如何执行的一种方式。编译器生成的 PTX 代码也不是特定于硬件的。在运行时，PTX 会针对特定目标 GPU 进行编译 - 这是驱动程序的责任，每次发布新 GPU 时都会更新驱动程序。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

CUDA 使用解释器还是编译器？的相关文章

使用 CUDA __device__ 函数时出现链接器错误 2005 和 1169（多重定义的符号）（默认情况下应内联）

这个问题与以下问题有很大关系 A 如何将CUDA代码分成多个文件 https stackoverflow com questions 2090974 how to separate cuda code into multiple files
在新线程中调用支持 CUDA 的库

我编写了一些代码并将其放入它自己的库中该库使用 CUDA 在 GPU 上进行一些处理我正在使用 Qt 构建 GUI 前端作为加载 GUI 的一部分我调用 CUresult res CUdevice dev CUcontext ctx
Golang调用CUDA库

我正在尝试从 Go 代码中调用 CUDA 函数我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
CUDA程序导致nvidia驱动程序崩溃

当我超过大约 500 次试验和 256 个完整块时我的 monte carlo pi 计算 CUDA 程序导致我的 nvidia 驱动程序崩溃这似乎发生在 monteCarlo 内核函数中任何帮助都会受到赞赏 include
多个进程可以共享一个 CUDA 上下文吗？

这个问题是 Jason R 的后续问题comment https stackoverflow com questions 29964392 multiple cuda contexts for one device any sense co
cuda cpu功能-gpu内核重叠

我在尝试开发以练习 CUDA 的 CUDA 应用程序时遇到并发问题我想通过使用 cudaMemecpyAsync 和 CUDA 内核的异步行为来共享 GPU 和 CPU 之间的工作但我无法成功重叠 CPU 执行和 GPU 执行它与主机
__syncthreads() 死锁

如果只有部分线程执行 syncthreads 会导致死锁吗我有一个这样的内核 global void Kernel int N int a if threadIdx x
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
在 __device/global__ CUDA 内核中动态分配内存

根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页可
Cuda 6.5 找不到 - libGLU。（在 ubuntu 14.04 64 位上）

我已经在我的ubuntu上安装了cuda 6 5 我的显卡是 GTX titan 当我想要制作 cuda 样本之一时模拟粒子我收到这条消息 gt gt gt WARNING libGLU so not found refer to C
尝试构建我的 CUDA 程序时出现错误 MSB4062

当我尝试构建我的第一个 GPU 程序时出现以下错误有什么建议可能会出什么问题吗错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务无法从程序集 C Program 加载文件 M
TensorRT 多线程

我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它其中 Cuda 上下文与所有线程一起使用在单个线程中一切正常我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
从 CUDA 设备写入输出文件

我是 CUDA 编程的新手正在将 C 代码重写为并行 CUDA 新代码有没有一种方法可以直接从设备写入输出数据文件而无需将数组从设备复制到主机我假设如果cuPrintf存在一定有地方可以写一个cuFprintf 抱歉如果答案已经
CUDA、NPP 滤波器

CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像但不断出现错误我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

与 CUDA 的任何事情一样最基本的事情有时也是最难的所以我只想将变量从 CPU 复制到 GPUconstant变量我很难过这就是我所拥有的 constant int contadorlinhasx d int main int
OS X 10.8 上的 PyCuda / 多处理问题

我正在开发一个项目将计算任务分配给多个 python 进程每个进程都与其自己的 CUDA 设备关联生成子进程时我使用以下代码 import pycuda driver as cuda class ComputeServer obje
CUDA：获取数组中的最大值及其索引

我有几个块每个块在整数数组的单独部分上执行举个例子块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么示例块一 a 0 到 a 10 具有以下
有条件减少 CUDA

我需要总结一下100000值存储在数组中但带有条件有没有办法在 CUDA 中做到这一点以快速产生结果任何人都可以发布一个小代码来做到这一点吗我认为要执行条件约简您可以直接将条件引入为乘法0 假或1 真加数换句话说假设您希
CUDA 添加矩阵的行

我试图将 4800x9600 矩阵的行加在一起得到一个 1x9600 的矩阵我所做的是将 4800x9600 分成 9 600 个矩阵每个矩阵长度为 4800 然后我对 4800 个元素进行缩减问题是这真的很慢有人有什么建议吗

随机推荐

解压一个文件，然后一步一步在控制台显示

我可以通过 ssh 访问远程服务器我在服务器上只有读无写访问权限我想阅读一个压缩日志文件但是因为我只有读取权限所以我无法先提取文件然后读取它因为当我尝试解压缩时我收到消息Read only file system 我的想法是
React 中何时使用花括号以及何时使用角度

例如 function Avatar props return img src props user avatarUrl alt function Comment props return div div div div
为什么在使用 GString 时，groovy 映射键评估在类似情况下表现不同？

我希望有人向我解释为什么以下内容是正确的 def t test assert test 1 test 1 1 expected assert t 1 test 1 2 unexpected assert t 1 test 1 3 unexp
Rails 中 Factory Girl 的单表继承

我正在做一个Rails 4 0 1应用程序使用Capybara and FactoryGirl但我无法让我的测试正常工作我正在使用单表继承来制作Collection lt ActiveRecord Base and a VideoColl
如何使用 Autofixture 创建和填充我的模拟类？

目前我正在使用 EF6 在 UnitOfWork 内实现我的存储库我还创建了一个内存中模拟实现 MockUnitOfWork 和 MockRepository 以便我可以在单元测试中使用它们但是我现在必须处理对象的繁琐设置这不就是
CFBuilder 没有在断点处停止

既然这个问题 Eclipse 不会在断点处停止 https stackoverflow com questions 4388192 eclipse doesnt stop at breakpoints 处理 eclipse 本身 CFBui
rpm-maven-plugin 参数“sourceEncoding”丢失或无效

我正在尝试使用 rpm maven 插件但出现以下错误错误无法在项目 TestRpmAndDocker 上执行目标 org codehaus mojo rpm maven plugin 2 1 3 rpm generate rpm 目
使用带有索引位置的 addChild

当我添加子节点时如何根据它的兄弟节点选择它的位置这是一个例子
在 Python 中将 float.hex() 值转换为二进制

我想知道如何转换返回的结果float hex 到二进制例如从0x1 a000000000000p 2 to 110 1 有人可以帮忙吗谢谢 def float to binary num exponent 0 shifted num
如何在 dart 中等待 Map.forEach()

我有一个返回地图的 Future 然后我需要使用该映射的值来等待另一个未来然后在最后返回整个结果问题是 dart 不能等待async Map forEach 方法参见 https stackoverflow com a 424678
将 postgres 函数与查询结合起来

我目前正在努力处理结果集中需要的 sql 函数的输出 SELECT getAdditionalInfoAboutDate date from sampleCalendar 问题是我通过以下方式得到结果属性1 属性2 属性3 属性2 属性
如何使用toggle()在jquery中设置cookie

当用户单击链接时寻找要设置的 cookie 它将打开 div 然后用户可以刷新页面并看到 div 仍然打开 HTML a class show settings href a jQuery function Toggle Settings
Oracle 中的标识符太长

我正在尝试在 SQL Developer 中创建表但收到此错误错误 SQL ORA 00972 标识符太长 CREATE TABLE PACIENTE IdentificacionID number 5 TipoIdentificaci
在 ASP.Net Core MVC 中使用 AJAX 提交表单

我正在使用 ASP Net Core 2 1 并尝试在返回文件的 url 时上传文件而不刷新页面我正在尝试在 site js 中编写 JavaScript 因为 RenderPartial scripts 在页面末尾呈现所有脚本因此在
Cassandra CQL 通配符搜索

我有一个像这样的表结构创建表文件 id 文本主键 fname 文本 mimetype 文本 isdir 布尔值位置文本在文件位置上创建索引 file location 表中内容如下插入文件 id fname mimetype i
将 Reactjs 连接到 Myqtthub

您好我对所有物联网事物都很陌生我希望能够使用 mqtt 从 Arduino 发送和接收数据https myqtthub com https myqtthub com作为我们的经纪人我使用以下代码进行连接 import React Co
傅里叶变换+emgucv

谁能告诉我这段代码有什么问题吗基本上我正在尝试计算图像的 dft 并将其显示为屏幕上的图像 Image
发布的歌曲 URL 是否是 Facebook 的嵌入式音乐播放器？

我们希望我们的会员能够分享我们网站上的歌曲并能够在 Facebook 帖子中收听这些歌曲 SoundCloud 能够做到这一点如他们在他们的页面在这里 https www facebook com soundcloud 他们是通过成为白
MATLAB 中的字符串索引：单引号与双引号

我有一个字符串矩阵如下所示 readFiles 11221 09 11222 13 12821 06 13521 02 13522 13 13711 05 13921 01 14521 001 15712 003 它们用于以自动方式访问某
CUDA 使用解释器还是编译器？

这是一个有点愚蠢的问题但我想知道 CUDA 使用解释器还是编译器我很想知道因为我不太确定 CUDA 如何设法让源代码在具有不同计算能力的两张卡上运行来自维基百科 http en wikipedia org wiki CUDA 程序员

CUDA 使用解释器还是编译器？

CUDA 使用解释器还是编译器？ 的相关文章

随机推荐

热门标签

CUDA 使用解释器还是编译器？的相关文章