CUDA 使用解释器还是编译器?

2024-02-28

这是一个有点愚蠢的问题,但我想知道 CUDA 使用解释器还是编译器? 我很想知道,因为我不太确定 CUDA 如何设法让源代码在具有不同计算能力的两张卡上运行。


来自维基百科 http://en.wikipedia.org/wiki/CUDA:

程序员使用“C for CUDA”(具有 Nvidia 扩展和某些限制的 C),通过 PathScale Open64 C 编译器进行编译。

所以,你的答案是:它使用编译器。

并谈谈它可以在多张卡上运行的原因(source http://developer.nvidia.com/cuda-faq):

CUDA C/C++ 提供了一种抽象,它是您表达程序如何执行的一种方式。编译器生成的 PTX 代码也不是特定于硬件的。在运行时,PTX 会针对特定目标 GPU 进行编译 - 这是驱动程序的责任,每次发布新 GPU 时都会更新驱动程序。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA 使用解释器还是编译器? 的相关文章

  • 使用 CUDA __device__ 函数时出现链接器错误 2005 和 1169(多重定义的符号)(默认情况下应内联)

    这个问题与以下问题有很大关系 A 如何将CUDA代码分成多个文件 https stackoverflow com questions 2090974 how to separate cuda code into multiple files
  • 在新线程中调用支持 CUDA 的库

    我编写了一些代码并将其放入它自己的库中 该库使用 CUDA 在 GPU 上进行一些处理 我正在使用 Qt 构建 GUI 前端 作为加载 GUI 的一部分 我调用 CUresult res CUdevice dev CUcontext ctx
  • Golang调用CUDA库

    我正在尝试从 Go 代码中调用 CUDA 函数 我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
  • CUDA程序导致nvidia驱动程序崩溃

    当我超过大约 500 次试验和 256 个完整块时 我的 monte carlo pi 计算 CUDA 程序导致我的 nvidia 驱动程序崩溃 这似乎发生在 monteCarlo 内核函数中 任何帮助都会受到赞赏 include
  • 多个进程可以共享一个 CUDA 上下文吗?

    这个问题是 Jason R 的后续问题comment https stackoverflow com questions 29964392 multiple cuda contexts for one device any sense co
  • cuda cpu功能-gpu内核重叠

    我在尝试开发以练习 CUDA 的 CUDA 应用程序时遇到并发问题 我想通过使用 cudaMemecpyAsync 和 CUDA 内核的异步行为来共享 GPU 和 CPU 之间的工作 但我无法成功重叠 CPU 执行和 GPU 执行 它与主机
  • __syncthreads() 死锁

    如果只有部分线程执行 syncthreads 会导致死锁吗 我有一个这样的内核 global void Kernel int N int a if threadIdx x
  • Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

    我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
  • 在 __device/global__ CUDA 内核中动态分配内存

    根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页 可
  • Cuda 6.5 找不到 - libGLU。 (在 ubuntu 14.04 64 位上)

    我已经在我的ubuntu上安装了cuda 6 5 我的显卡是 GTX titan 当我想要制作 cuda 样本之一时 模拟 粒子 我收到这条消息 gt gt gt WARNING libGLU so not found refer to C
  • 尝试构建我的 CUDA 程序时出现错误 MSB4062

    当我尝试构建我的第一个 GPU 程序时 出现以下错误 有什么建议可能会出什么问题吗 错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务 无法从程序集 C Program 加载 文件 M
  • TensorRT 多线程

    我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它 其中 Cuda 上下文与所有线程一起使用 在单个线程中一切正常 我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
  • 有没有一种有效的方法来优化我的序列化代码?

    这个问题缺乏细节 因此 我决定创建另一个问题而不是编辑这个问题 新问题在这里 我可以并行化我的代码吗 还是不值得 https stackoverflow com questions 17937438 can i parallelize my
  • 从 CUDA 设备写入输出文件

    我是 CUDA 编程的新手 正在将 C 代码重写为并行 CUDA 新代码 有没有一种方法可以直接从设备写入输出数据文件 而无需将数组从设备复制到主机 我假设如果cuPrintf存在 一定有地方可以写一个cuFprintf 抱歉 如果答案已经
  • CUDA、NPP 滤波器

    CUDA NPP 库支持使用 nppiFilter 8u C1R 命令过滤图像 但不断出现错误 我可以毫无问题地启动并运行 boxFilterNPP 示例代码 eStatusNPP nppiFilterBox 8u C1R oDeviceS
  • CUDA - 将 CPU 变量传输到 GPU __constant__ 变量

    与 CUDA 的任何事情一样 最基本的事情有时也是最难的 所以 我只想将变量从 CPU 复制到 GPUconstant变量 我很难过 这就是我所拥有的 constant int contadorlinhasx d int main int
  • OS X 10.8 上的 PyCuda / 多处理问题

    我正在开发一个项目 将计算任务分配给多个 python 进程 每个进程都与其自己的 CUDA 设备关联 生成子进程时 我使用以下代码 import pycuda driver as cuda class ComputeServer obje
  • CUDA:获取数组中的最大值及其索引

    我有几个块 每个块在整数数组的单独部分上执行 举个例子 块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么 示例块一 a 0 到 a 10 具有以下
  • 有条件减少 CUDA

    我需要总结一下100000值存储在数组中 但带有条件 有没有办法在 CUDA 中做到这一点以快速产生结果 任何人都可以发布一个小代码来做到这一点吗 我认为 要执行条件约简 您可以直接将条件引入为乘法0 假 或1 真 加数 换句话说 假设您希
  • CUDA 添加矩阵的行

    我试图将 4800x9600 矩阵的行加在一起 得到一个 1x9600 的矩阵 我所做的是将 4800x9600 分成 9 600 个矩阵 每个矩阵长度为 4800 然后我对 4800 个元素进行缩减 问题是 这真的很慢 有人有什么建议吗

随机推荐

  • 解压一个文件,然后一步一步在控制台显示

    我可以通过 ssh 访问远程服务器 我在服务器上只有读 无写 访问权限 我想阅读一个压缩日志文件 但是因为我只有读取权限 所以我无法先提取文件然后读取它 因为当我尝试解压缩时 我收到消息Read only file system 我的想法是
  • React 中何时使用花括号以及何时使用角度

    例如 function Avatar props return img src props user avatarUrl alt function Comment props return div div div div
  • 为什么在使用 GString 时,groovy 映射键评估在类似情况下表现不同?

    我希望有人向我解释为什么以下内容是正确的 def t test assert test 1 test 1 1 expected assert t 1 test 1 2 unexpected assert t 1 test 1 3 unexp
  • Rails 中 Factory Girl 的单表继承

    我正在做一个Rails 4 0 1应用程序使用Capybara and FactoryGirl但我无法让我的测试正常工作 我正在使用单表继承来制作Collection lt ActiveRecord Base and a VideoColl
  • 如何使用 Autofixture 创建和填充我的模拟类?

    目前 我正在使用 EF6 在 UnitOfWork 内实现我的存储库 我还创建了一个内存中模拟实现 MockUnitOfWork 和 MockRepository 以便我可以在单元测试中使用它们 但是我现在必须处理对象的繁琐设置 这不就是
  • CFBuilder 没有在断点处停止

    既然这个问题 Eclipse 不会在断点处停止 https stackoverflow com questions 4388192 eclipse doesnt stop at breakpoints 处理 eclipse 本身 CFBui
  • rpm-maven-plugin 参数“sourceEncoding”丢失或无效

    我正在尝试使用 rpm maven 插件 但出现以下错误 错误 无法在项目 TestRpmAndDocker 上执行目标 org codehaus mojo rpm maven plugin 2 1 3 rpm generate rpm 目
  • 使用带有索引位置的 addChild

    当我添加子节点时 如何根据它的兄弟节点选择它的位置 这是一个例子
  • 在 Python 中将 float.hex() 值转换为二进制

    我想知道如何转换返回的结果float hex 到二进制 例如 从0x1 a000000000000p 2 to 110 1 有人可以帮忙吗 谢谢 def float to binary num exponent 0 shifted num
  • 如何在 dart 中等待 Map.forEach()

    我有一个返回地图的 Future 然后 我需要使用该映射的值来等待另一个未来 然后在最后返回整个结果 问题是 dart 不能等待async Map forEach 方法 参见 https stackoverflow com a 424678
  • 将 postgres 函数与查询结合起来

    我目前正在努力处理结果集中需要的 sql 函数的输出 SELECT getAdditionalInfoAboutDate date from sampleCalendar 问题是 我通过以下方式得到结果 属性1 属性2 属性3 属性2 属性
  • 如何使用toggle()在jquery中设置cookie

    当用户单击链接时 寻找要设置的 cookie 它将打开 div 然后用户可以刷新页面并看到 div 仍然打开 HTML a class show settings href a jQuery function Toggle Settings
  • Oracle 中的标识符太长

    我正在尝试在 SQL Developer 中创建表 但收到此错误 错误 SQL ORA 00972 标识符太长 CREATE TABLE PACIENTE IdentificacionID number 5 TipoIdentificaci
  • 在 ASP.Net Core MVC 中使用 AJAX 提交表单

    我正在使用 ASP Net Core 2 1 并尝试在返回文件的 url 时上传文件 而不刷新页面 我正在尝试在 site js 中编写 JavaScript 因为 RenderPartial scripts 在页面末尾呈现所有脚本 因此在
  • Cassandra CQL 通配符搜索

    我有一个像这样的表结构 创建表文件 id 文本主键 fname 文本 mimetype 文本 isdir 布尔值 位置文本 在文件 位置 上创建索引 file location 表中内容如下 插入文件 id fname mimetype i
  • 将 Reactjs 连接到 Myqtthub

    您好 我对所有物联网事物都很陌生 我希望能够使用 mqtt 从 Arduino 发送和接收数据https myqtthub com https myqtthub com作为我们的经纪人 我使用以下代码进行连接 import React Co
  • 傅里叶变换+emgucv

    谁能告诉我这段代码有什么问题吗 基本上我正在尝试计算图像的 dft 并将其显示为屏幕上的图像 Image
  • 发布的歌曲 URL 是否是 Facebook 的嵌入式音乐播放器?

    我们希望我们的会员能够分享我们网站上的歌曲 并能够在 Facebook 帖子中收听这些歌曲 SoundCloud 能够做到这一点 如他们在他们的页面在这里 https www facebook com soundcloud 他们是通过成为白
  • MATLAB 中的字符串索引:单引号与双引号

    我有一个字符串矩阵 如下所示 readFiles 11221 09 11222 13 12821 06 13521 02 13522 13 13711 05 13921 01 14521 001 15712 003 它们用于以自动方式访问某
  • CUDA 使用解释器还是编译器?

    这是一个有点愚蠢的问题 但我想知道 CUDA 使用解释器还是编译器 我很想知道 因为我不太确定 CUDA 如何设法让源代码在具有不同计算能力的两张卡上运行 来自维基百科 http en wikipedia org wiki CUDA 程序员