CUDA SASS 到 Cubin

2023-12-05

通过 CuObjDump 可以使用 Cubin 文件生成 SASScuobjdump -sass <input file>,但是有什么办法可以将SASS转换回Cubin吗?


官方 NVIDIA CUDA 工具链中不提供任何“汇编程序”。 NVIDIA 工具链可以采用 CUDA C/C++ 或 PTX,并将其转换为 cubin 或其他可执行格式。

然而,有一些社区开发的汇编器:

也许目前最新的一个(可能是目前唯一值得考虑的一个)是maxas.

还有一个更老的asfermi在费米一代 CUDA GPU 中开发。我认为它没有被更新或维护。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA SASS 到 Cubin 的相关文章

  • CUDA素数生成

    当数据大小增加超过 260k 时 我的 CUDA 程序停止工作 它不打印任何内容 有人能告诉我为什么会发生这种情况吗 这是我的第一个 CUDA 程序 如果我想要更大的素数 如何在 CUDA 上使用大于 long long int 的数据类型
  • 多个进程可以共享一个 CUDA 上下文吗?

    这个问题是 Jason R 的后续问题comment https stackoverflow com questions 29964392 multiple cuda contexts for one device any sense co
  • cuda 共享内存 - 结果不一致

    我正在尝试并行缩减以对 CUDA 中的数组求和 目前我传递一个数组来存储每个块中元素的总和 这是我的代码 include
  • 如何并行从数组中删除零值

    如何使用 CUDA 并行有效地从数组中删除零值 有关零值数量的信息是预先可用的 这应该可以简化这项任务 重要的是数字必须保持源数组中的顺序 当被复制到结果数组时 Example 该数组将例如包含以下值 0 0 19 7 0 3 5 0 0
  • 运行时 API 应用程序中的 cuda 上下文创建和资源关联

    我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联 我知道这是由驱动程序 API 在幕后完成的 但我想了解一下创作的时间线 首先 我知道 cudaRegisterFatBinary 是第一个 cuda a
  • CUDA线程执行顺序

    我有一个 CUDA 程序的以下代码 include
  • CUDA 估计 2D 网格数据的每块线程数和块数

    首先我要说的是 我已经仔细阅读了所有类似的问题 确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
  • __syncthreads() 死锁

    如果只有部分线程执行 syncthreads 会导致死锁吗 我有一个这样的内核 global void Kernel int N int a if threadIdx x
  • Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

    我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
  • cudaSetDevice() 对 CUDA 设备的上下文堆栈有何作用?

    假设我有一个与设备关联的活动 CUDA 上下文i 我现在打电话cudaSetDevice i 会发生什么 Nothing 主上下文取代了堆栈顶部 主上下文被压入堆栈 事实上 这似乎是不一致的 我编写了这个程序 在具有单个设备的机器上运行 i
  • 如何为 CUDA 内核选择网格和块尺寸?

    这是一个关于如何确定CUDA网格 块和线程大小的问题 这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段 见下文 我
  • 无法在内存位置找到异常源:cudaError_enum

    我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常 内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I
  • 内联 PTX 汇编代码强大吗?

    我看到一些代码示例 人们在 C 代码中使用内联 PTX 汇编代码 CUDA工具包中的文档提到PTX很强大 为什么会这样呢 如果我们在 C 代码中使用这样的代码 我们会得到什么好处 内联 PTX 使您可以访问未通过 CUDA 内在函数公开的指
  • 通过 cuFFT 进行逆 FFT 缩放

    每当我使用 cuFFT 绘制程序获得的值并将结果与 Matlab 的结果进行比较时 我都会得到相同形状的图形 并且最大值和最小值位于相同的点 然而 cuFFT 得到的值比 Matlab 得到的值大得多 Matlab代码是 fs 1000 s
  • 具有 Cuda Thrust 的多个 GPU?

    如何将 Thrust 与多个 GPU 一起使用 这只是使用 cudaSetDevice deviceId 的问题吗 然后运行相关的 Thrust 代码 使用 CUDA 4 0 或更高版本 cudaSetDevice deviceId 接下来
  • CUDA:获取数组中的最大值及其索引

    我有几个块 每个块在整数数组的单独部分上执行 举个例子 块一从 array 0 到 array 9 块二从 array 10 到 array 20 我可以获得每个块的数组最大值的索引的最佳方法是什么 示例块一 a 0 到 a 10 具有以下
  • 有条件减少 CUDA

    我需要总结一下100000值存储在数组中 但带有条件 有没有办法在 CUDA 中做到这一点以快速产生结果 任何人都可以发布一个小代码来做到这一点吗 我认为 要执行条件约简 您可以直接将条件引入为乘法0 假 或1 真 加数 换句话说 假设您希
  • CUDA 添加矩阵的行

    我试图将 4800x9600 矩阵的行加在一起 得到一个 1x9600 的矩阵 我所做的是将 4800x9600 分成 9 600 个矩阵 每个矩阵长度为 4800 然后我对 4800 个元素进行缩减 问题是 这真的很慢 有人有什么建议吗
  • CUDA 模型 - 什么是扭曲尺寸?

    最大工作组大小和扭曲大小之间有什么关系 假设我的设备有 240 个 CUDA 流处理器 SP 并返回以下信息 CL DEVICE MAX COMPUTE UNITS 30 CL DEVICE MAX WORK ITEM SIZES 512
  • 无法在 CUDA 中找到 1 到 100 数字的简单和?

    我正在研究使用 CUDA 的图像处理算法 在我的算法中 我想使用 CUDA 内核找到图像所有像素的总和 所以我在cuda中制作了内核方法 来测量16位灰度图像的所有像素的总和 但我得到了错误的答案 所以我在cuda中编写了一个简单的程序来查

随机推荐

  • jQuery 插件:添加回调功能

    我正在尝试提供我的插件回调功能 并且我希望它以某种传统的方式运行 myPlugin options function code to execute or myPlugin options anotherFunction 如何在代码中处理该
  • 从 Android 中的 TelephonyManager 检索 Line1 号码

    TelephonyManager manager1 TelephonyManager getSystemService Context TELEPHONY SERVICE String strMobile1 manager1 getLine
  • 如何在 com 自动化中启动特定的 excel 版本?

    我通过 COM 自动化 在 c 中 使用 Excel 但问题似乎无法控制在盒子上启动哪个版本的 excel 我们同时使用 Excel 9 和 Excel 11 并且一组特定的电子表格需要 excel 9 否则它们不会工作的 我包含了 exc
  • 在 CMakeLIsts.txt 中只编写 target_link_libraries(不指定包含路径)

    我发现当我使用target link libraries在 CMaksList txt 中 我忽略包含路径 target include directories 并成功运行应用程序 例如 cmake minimum required VER
  • 自动删除 Subversion 未版本控制的文件

    有谁知道一种方法来递归删除工作副本中不受版本控制的所有文件 我需要这个才能在自动构建 VMware 中获得更可靠的结果 这在 bash 中对我有用 svn status egrep cut c8 xargs rm 塞斯 雷诺的更好 svn
  • Admob 碎片

    我使用 appcompact 创建了一个空项目 并尝试向其中添加 AdMob 块 片段 main xml
  • 如何从 Sinatra 中的 URL 检测语言

    我有一个多语言网站 我将语言放入 URL 中 例如domain com en 当用户没有将语言放入 URL 中时 我想将他重定向到主要语言的页面 例如 domain com posts 到 domain com en posts 有没有简单
  • 使用 MVVM 在 wpf 中进行对话框的做法是好是坏?

    我最近遇到了为我的 wpf 应用程序创建添加和编辑对话框的问题 我想要在我的代码中做的就是这样的事情 我主要使用视图模型优先方法和 mvvm ViewModel 调用对话框窗口 var result this uiDialogService
  • 警报无法唤醒我的服务

    我有以下代码 我希望无论电话状态如何 此警报都会调用我的服务 即使它处于睡眠模式 我也需要它来访问互联网并进行一些网络调用 为什么手机处于睡眠模式时不起作用 报警管理器 Calendar cal Calendar getInstance c
  • R 聚合错误:“替换有 行,数据有

    我正在尝试聚合数据框 但收到一个我不明白的错误 我有一个名为 M15 的数据框 它包含 33 个变量的 200k 条记录 我无法使用可以与社区共享的数据重现此错误 M15 lt M15backup c 600 700 setting the
  • 添加 Visual Studio 2015 的先决条件

    I want to add new prerequisites to visual studio 2015 but can not find out the solution 如您所见 Visual Studio 2015 缺少先决条件 V
  • swiftui、动画应用于父效果子动画(下)

    上一个问题 swiftui 动画应用于父效果子动画 现在 TextView 有了自己的状态 RectangleView 和 TextView 在 3 秒内滑入屏幕 但 TextView 滑动一秒后状态发生变化 现在可以看到TextView停
  • javafx Bindings.createStringBinding 但绑定实际上不起作用

    我正在尝试绑定textProperty of the Label到对象的SimpleIntegerProperty在 的帮助下Bindings但当我更改时它不会更改文本SimpleIntegerProperty实时显示对象的信息 任何有关如
  • SQL使用unix时间戳计算一个月内的记录

    我试图返回每个月内的记录数 并按月 年对结果进行分组 架构看起来像这样 id title timestamp 我一直在四处寻找 但无法得到我期望的结果 谢谢 设置时间戳的格式 然后按其分组 按月分组 SELECT DATE FORMAT t
  • 保护 Android 应用程序敏感数据的最佳方法?

    是的 这是一个非常普遍的问题 但我试图了解处理与将敏感数据分发到应用程序的网络服务器相关的应用程序的最佳方法 任何链接 一般信息建议等 将不胜感激 由于应用程序会在一定时间内存储从数据库检索到的持久数据 一切都变得有些敏感 在设备上存储敏感
  • 使用 R:创建一个新列,计算“n”个其他列中“n”个条件发生的次数

    我有第 1 列和第 2 列 ID 和值 接下来 我想要一个计数列 列出每个 id 出现相同值的次数 如果发生多次 显然会重复该值 该数据集中还有其他变量 但新的计数变量只需以其中 2 个为条件 我已经浏览了这个博客 但我找不到一种方法使新变
  • 无法将整数从 javascript 传递到 npapi 插件

    我正在编写一个简单的napapi插件 我必须在html页面中打印从javascript函数传递的值 但我在做的时候遇到了问题 它在火狐浏览器上运行正常 但我想在 qt fancybrowser 示例上执行此操作 无论我在 javascrip
  • 将 for 循环的输出保存在单独的数据帧中

    我有一个简单的问题 尽管有很多类似的帖子 但我一直无法解决 因为我在 R 方面有点笨蛋 而且我没有得到我应该得到的任何东西 我有两组文件 All Files lt objects pattern constant country 0 9 4
  • 在 Node.js 中加载基本 HTML

    我正在尝试找出如何加载和渲染基本的 HTML 文件 这样我就不必编写如下代码 response write p blahblahblah p 我刚刚发现one方式使用FS库 我不确定它是否是最干净的 var http require htt
  • CUDA SASS 到 Cubin

    通过 CuObjDump 可以使用 Cubin 文件生成 SASScuobjdump sass