优雅地崩溃内核

2024-02-24

后续：CUDA：停止所有其他线程 https://stackoverflow.com/questions/3735786/cuda-stop-all-other-threads

我正在寻找一种在发生“不良情况”时退出内核的方法。编程手册说 NVCC 不支持异常处理。我想知道是否有用户定义的 cuda 错误代码。换句话说，如果发生“坏”，则以该用户错误代码终止。我怀疑是否存在这种情况，所以我的另一个想法是引起一种情况。

比如，如果发生“坏事”，则除以零。但我不确定一个线程是否除以零，是否足以使整个内核崩溃，或者只是该线程崩溃？

有没有更好的方法来终止内核？

你应该首先阅读这个问题以及 harrism 和 tera 的回答 https://stackoverflow.com/questions/12505750/how-can-a-global-function-return-a-value-or-break-out-like-c-c-does（昨天问/回答）。

您可能会想使用类似的东西

if (there_is_an_error) {
  *status = MY_ERROR_CODE; // store to device pointer
  __threadfence();         // ensure store issued before trap
  asm("trap;");            // kill kernel with error
}

在我看来，这并不能完全满足你“优雅”的条件。 Trap导致内核退出并运行时报告cudaErrorUnknown。但是由于内核执行是异步的，因此您需要同步您的流/设备才能捕获此错误，这意味着在每次内核调用后进行同步，除非您可以接受不精确的错误（即您可能直到之后才捕获错误代码）调用后续 CUDA API 调用）。

但这正是 CUDA 中内核错误处理的方式，编写良好的代码应该在调试版本中同步以检查内核错误，并在发布版本中解决不精确的错误消息。不幸的是，我认为没有比这更优雅的方法了。

edit:在计算能力 2.0 及更高版本中，您可以使用assert() 来退出并在调试版本中出现错误。但尚不清楚这是否是您想要的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

优雅地崩溃内核的相关文章

使用 CMake 通过 NVCC 传递到 MSVC 的混淆标志

我有一个 CMake 文件用于在 Windows 上构建一些 CUDA NVCC MSVC 我正在尝试将 MSVC 警告级别设置为 W4 using add compile options lt
如何获取要执行的 PTX 文件

我知道如何生成 ptx文件来自 cu以及如何生成 cubin文件来自 ptx 但我不知道如何获得最终的可执行文件更具体地说我有一个sample cu文件编译为sample ptx 然后我使用 nvcc 来编译sample ptx to
加强托管线程和操作系统线程之间的关系（CUDA 用例）

Problem 我正在尝试创建一个与 net 良好集成的 CUDA 应用程序设计目标是拥有多个可以从托管代码调用的 CUDA 函数数据还应该能够在函数调用之间保留在设备上以便可以将其传递给多个 CUDA 函数重要的是每个单独的数据
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
cudaMemcpyToSymbol 的问题

我正在尝试复制到恒定内存但我不能因为我对 cudaMemcpyToSymbol 函数的用法有误解我正在努力追随this http developer download nvidia com compute cuda 4 1 rel t
在 cuda 的 nvcc 编译器中使用 C++20

我正在尝试使用std countr zero 函数从
“计算能力”是什么意思？ CUDA？

我是CUDA编程新手对此了解不多您能告诉我 CUDA 计算能力是什么意思吗当我在大学服务器上使用以下代码时它向我显示了以下结果 for device 0 device lt deviceCount device cudaDevic
当我有表面声明时，如何为 sm_1X 和 sm_2X 编译 CUDA 程序

我正在编写一个使用表面重新采样并写入纹理来提高性能的库 surface
为什么numba cuda调用几次后运行速度变慢？

我正在尝试如何在 numba 中使用 cuda 然而我却遇到了与我预想不同的事情这是我的代码 from numba import cuda cuda jit def matmul A B C Perform square matrix m
cuda 共享内存 - 结果不一致

我正在尝试并行缩减以对 CUDA 中的数组求和目前我传递一个数组来存储每个块中元素的总和这是我的代码 include
在linux上编译一个基本的OpenCV + Cuda程序

我过去在linux上使用过opencv 但没有使用过cuda 几个月来我一直在与以下编译错误作斗争在尝试了许多解决方案后我放弃并使用 Windows 不过我真的很想在 Linux 上工作这是我用来编译 opencv gpu 网站上给
如何确定完整的 CUDA 版本 + 颠覆版本？

Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用但是从 CUDA 11 1 开始该文件不再存在我如何在 Linux 上通过命令行确定并检查 path t
运行时 API 应用程序中的 cuda 上下文创建和资源关联

我想了解如何在 cuda 运行时 API 应用程序中创建 cuda 上下文并与内核关联我知道这是由驱动程序 API 在幕后完成的但我想了解一下创作的时间线首先我知道 cudaRegisterFatBinary 是第一个 cuda a
CUDA 估计 2D 网格数据的每块线程数和块数

首先我要说的是我已经仔细阅读了所有类似的问题确定每个块的线程和每个网格的块 https stackoverflow com questions 4391162 cuda determining threads per block blo
Nvcc 的版本与 CUDA 不同

我安装了 cuda 7 但是当我点击 nvcc version 时它打印出 6 5 我想在 GTX 960 卡上安装 Theano 库但它需要 nvcc 7 0 我尝试重新安装cuda 但它没有更新nvcc 当我运行 apt get i
设置最大 CUDA 资源

我想知道是否可以设置 CUDA 应用程序的最大 GPU 资源例如如果我有一个 4GB GPU 但希望给定的应用程序只能访问 2GB 如果它尝试分配更多就会失败理想情况下这可以在进程级别或 CUDA 上下文级别上设置不目前没有允
尝试构建我的 CUDA 程序时出现错误 MSB4062

当我尝试构建我的第一个 GPU 程序时出现以下错误有什么建议可能会出什么问题吗错误 1 错误 MSB4062 Nvda Build CudaTasks SanitizePaths 任务无法从程序集 C Program 加载文件 M
如何在cmake中添加cuda源代码的定义

我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译例如 CMakeLists txt project Test add definitions D WINDOW
无法在内存位置找到异常源：cudaError_enum

我正在尝试确定 Microsoft C 异常的来源 test fft exe 中 0x770ab9bc 处的第一次机会异常 Microsoft C 异常内存位置 0x016cf234 处的 cudaError enum 我的构建环境是 I

随机推荐

如何使用Flask-Migrate进行数据库迁移？

我在使用 Flask Migrate 升级降级数据库时遇到问题有两张桌子 User and Post 由以下类定义 class User db Model id db Column db Integer primary key True
Google 日历 V3 在本地环境之外使用时挂起

我正在为 net 版本的 Google Calendar API 开发一个包装器身份验证相当简单并且在本地 localhost port 运行良好 UserCredential credential GoogleWebAuthorizat
从网站抓取温度传感器数据的动态更新

我写了以下Python代码 from bs4 import BeautifulSoup import urllib2 url http www example com page urllib2 urlopen url soup Beauti
github api v3 从 master 以外的特定分支获取文件内容

如何使用 github v3 内容 api 从特定分支获取文件内容http developer github com v3 repos contents http developer github com v3 repos contents
离子选择无标签

我在同一行中有一个 Ionic 选择作为输入因此我想显示没有标签的选择代码如下
Xcode：框架的目标成员资格？

我对您的 Xcode 项目的最右栏有疑问图片在这里 http img192 imageshack us img192 971 picture9u png 苹果的文档告诉我关于该专栏的内容目标会员标记的列通过目标图标指示是否该文件包
如何将 GitHub 问题与分支关联？

我在 gh 上提交的几乎每个问题都涉及特定分支上的代码 github 是否有任何机制将问题链接到分支我需要按分支过滤问题这样我就不会被其他功能分支中的问题分散注意力有没有办法做到这一点我知道可以滥用使用里程碑来达到类似的效果但
当ng-model在控制器中初始化时，Angularjs select ng-change不会被触发

我有我的选择就像这样
W/ManagedChannelImpl：[{0}] 无法解析名称。状态={1}

我正在开发 Android 应用程序并且实现了 FireStore 现在我不断收到此错误它也会重复 W ManagedChannelImpl 0 Failed to resolve name status 1 有人知道这是什么吗您的应
mvc 3 razor 使用 jquery 调用服务器端函数

我正在使用此代码从服务器获取部分视图并将其放入 div 中 ajax type POST url MyControler MyAction success function result partialView html result e
存储过程事务

我以前从未使用过事务提交和回滚现在我需要使用一个我已经在网上检查了一些示例以确保我实际上正确使用了它但我仍然不确定我的编码是否正确我希望有人能够审查并建议我这是否正确基本上我有两个数据库用于一个应用程序一种是存档意味着不再
从字符串中检索图像 url

我正在解析一个 xml 文件我可以 NSLog 解析但我的问题是我需要从这个字符串获取图像 url p a href http www bubblesurprise com WPRESS APP wp content uploads
通过 XML 设置 AdMob 横幅以匹配父级宽度

我正在尝试设置 AdMob 横幅广告以匹配其父宽度我尝试作为示例
接口如何使单元测试和模拟变得更容易？

人们常说接口使模拟和单元测试变得更加容易接口如何帮助解决这个问题这是接口的本质提供许多实现从而启用模拟特别是在集成测试中您可以提供依赖系统模型的版本例如 Web 服务而不是实际调用一个依赖系统甚至一个模块或者一个复杂且难以
带 LDAP 的 BitNami GitLab Stack 5.1.0-2

I am 配置 https github com gitlabhq gitlabhq blob master doc install installation md ldap authenticationLDAP 用于BitNami Git
如何在本地部署ssrs？

如何在本地计算机上部署 ssrs 我正在使用 ssrs 2005 我不确定 2005 年的情况但在 2008 年您右键单击项目 gt 属性并更改以下内容目标数据集文件夹文件夹名称 DataSet目标数据源文件夹文件夹名称数据源目
org.apache.axis2.AxisFault：在 Web 服务中传递对象数组时，未知类型无法序列化

我创建了一个以 DTO 作为参数的 Web 服务 DTO 包含一个对象数组我已经生成了 WSDL 框架和客户端如果我传递字符串数组我会尝试调用 Web 服务 Serialized array new String a n 效果很好现
如何在 WordPress 多站点中显示最近的全局帖子

我在 ayp no 上运行一个 wordpress 多站点我正在尝试找出一种方法来呈现所有子站点的徽标和所有博客的最新帖子我知道有一个 wpmudev 高级插件但我希望有一些编码我可以自己做好吧显然不是我自己但至少在这里问一下并
在 Swift 中更改 UITabBar selectedItem

如何以编程方式更改 UITabBar 中的选定项目 Swift 3 及更高版本从 Swift 3 开始您还可以使用 tabBarController selectedIndex 0 or any other existing index
优雅地崩溃内核

后续 CUDA 停止所有其他线程 https stackoverflow com questions 3735786 cuda stop all other threads 我正在寻找一种在发生不良情况时退出内核的方法编程手册说 NV

优雅地崩溃内核

优雅地崩溃内核 的相关文章

随机推荐

热门标签

优雅地崩溃内核的相关文章