CUDA：停止所有其他线程

2023-12-29

我有一个问题，似乎可以通过枚举所有可能的解决方案然后找到最佳解决方案来解决。为此，我设计了一种回溯算法，可以枚举并存储找到的最佳解决方案。到目前为止效果很好。

现在，我想将此算法移植到 CUDA 中。因此，我创建了一个生成一些不同的基本案例的过程。这些基本情况应该在 GPU 上并行处理。如果其中一个 CUDA 线程找到最佳解决方案，那么所有其他线程当然可以停止其工作。

所以，我想要以下内容：找到最佳解决方案的线程应该停止all运行我的程序的CUDA线程，从而完成计算。

经过一些快速搜索，我发现线程只有在同一个块中才能通信。（所以我认为不可能阻止其他线程阻塞。）

我能想到的唯一方法就是我有一个专用的标志optimum_found，在每个内核的开头都会进行检查。如果找到最佳解决方案，则该标志设置为1，因此所有未来的线程都知道它们不必工作。但是，当然，如果已经运行的线程不在每次迭代时检查该标志，则它们不会注意到该标志。

那么，是否有可能停止所有剩余的 CUDA 线程？

我认为你拥有专用标志的方法可以工作，只要它是全局内存中的内存位置。这样您就可以在每次内核调用开始时检查这一点，正如您所说。

无论如何，内核调用通常应该相对较短，因此即使其中一个线程找到了最佳解决方案，让批处理中的其他线程完成也不会对性能产生太大影响。

也就是说，我相当确定没有 CUDA 调用可以杀死其他正在执行的线程。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CUDA

backtracking

CUDA：停止所有其他线程的相关文章

使用常量内存打印地址而不是cuda中的值

我试图在代码中使用常量内存并从内核分配常量内存值而不是使用 cudacopytosymbol include
指定 NVCC 用于编译主机代码的编译器

运行 nvcc 时它始终使用 Visual C 编译器 cl exe 我怎样才能让它使用GCC编译器设置CC环境变量到gcc没有修复它我在可执行文件帮助输出中也找不到任何选项在 Windows 上 NVCC 仅支持 Visual C
是否可以在设备函数中调用cufft库调用？

我在主机代码中使用 cuFFT 库调用它们工作正常但我想从内核调用 cuFFT 库早期版本的 CUDA 没有这种支持但是有了动态并行性这可能吗如果有任何关于如何实现这一目标的示例那就太好了尽管在 Kepler cc 3 5
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
cudaMemcpyToSymbol 与 cudaMemcpy [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心 help reopen questions 我试图找出
如何将CUDA时钟周期转换为毫秒？

我想用一些代码来测量时间within我的内核需要我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
当我有表面声明时，如何为 sm_1X 和 sm_2X 编译 CUDA 程序

我正在编写一个使用表面重新采样并写入纹理来提高性能的库 surface
数独回溯无效数独

我创建了一个数独回溯求解器它工作得很好但现在如果数独无法解决我想给出一个错误因为它无效例如如果给出这个数独 http img5 imageshack us img5 2241 sudokugq jpg http img5 ima
如何确定完整的 CUDA 版本 + 颠覆版本？

Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用但是从 CUDA 11 1 开始该文件不再存在我如何在 Linux 上通过命令行确定并检查 path t
CUDA Visual Studio 2010 Express 构建错误

我正在尝试在 64 位 Windows 7 上使用 Visual Studio 2010 Express 在 Windows 上开始 CUDA 编程我花了一段时间来设置环境然后我刚刚编写了我的第一个程序 helloWorld cu 目前
CUDA 常量内存是否应该被均匀地访问？

我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化如果是如何确保所有线程同时访问同一地址既然它都会被缓存我是否需要担心每个线程访问相同的地址以进行优化是的这缓存本身每
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
Cuda 6.5 找不到 - libGLU。（在 ubuntu 14.04 64 位上）

我已经在我的ubuntu上安装了cuda 6 5 我的显卡是 GTX titan 当我想要制作 cuda 样本之一时模拟粒子我收到这条消息 gt gt gt WARNING libGLU so not found refer to C
使用回溯（而不是 DFS）背后的直觉

我正在解决单词搜索 https leetcode com problems word search description LeetCode com 上的问题给定一个 2D 板和一个单词查找该单词是否存在于网格中该单词可以由顺序相邻单
TensorRT 多线程

我正在尝试使用 python API 来使用 TensorRt 我试图在多个线程中使用它其中 Cuda 上下文与所有线程一起使用在单个线程中一切正常我使用 docker 和 tensorrt 20 06 py3 图像 onnx 模型和
如何返回n对括号的所有有效组合？

def paren n lst for x in range n current string join lst solutions list for i in range len current string 1 close curren
如何为 CUDA 内核选择网格和块尺寸？

这是一个关于如何确定CUDA网格块和线程大小的问题这是对已发布问题的附加问题here https stackoverflow com a 5643838 1292251 通过此链接 talonmies 的答案包含一个代码片段见下文我
VS 程序在调试模式下崩溃，但在发布模式下不崩溃？

我正在 VS 2012 中运行以下程序来尝试 Thrust 函数查找 include cuda runtime h include device launch parameters h include
内联 PTX 汇编代码强大吗？

我看到一些代码示例人们在 C 代码中使用内联 PTX 汇编代码 CUDA工具包中的文档提到PTX很强大为什么会这样呢如果我们在 C 代码中使用这样的代码我们会得到什么好处内联 PTX 使您可以访问未通过 CUDA 内在函数公开的指
如何运行和理解CUDA Visual Profiler？

我已经设置了 CUDA 5 0 并且我的 CUDA 项目运行良好但我不知道如何使用 Visual Profiler 分析我的 CUDA 项目如何运行它我还需要安装更多吗又该如何做呢我的电脑使用Window 7 64位 CUDA 5

随机推荐

Qt 避免警告“QProcess：进程仍在运行时被破坏”

最简单的代码 void test QProcess p p start sleep 10 p waitForBytesWritten p waitForFinished 1 当然该过程无法在函数结束之前完成因此它会显示一条警告消息 QP
在datagridview中搜索数据

我有一个 datagridview 显示数据库表中的数据有两列 ID 和 NAME 我有一个文本框在其中输入名称这些名称的数据显示在 datagridview 中我已经实现了数据搜索但我想像在组合框中那样进行搜索当我输入 a 时
boost的shared_ptr(shared_ptr const & r, T * p)有什么用？

boost shared ptr有一个不寻常的构造函数 template
WP7 Mp3MediaStreamSource 演示无法正常工作

我下载了 Mp3 MediaStreamSource 演示http archive msdn microsoft com ManagedMediaHelpers http archive msdn microsoft com Managed
将 Facebook 粉丝页面嵌入 Android 应用程序的视图中

我的 Android 应用程序由一个简单的选项卡布局 3 个选项卡组成假设用户选择选项卡 2 现在我想向用户展示一个特定的粉丝页面只是最近的帖子更新如果它可以直接嵌入到选项卡下方的视图中那就最好了没有弹出窗口对话框我知道
TCL 电子邮件脚本无法在 Activestate TCL 中发送

我在 MAC OSX 版本的 TCL 上运行了以下脚本它工作正常但它挂在 Windows 7 计算机上的 ActiveState TCL 上 proc send simple message recipient email server
数值回归测试

我正在编写科学计算代码用 C 编写除了对较小的组件执行单元测试之外我还想通过与已知良好的比较来对某些数值输出进行回归测试之前修订版的答案我想要一些功能允许将数字与指定的容差进行比较对于舍入误差和宽松的期望能够区分整数双精
带有 css 多列的有序列表号

我正在使用默认编号创建一个有序列表该列表将超过 300 个我使用 css column count 将列表分为几列但默认列表编号仅适用于第一列有没有办法获得多列中整个列表的编号请检查FIDDLE https jsfiddle ne
为什么我收到“未定义不是对象（评估 PropTypes.shape）”？

每当我尝试运行我的iOS模拟器我收到这个错误所有模块均已安装图片的文件路径正确除了模拟器中出现的错误外 IDE 中没有抛出任何错误下图为错误 Here s Login js import React Component from
如何返回 R 中序列的行索引？ [复制]

这个问题在这里已经有答案了我正在尝试找到序列的行位置我的意思是 x lt c 1 1 y lt c 1 1 1 0 1 0 0 match x y 1 2 1 为什么不返回 2 3 这就是我想要它做的如果我这样做 y lt c 0 1
为 Android HTTP 请求创建 Google HTTP 传输对象

我正在创建一个 Android 应用程序并尝试通过 Google API 客户端使用 Google Places API 我一直在关注这个例子 http ddewaele blogspot com 2011 05 introducing g
Ajax 功能在移动浏览器上无法使用

您好感谢您查看此内容对 jQuery ajax 等非常陌生该网站可以通过 FTP 访问相应的服务器因此我据我所知没有违反跨域策略该网站在任何桌面浏览器上都可以正常工作但不适用于任何移动浏览器我觉得问题很明显但我不知道该怎
我可以从该字典的枚举循环中删除 ConcurrentDictionary 中的项目吗？

例如 ConcurrentDictionary
Kubernetes 设置 Flannel Pod 网络

我正在跟进本指南 https linuxconfig org how to install kubernetes on ubuntu 18 04 bionic beaver linux关于如何设置 kubernetes 群我的群将如下 1
实时时间序列数据中的峰值信号检测

Update 性能最佳的算法so far 是这个吗 https stackoverflow com questions 22583391 peak recognition in realtime timeseries data 226403
列出当前在 Google 云存储中的监视存储桶上设置的频道通知

有谁知道如何列出当前在谷歌云存储中监视的存储桶上设置的通知创建通道后必须有某种方法来获取通道和资源标识符目前无法列出存储桶上的通知通道如果您在创建时没有存储通道和资源标识符您可以在请求标头中找到它们附加到传递到应用程序的通知消息中
使用 UICollectionViewCell 上的按钮显示数组中的数据

我有一个数组NSStrings one UILabel AUICollectionView 我的问题我想要数组的计数来确定有多少UICollectionViewCell 有吗 Each UICollectionViewCell包含一个按钮
Xcode 9.2 中出现“警告：无法为签名者构建到自签名根的链”警告

我正在尝试将 Xcode 项目迁移到另一台计算机它向我发出警告警告无法为签名者构建到自签名根的链并且当它运行时它会立即崩溃类似于此堆栈溢出中显示的内容应用程序在模拟器上运行但在 iPhone 上不起作用 dyld abort
在 ASP.Net 中获取会话 ID

如何获取当前所有会话的 ID 要获取会话 ID 请执行以下操作 In a user control or page string sessionId this Session SessionID In a normal class runn
CUDA：停止所有其他线程

我有一个问题似乎可以通过枚举所有可能的解决方案然后找到最佳解决方案来解决为此我设计了一种回溯算法可以枚举并存储找到的最佳解决方案到目前为止效果很好现在我想将此算法移植到 CUDA 中因此我创建了一个生成一些不同的基本案例的

CUDA：停止所有其他线程

CUDA：停止所有其他线程 的相关文章

随机推荐

热门标签

CUDA：停止所有其他线程的相关文章