并行化 std::nth_element 和 std::partition

2024-02-06

我正在移植使用的 C++ 代码std::nth_element and std::partition到 OpenCL。

nth_element http://www.cplusplus.com/reference/algorithm/nth_element/ is a 选择算法 http://en.wikipedia.org/wiki/Selection_algorithm它将数组中第 n 个最小的数字放在第 n 个位置，并排列其余元素，使所有小于该数字的元素在数组中位于该数字之前，所有大于该数字的元素位于该数字之后。有效，nth_element将数组分为 3 个桶：数字本身、所有小于该数字的数字以及所有大于该数字的数字。

按照规范，nth_element使用递归分区实现：选择一个元素，根据元素是否小于该元素对元素进行分区。然后，选择包含数组第 n 个元素的存储桶并在该存储桶上递归。之间的主要区别nth_element完整的快速排序是快速排序在两个存储桶上递归，而不仅仅是包含第 n 个元素的存储桶。

partition http://www.cplusplus.com/reference/algorithm/partition/是一个较弱的版本nth_element它仅将数组分为 2 个桶：条件为 true 的桶和条件为 false 的桶。我链接到的网站给出了实现：

while (first!=last) {
    while (pred(*first)) {
        ++first;
        if (first==last) return first;
    }
    do {
        --last;
        if (first==last) return first;
    } while (!pred(*last));
    swap (*first,*last);
    ++first;
}
return first;

其中 pred 是一个函数，用于评估某个元素是否应该位于第一个存储桶中。基本上，这个函数迭代地找到数组中位于错误位置的最外层元素对，并交换它们，当这对元素是相同元素时停止。

这是我对并行化的初步想法nth_element and partition:

分区可以使用原子比较和交换来实现，但我不确定如何覆盖所有可能交换的值对。没有明显的方法可以在多个线程之间划分工作，因为分区需要比较可能彼此相邻或位于数组两端的元素。我也没有找到一种方法来避免线程 B 与已被线程 A 交换的元素进行比较，这是低效的。

nth_element 似乎更难并行化，因为它是递归的：每个分区都依赖于前一个分区部分排序的元素。

据推测，对于这两个功能，有效的并行化策略将需要与典型串行代码完全不同的方法。

高效并行实现nth_element and partition已经存在？如果不是，什么是好的并行化策略？

Cuda THRUST 已实现分区功能（http://docs.nvidia.com/cuda/thrust/index.html#reordering http://docs.nvidia.com/cuda/thrust/index.html#reordering).

主要思想应该如下：使用前缀和来计算元素在数组中的位置，然后重新排列数组。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

并行化 std::nth_element 和 std::partition 的相关文章

迭代变量并查找特定类型实例的技术

我想迭代进程中内存中的变量通过插件动态加载并查找特定类型的实例以前我可以找到特定类型或内存中的所有类型我可以创建类型的实例我可以获取作为不同类型的字段包含的实例但我无论如何都不知道只是搜索特定类型的实例一种方法是使用 W
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
使用post方法将多个参数发送到asp.net core 3 mvc操作

使用 http post 方法向 asp net mvc core 3 操作发送具有多个参数的 ajax 请求时存在问题参数不绑定在 dot net 框架 asp net web api 中存在类似的限制但在 asp net mvc
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
访问者和模板化虚拟方法

在一个典型的实现中Visitor模式该类必须考虑基类的所有变体后代在许多情况下访问者中的相同方法内容应用于不同的方法在这种情况下模板化的虚拟方法是理想的选择但目前这是不允许的那么模板化方法可以用来解析父类的虚方法吗鉴于
如何从 C# 控制器重定向到外部 url

我使用 C 控制器作为网络服务在其中我想将用户重定向到外部网址我该怎么做 Tried System Web HttpContext Current Response Redirect 但没有成功使用控制器的重定向 http msdn
IronPython：没有名为 json 的模块

我安装了 IronPython 我的 python 文件如下所示 import sys print sys version import json 运行它的代码 var p Python CreateEngine var scope p C
如何识别 WPF 文本框中的 ValidationError 工具提示位置

我添加了一个箭头来指示工具提示中的文本框当文本框远离屏幕边缘时这非常有效但是当它靠近屏幕边缘时工具提示位置发生变化箭头显示在左侧 Here is the Image Correct as expected since TextBo
在非活动联合成员上使用“std::addressof”是否定义明确[重复]

这个问题在这里已经有答案了下面的代码是尝试实现constexpr的版本offsetof在 C 11 中它可以在 gcc 7 2 0 和 clang 5 0 0 中编译这取决于申请std addressof工会非活跃成员的成员这是明确
C# 中条件编译符号的编译时检查（参见示例）？

在 C C 中你可以这样做 define IN USE 1 define NOT IN USE 1 define USING system 1 system 1 IN USE 进而 define MY SYSTEM IN USE if US
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
当“int”处于最大值并使用 postfix ++ 进行测试时，代码定义良好吗？

示例未定义行为的一个示例是整数溢出的行为 C11dr 3 4 3 3 int溢出是未定义的行为但这是否适用于存在循环的以下内容并且不使用现在超出范围的副作用i 特别是这是否后缀增量规格帮助结果的值计算在副作用之前排序更新操作数的
当模板类不包含可用的成员函数时，如何在编译时验证模板参数？

我有以下模板struct template
如何挤出平面 2D 网格并赋予其深度

我有一组共面连接的三角形即二维网格现在我需要将其在 z 轴上挤出几个单位网格由一组顶点定义渲染器通过与三角形数组匹配来理解这些顶点网格示例顶点 0 0 0 10 0 0 10 10 0 0 10 0 所以这里我们有一个二维正方
当前的 x86 架构是否支持非临时加载（来自“正常”内存）？

我知道有关此主题的多个问题但是我没有看到任何明确的答案或任何基准测量因此我创建了一个处理两个整数数组的简单程序第一个数组a非常大 64 MB 第二个数组b很小无法放入 L1 缓存程序迭代a并将其元素添加到相应的元素中b在模块化
为什么拆箱枚举会产生奇怪的结果？

考虑以下 Object box 5 int int int box int 5 int nullableInt box as int nullableInt 5 StringComparison enum StringComparison
strcmp 给出分段错误[重复]

这个问题在这里已经有答案了这是我的代码给出分段错误 include
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
应用对数来导航树

我曾经知道一种使用对数从树的一片叶子移动到树的下一个有序叶子的方法我认为它涉及获取当前叶子的位置值排名并将其用作从根向下到新目标叶子的新遍历的种子一直使用对数函数测试来确定是否沿着右或左节点向下到达叶子我已经不记得如何运用
匿名结构体作为返回类型

下面的代码编译得很好VC 19 00 23506 http rextester com GMUP11493 标志 Wall WX Za 与VC 19 10 25109 0 标志 Wall WX Za permissive 这可以在以下位置检

随机推荐

如何在 Rust 中正确实现 Iterable 结构？ [复制]

这个问题在这里已经有答案了我正在尝试实现一个可以无限迭代的结构把它想象成一个自然数我有一个限制它无法实现Copy特征因为该结构包含String field 我还实现了一个Iterable特质及其唯一成员fn next mut se
无法将类型“CFString”的值转换为预期参数类型“UnsafePointer”（又名“UnsafePointer<()>”）

当我定义该行时出现构建错误 let runFont CTFontRef CFDictionaryGetValue CTRunGetAttributes run kCTFontAttributeName 错误是无法将类型 CFString
JMESPath 过滤器表达式中的引用父元素

我有以下 JMESPath 查询 query Reservations Instances InstanceId InstanceId RootDeviceVolumeId BlockDeviceMappings DeviceName de
从字符串 PHP 中去除多字节空格

我正在尝试使用 preg replace 来消除日语全角空格来自字符串输入但最终得到一个损坏的多字节字符串我更喜欢 preg replace 而不是 str replace 这是示例代码 keywords 単色 keywords st
如何在Git中获取当前分支的最新标签名称？

在 Git 中获取最新标签的最简单方法是什么 git tag a HEAD git tag b HEAD git tag c HEAD git tag output a b c 我应该编写一个脚本来获取每个标签的日期时间并比较它们吗要获取
无法转译包含 async wait 的 TypeScript

当尝试转译以下包含以下 TypeScript 代码时async and await关键词 async function foo await bar 我收到以下错误 src aa ts 1 7 error TS1005 expected sr
ElementClickInterceptedException：元素单击被拦截：使用 Selenium Python 单击“搜索”按钮时出现错误，元素不可单击

我想抓取以下网站 https sprs parl gov sg search home https sprs parl gov sg search home 但是当我的代码单击搜索按钮时我收到错误 ElementClickInterc
为什么在catch后使用finally而不是代码[重复]

这个问题在这里已经有答案了为什么要这样做 catch SQLException sqle sqle printStackTrace finally cs close rs close 而不是这个 catch SQLException sq
JavaScript 函数 inArray

我需要一个 javascript 函数它可以接受一个字符串和一个数组如果该字符串在数组中则返回 true function inArray str arr 警告它不能使用任何 JavaScript 框架你可以创建一个数组原型函数
如何使用 moment.js 更改时间？

我想使用 moment js 更改一些时间我还有下次 Tue May 16 2017 15 34 23 GMT 0300 FLE Daylight Time 我想把它改成11 11例如而且时间应该是Tue May 16 2017 11
Neptune Jupyter 笔记本未显示图表选项卡

在 Neptune 笔记本中我添加顶点如下 gremlin g addV labelC property T id 153 然后我做gremlin p v oute inv选项可查看如下所示的可视化图形表示参考 https docs a
如何从 python 不使用 gmail 发送电子邮件？

我已经有了用 python 发送电子邮件的代码 def send email gmail subject message destination Send an e mail using gmail with message to dest
“alert()”和“confirm()”不适用于“apple-mobile-web-app-capable”

在iOS 当前7 0 下它看起来像alert and confirm 当我们的网络应用程序固定到主屏幕时也称为使用元标记无法工作apple mobile web app capable 我发现推特上有一个用户有类似的问题 https
回收器视图项目输入动画不起作用

我按照动画 recyclerview 项目的教程进行操作但动画不起作用我对是否应用动画感到困惑活动 Java 更新的代码在这里我尝试单击按钮但我不知道如何从适配器的 onBindHolder 调用动画方法 private void
Windows Phone 7 Silverlight MVVM（和其他）框架

目前 WP7 有哪些可用的 mvvm 框架您会推荐哪一个为什么在开始 WP7 silverlight 开发时是否应该考虑其他有用的框架感谢您发布迄今为止的经历干杯菲尔看看这个MVVM框架比较 http www japf fr
如何将信息传递给React中的嵌套组件？

说我有
如何使用 VBA 在 Excel 文档中循环浏览超链接

我有一份大约的清单 Excel 中的一列中有 160 个超链接我正在尝试从每个单独的链接中提取数据为了导航到特定页面例如https www oddschecker com golf canadian open winner bet h
在 xamarin 表单上预加载页面

我正在寻找让我的 Xamarin Forms 应用程序更快的技巧我遇到了这个article https newbedev com slow startup of xamarin app 好吧我已经尝试了一些选项但我发现很难实现最后一个
在 Node.js 中的 mongoose 用户上使用 _.omit

我有一个像这样构建的猫鼬用户模式 var UserSchema new Schema username type String required true index unique true password type String req
并行化 std::nth_element 和 std::partition

我正在移植使用的 C 代码std nth element and std partition到 OpenCL nth element http www cplusplus com reference algorithm nth elemen

并行化 std::nth_element 和 std::partition

并行化 std::nth_element 和 std::partition 的相关文章

随机推荐

热门标签