在不平衡树上拆分 OpenMP 线程

2024-04-18

我正在尝试使用 OpenMP 并行进行树操作，例如对树中所有叶子中的数字进行求和。我遇到的问题是我工作的树不平衡（子节点的数量不同，分支的大小也不同）。

我目前在这些树上使用递归函数。我想要实现的是：

1）在第一个可能的机会时分割线程，假设它是一个有 2 个子节点的节点

2) 继续从两个结果线程中拆分至少 2-3 个级别，以便所有线程都在工作

它看起来像这样：

if (node->depth <= 3) {
    #pragma omp parallel
    {
        #pragma omp schedule(dynamic)
        for (int i = 0; i < node->children_no; i++) {
            int local_sum;

            local_sum = sum_numbers(node->children[i])
            #pragma omp critical
            {
                global_sum += local_sum;
            }
        }
    }
} else {
    /*run the for loop without parallel region*/
}

这里的问题是，当我允许嵌套并行时，OpenMP 似乎在新团队中创建了很多线程。我想要实现的是：

1）创建新团队的每个线程不能占用超过 MAX_THREADS 的线程

2）一旦一个子树中的 for 循环结束，其他仍在更大子树中工作的 for 循环将接管现在空闲的线程以更快地完成其工作

这样，我希望线程永远不会多于必要的数量，但只要所有 for 循环中未完成的任务组合起来比创建的线程多，它们就一直在工作。

从文档来看，它看起来像并行仅使用已在并行区域中创建的线程。是否可以使其按描述的方式工作，或者我是否需要更改实现以首先列出各个分支的任务，然后对该列表运行并行 for 循环？

仅供记录，我将根据 High Performance Mark 的评论（我也同意这一评论）来写下这个问题的答案。即使树不平衡，此处使用 OpenMP 任务也会增加并行性的灵活性，支持递归性并为所有线程生成足够的工作（尽管您应该使用诸如Vampir http://tu-dresden.de/die_tu_dresden/zentrale_einrichtungen/zih/forschung/projekte/vampir, Paraver http://www.bsc.es/computer-sciences/performance-tools/paraver and/or 高性能计算工具包 http://hpctoolkit.org).

结果代码可能看起来像

if (node->depth <= 3) {
    #pragma omp parallel shared (global_sum)
    {
        for (int i = 0; i < node->children_no; i++) {
            int local_sum;

            #pragma omp single
            #pragma omp task
            {
              local_sum = sum_numbers(node->children[i])

              #pragma omp critical
              global_sum += local_sum;
            }
        }
    }
} else {
    /*run the for loop without parallel region*/
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在不平衡树上拆分 OpenMP 线程的相关文章

GCC C++ (ARM) 和指向结构体字段的 const 指针

假设有一个简单的测试代码 typedef struct int first int second int third type t define ADDRESS 0x12345678 define REGISTER type t ADDRE
如何进行带有偏差的浮点舍入（始终向上或向下舍入）？

我想以偏置舍入浮动要么总是向下要么总是向上代码中有一个特定的点我需要这个程序的其余部分应该像往常一样四舍五入到最接近的值例如我想四舍五入到最接近的 1 10 倍数最接近 7 10 的浮点数约为 0 69999998807 但
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q
捕获 foreach 条件中抛出的异常

我有一个foreach在 foreach 本身的条件下循环期间中断的循环有没有办法try catch抛出异常然后继续循环的项这将运行几次直到异常发生然后结束 try foreach b in bees exception is in
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
使用实体框架从集合中删除项目

我正在使用DDD 我有一个 Product 类它是一个聚合根 public class Product IAggregateRoot public virtual ICollection
TextBox 焦点的 WinForms 事件？

我想添加一个偶数TextBox当它有焦点时我知道我可以用一个简单的方法来做到这一点textbox1 Focus并检查布尔值但我不想那样做我想这样做 this tGID Focus new System EventHandler thi
如何在 VS 中键入时显示方法的完整文档？

标题非常具有描述性是否有任何扩展可以让我看到我正在输入的方法的完整文档我想查看文档因为我可以在对象浏览器中看到它其中包含参数的描述和所有内容而不仅仅是一些摘要当然可以选择查看所有覆盖它可能是智能感知的一部分或者我不知道它并
C++11 函数局部静态 const 对象的线程安全初始化

这个问题已在 C 98 上下文中提出并在该上下文中得到回答但没有明确说明有关 C 11 的内容 const some type create const thingy lock my lock some mutex static con
为什么 std::allocator 在 C++17 中丢失成员类型/函数？

一边看着std 分配器 http en cppreference com w cpp memory allocator 我看到成员 value type pointer const pointer reference const refer
用于从字符串安全转换的辅助函数

回到 VB6 我编写了一些函数让我在编码时无需关心字符串的 null 和数字的 null 和 0 等之间的区别编码时没有什么比添加特殊情况更能降低我的工作效率了用于处理可能导致一些不相关错误的数据的代码 9999 10000 如果我
是否有一个 C++ 库可以从 PDF 文件中提取文本，例如 PDFBox for Java？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案去年我使用 PDFBox 在 Java 中创建了一个应用程序来获取某些 PDF 文件中的原始文本现在
如何检测 C# 中该字典键是否存在？

我正在使用 Exchange Web 服务托管 API 和联系人数据我有以下代码即功能性的但并不理想 foreach Contact c in contactList string openItemUrl https service
无法使用 Ninject 将依赖项注入到从 Angular 服务调用的 ASP.NET Web API 控制器中

我将 Ninject 与 ASP NET MVC 4 一起使用我正在使用存储库并希望进行构造函数注入以将存储库传递给其中一个控制器这是实现 StatTracker 接口的上下文对象 EntityFramework public cla
.NET UI 元素线程限制的原因

我们知道除了实例化元素的线程之外不可能从任何线程执行操作任何 UI 元素属性的代码我的问题是为什么我记得当我们使用 COM 用户界面元素时在 COM Visual Basic 6 0 时代所有 UI 元素都是使用 COM 类和
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
Swagger 为 ASP.CORE 3 中的字典生成错误的 URL

当从查询字符串中提取的模型将字典作为其属性之一时 Swagger 会生成不正确的 URL 如何告诉 Swagger 更改 URL 中字典的格式或手动定义输入参数模式而不自动生成尝试使用 Swashbuckle 和 NSwag 控制器 pu
从类模板参数为 asm 生成唯一的字符串文字

我有一个非常特殊的情况我需要为类模板中声明的变量生成唯一的汇编程序名称我需要该名称对于类模板的每个实例都是唯一的并且我需要将其传递给asm关键字 see here https gcc gnu org onlinedocs gcc 12
如何确定母版页中正在显示哪个子页？

我正在母版页上编写代码我需要知道正在显示哪个子内容页面我怎样才能以编程方式做到这一点我用这个 string pageName this ContentPlaceHolder1 Page GetType FullName 它以 AS
如何使用 std::array 模拟 C 数组初始化“int arr[] = { e1, e2, e3, ... }”行为？

注意这个问题是关于不必指定元素数量并且仍然允许直接初始化嵌套类型这个问题 https stackoverflow com questions 6111565 now that we have stdarray what uses are

随机推荐

获取 LinkedIn 分享计数 JSONP

使用 LinkedIn API 我想获取 URL 的分享计数 https www linkedin com countserv count share url http www linkedin com format json 但这给了我一
从Java调用Android WebView中的jQuery函数？

我正在尝试调用在 html 中定义的 javascript 函数喜欢 WebView loadUrl javascript hoge 我可以调用非 jQuery 函数但无法调用我在 document ready function jQu
IllegalStateException：getAttribute：会话已失效

我的第一个 JSF IceFaces 版本 1 8 2 应用程序在 JBoss 5 1 0 上运行时遇到问题一段时间后我收到一个异常告诉我有关会话问题这很奇怪因为我根本不在我的代码中使用会话以下日志显示由于此错误来自 JBoss
指向动态分配的 boost multi_array 中的类的指针，未编译

我对 C 和 Boost 还很陌生我想要 world 类的对象有一个名为 chunk 类型为 octreenode 的数组以前我有一个普通的一维数组这工作得很好现在我尝试转向使用具有 Boost 的 multi array 功能的
使用 PHP 从多选下拉列表中获取数据并插入到 MySQL 中

我的数据库中有一个使用以下命令创建的日期列表SET数据类型 SET Mon Tue Wed Thr Fri Sat Sun 我希望用户能够使用多选下拉列表选择多天放入数据库
如何在 WPF 中按名称查找样式触发器嵌入元素？

首先问题的核心如果通过样式触发器将一个元素指定为 ContentControl 的内容我似乎无法按名称找到它现在了解更多详细信息我有一个面板其布局和功能根据其数据上下文而有很大差异这是来自错误库的错误当该错误为空时它是一
根据合并请求触发 gitlab-ci 中的作业

是否可以仅根据合并请求从 gitlab ci 运行作业现在我们有一个包含大量测试的大型整体项目但我们只想在合并到分支 master 之前运行测试嗯目前还没有内置但是您自己也不是不可能 Gitlab 允许trigger https
支持 __getitem__ 的类的 Python 类型提示

我想向一个函数添加类型提示该函数将接受带有 getitem 方法例如在 def my function hasitems locator hasitems locator 我不想限制hasitems成为特定类型例如list or d
如何将查询字符串传递给backbone.js 路由

我正在使用 Backbone js 和 jQuery mobile jQuery 移动路由被禁用我仅将库用于 UI 除了选择页面转换之外我一切正常我需要将页面转换向上切片淡入淡出向下滑动传递到主干路由器因为转换根据用户来自的
获取数据工厂中单个管道执行的成本

我正在考虑使用 Azure 数据工厂 V2 进行集成导入并想知道是否有办法跟踪正在运行的各个管道的成本例如如果我有 3 个管道代表 3 个不同的集成是否有办法查看每个管道产生的成本还有一种方法可以近乎实时地执行此操作以便在一个
我们应该使用 setTargetFragment() 吗？我认为 Fragments 不应该互相通信

Android开发者教程建议我使用片段的宿主活动来传递数据等等那么为什么有一个设置获取目标片段方法呢到目前为止我的应用程序包含一个主机活动和一个片段其中有一个启动按钮DialogFragment 其中有一个按钮可以启动另一个Dia
Pandas 会影响 Rapidfuzz 匹配的结果吗？

我正在碰壁如果我在 pandas 数据帧内运行 Rapidfuzz 以及单独运行它它会为字符串分数相似性提供不同的结果吗为什么地址相似度 2 和最后一行的结果不同 from rapidfuzz import process utils
在 Android 中使用带有自定义标签的块模板引擎

我正在尝试在 android 中使用 chunk 我需要这样的东西 Suppose 以下是标签 tags 世界世界 c 丹尼斯里奇苹果工作 Input HELLO world C 是由 c 而java是由 java 编写的 hola
在 R 中安装插入符包时出现依赖问题

我正在尝试安装 R 包caret 这给了我ERROR dependencies ggplot2 reshape2 BradleyTerry2 are not available for package caret 我尝试单独安装其中的每一个
如何在SCSS中获取数组的$values？

我正在制作自己的插件通过编写单个插件自动进行多个媒体查询 includeSCSS 中的行所以当我输入时 include medias bp values width 输出应该是这样的 media all and min width 56
unix select() 调用：如何组合 fd_sets？

我正在用 C 语言为 Linux 编写一个应用程序它使用 2 个独立的第三方库这两个库都是异步的并使用 select 他们还提供了一个 API 可以返回他们等待的文件描述符我的目的是将它们传递给我自己的 select 然后在设置了自己
toDF 问题，值 toDF 不是 org.apache.spark.rdd.RDD 的成员

我已附加错误 value toDF is not a member of org apache spark rdd RDD 的代码片段我正在使用 scala 2 11 8 和 Spark 2 0 0 您能帮我解决 API toDF 的这个
如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？

我想对卷积神经网络使用 MNIST 数据集和 TensorFlow 进行几次新的训练并且每次都获得相同的准确度结果为了得到这个我保存未经训练的仅初始化的 global variables initializer 网络每次我开始训练
当文件位于根目录中时取消链接 PHP 才起作用，而当文件位于文件夹中时则不起作用

所以这个非常简单我想使用 PHP 删除服务器上的文件我有 myfile theone png unlink myfile 此代码删除该文件但是如果文件的路径是 images theone png 则它不起作用我尝试过 images
在不平衡树上拆分 OpenMP 线程

我正在尝试使用 OpenMP 并行进行树操作例如对树中所有叶子中的数字进行求和我遇到的问题是我工作的树不平衡子节点的数量不同分支的大小也不同我目前在这些树上使用递归函数我想要实现的是 1 在第一个可能的机会时分割线程假设它是一

在不平衡树上拆分 OpenMP 线程

在不平衡树上拆分 OpenMP 线程 的相关文章

随机推荐

热门标签

在不平衡树上拆分 OpenMP 线程的相关文章