了解 openmp 中的折叠子句

2023-12-20

我遇到了一个包含崩溃子句的 OpenMP 代码，这对我来说是新的。我试图理解它的含义，但我认为我还没有完全理解它的含义；我发现的一个定义是：

COLLAPSE https://computing.llnl.gov/tutorials/openMP/：指定嵌套循环中的多少个循环应折叠到一个大的迭代空间中，并根据schedule子句进行划分。所有关联循环中迭代的顺序执行决定了折叠迭代空间中迭代的顺序。

我以为我明白这意味着什么，所以我尝试了以下简单的程序：

int i, j;
#pragma omp parallel for num_threads(2) private(j)
for (i = 0; i < 4; i++)
    for (j = 0; j <= i; j++)
        printf("%d %d %d\n", i, j, omp_get_thread_num());

哪个生产的

然后我添加了collapse(2)条款。我预计前两列会得到相同的结果，但现在有相同数量的0's and 1在最后一列中。但我得到了

所以我的问题是：

我的代码中发生了什么？
什么情况下我应该使用collapse?
您能否提供一个示例来说明使用之间的区别collapse并且不使用它？

您的代码的问题在于内部循环的迭代取决于外部循环。根据OpenMP规范下有关绑定部分的描述以及collapse clause:

如果任何关联循环的执行改变了用于计算任何值的任何值迭代计数，则行为未指定。

当情况并非如此时，您可以使用折叠，例如使用方形循环

#pragma omp parallel for private(j) collapse(2)
for (i = 0; i < 4; i++)
    for (j = 0; j < 100; j++)

事实上，这是一个很好的例子来展示何时使用折叠。外循环只有四次迭代。如果你有四个以上的线程，那么有些线程就会被浪费。但是，当您折叠时，线程将分布在 400 次迭代中，这可能比线程数大得多。使用塌陷的另一个原因是载荷分布不均匀。如果您只使用了四次迭代，并且第四次迭代占用了其他线程等待的大部分时间。但如果使用 400 次迭代，负载可能会得到更好的分布。

您可以为上面的代码手动融合一个循环，如下所示

#pragma omp parallel for
for(int n=0; n<4*100; n++) {
    int i = n/100; int j=n%100;

Here https://stackoverflow.com/questions/18749493/openmp-drastically-slows-down-for-loop/18763554#18763554是一个示例，展示了如何手动熔合三重熔合环。

最后，here https://stackoverflow.com/questions/24013832/fusing-a-triangle-loop-for-parallelization-calculating-sub-indices是一个示例，显示如何融合三角形环collapse没有定义。

这是一个将 OP 问题中的矩形循环映射到三角形循环的解决方案。这可用于融合 OP 三角环。

//int n = 4;
for(int k=0; k<n*(n+1)/2; k++) {
    int i = k/(n+1), j = k%(n+1);
    if(j>i) i = n - i -1, j = n - j;
    printf("(%d,%d)\n", i,j);
}

这适用于任何 n 值。

OP问题的地图来自

(0,0),
(1,0), (1,1),
(2,0), (2,1), (2,2),
(3,0), (3,1), (3,2), (3,3),

(0,0), (3,3), (3,2), (3,1), (3,0),
(1,0), (1,1), (2,2), (2,1), (2,0),

对于 n 的奇数值，地图并不完全是矩形，但公式仍然有效。

例如 n = 3 映射自

(0,0),
(1,0), (1,1),
(2,0), (2,1), (2,2),

(0,0), (2,2), (2,1), (2,0),
(1,0), (1,1),

这是测试这个的代码

#include <stdio.h>
int main(void) {
    int n = 4;
    for(int i=0; i<n; i++) {
        for(int j=0; j<=i; j++) {
            printf("(%d,%d)\n", i,j);
        }
    }
    puts("");
    for(int k=0; k<n*(n+1)/2; k++) {
        int i = k/(n+1), j = k%(n+1);
        if(j>i) i = n - i - 1, j = n - j;
        printf("(%d,%d)\n", i,j);
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

openmp

了解 openmp 中的折叠子句的相关文章

Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
如何进行带有偏差的浮点舍入（始终向上或向下舍入）？

我想以偏置舍入浮动要么总是向下要么总是向上代码中有一个特定的点我需要这个程序的其余部分应该像往常一样四舍五入到最接近的值例如我想四舍五入到最接近的 1 10 倍数最接近 7 10 的浮点数约为 0 69999998807 但
获取两个字符串之间的公共部分c# [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要的是获取两个单词之间的共同部分并获取差异例子场景1 word1 感言 word2 Test 将返回公共部分Test 不同之
当我单击 C# 中的“取消”按钮时重定向到新页面（Web 部分）

Cancel button tc new TableCell btnCancel new Button btnCancel Text Cancel btnCancel Click new EventHandler btnCanel Clic
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
使用实体框架从集合中删除项目

我正在使用DDD 我有一个 Product 类它是一个聚合根 public class Product IAggregateRoot public virtual ICollection
在 C++11 中省略返回类型

我最近发现自己在 C 11 模式下的 gcc 4 5 中使用了以下宏 define RETURN x gt decltype x return x 并编写这样的函数 template
try-catch 中未处理的异常

try list from XElement e in d Descendants wix File where e Attribute Name Value Contains temp Name e Parent Parent Attri
调试内存不足异常

在修复我制作的小型 ASP NET C Web 应用程序的错误时我遇到了 OutOfMemoryException 没有关于在哪里查看的提示因为这是一个编译时错误如何诊断此异常我假设这正是内存分析发挥作用的地方有小费吗 Thank
获取从属性构造函数内部应用到哪个属性的成员？

我有一个自定义属性在自定义属性的构造函数内我想将属性的属性值设置为属性所应用到的属性的类型是否有某种方式可以访问该属性所应用到的成员从我的属性类内部可以从 NET 4 5 using CallerMemberName Somethi
单元测试失败，异常代码为 c0000005

我正在尝试使用本机单元测试项目在 Visual Studios 2012 中创建单元测试这是我的测试 TEST METHOD CalculationsRoundTests int result Calculations Round 1 0
通过不同 DLL 或 EXE 中的指针或引用访问 STL 对象时发生访问冲突

我在使用旧版 VC6 时遇到以下问题我只是无法切换到现代编译器因为我正在处理遗留代码库 http support microsoft com kb 172396 http support microsoft com kb 172396
C# using 语句、SQL 和 SqlConnection

使用 using 语句 C SQL 可以吗 private static void CreateCommand string queryString string connectionString using SqlConnection c
通过等待任务或访问其 Exception 属性都没有观察到任务的异常

这些是我的任务我应该如何修改它们以防止出现此错误我检查了其他类似的线程但我正在使用等待并继续那么这个错误是怎么发生的呢通过等待任务或访问其 Exception 属性都没有观察到任务的异常结果未观察到的异常被终结器线程重新抛出
C# 搜索目录中包含字符串的所有文件，然后返回该字符串

使用用户在文本框中输入的内容我想搜索目录中的哪个文件包含该文本然后我想解析出信息但我似乎找不到该字符串或至少返回信息任何帮助将不胜感激我当前的代码 private void btnSearchSerial Click object
如何检测 C# 中该字典键是否存在？

我正在使用 Exchange Web 服务托管 API 和联系人数据我有以下代码即功能性的但并不理想 foreach Contact c in contactList string openItemUrl https service
从类模板参数为 asm 生成唯一的字符串文字

我有一个非常特殊的情况我需要为类模板中声明的变量生成唯一的汇编程序名称我需要该名称对于类模板的每个实例都是唯一的并且我需要将其传递给asm关键字 see here https gcc gnu org onlinedocs gcc 12
如何确定母版页中正在显示哪个子页？

我正在母版页上编写代码我需要知道正在显示哪个子内容页面我怎样才能以编程方式做到这一点我用这个 string pageName this ContentPlaceHolder1 Page GetType FullName 它以 AS

随机推荐

Drupal 8：如何自定义表单小部件以显示实体字段值而不是实体标题？

我正在通过开发自定义表单小部件模块来迈出了解 Drupal 8 在幕后如何工作的第一步我的目标是显示引用节点的图像字段值而不是单选按钮列表中的节点标题在核心中可用这将允许网站管理员在为节点选择背景图像时选择图片而不是文本以下是我的
你能让div中的浮动元素不换行吗？

目标浏览器为IE8 我有一个 div 其中包含向左浮动的元素列表元素宽度可以在运行时改变我想做的是如果它们不再适合 div 它就会被切断并且不会换行它似乎只有在该项目本身位于一行时才有效此页面演示了该问题文本输入的宽度需要在运行
VSCode“无法打开file.cs：找不到文件”

我通过重命名文件夹或其他内容破坏了我的 vscode 项目不完全确定发生了什么问题是虽然我仍然可以构建和运行没有问题但有些东西已经搞砸了因此当我收到编译错误时例如当我双击它说的消息时无法打开 XXXController cs
更新 edittext 时会发生什么事件？

我有一个 android 布局其中有两个编辑文本一个用于数量一个用于费率一个文本视图用于总量现在我想做的是每当用户更改费率或数量字段时更改更新总金额我正在寻找的 edittext 事件是什么我可以像设置 OnClick 一样
如何分割这个字符串？

我想分割这个字符串 String info 0 542008835 meters height from ground 由此我只想得到两位小数0 54 通过使用这个我得到了 String new rhs split lt G 但我在这里面临
如何通过仅更改域名而保留其他 URL 参数来重定向 URL

我现在正在将我的网站迁移到新的主机和域我想知道是否可以将输入旧网站的任何 URL 的任何人重定向到新网站同时保留所有 URL 参数例如当有人输入这个网址时http www domainA com blog p 667 我希望他被重定
如何在 ruby 中使用 AES 256 ECB PKCS5Padding 加密数据

我想使用 PKCS5padding 以 AES 256 位 ECB 模式加密数据我的ruby方法如下这里如何使用PKCS5Padding def encrypt raw data key cipher OpenSSL Cipher AE
更新行而不是创建新条目数据库android

我一直在研究 Android 食谱书中的食谱以利用数据库来存储事件当前代码允许我添加新条目但无法修改任何添加的条目我需要的是一个具有预定义行数 48 的数据库并且具有通过相应的编辑文本字段更新这些行的功能任何人都可以帮我修改以下
Karma 和 React，有导致错误的警告

我在用Karma http karma runner github io 0 8 index html with mocha http mochajs org 测试我的React https facebook github io react
.NET 日期时间到 SqlDateTime 转换

在将 NET DateTime 默认情况下 DateTime 转换为 SqlDateTime 时我应该始终检查 NET 日期是否在 SqlDateTime MinValue 和 SqlDateTime MaxValue 之间或者有没有
Ruby rspec 命令不起作用，可能是因为 Ubuntu 12 是 64 位吗？

我在这个问题上曾经很头疼过我目前正在做一项作业要求我在 ruby 上使用 rspec 每当我运行 rspec 命令时我都会收到类似错误 home rvm gems ruby 1 9 3 p286 gems rspec core 2 1
如何替换 MySQL 中的正则表达式模式

我有一张桌子叫myTable其中有一个名为col1 此列包含以下格式的数据 1 或 2 位数字连字符 8 位数字我想替换此列中的所有数据并将连字符之前的所有内容替换为 4 所以这是一个示例 old values New Values
在 64 位机器上很长[重复]

这个问题在这里已经有答案了 64位机器上是long 128位吗 Edit 重复问题看x64 上的 sizeof int https stackoverflow com questions 651956 sizeofint on x64 在
在 bash 脚本中插入包含“$”的变量

我正在编写一个创建用户帐户的 bash 脚本用户名和密码哈希值是根据特定标准从文件中提取的密码哈希自然包含分隔哈希字段的例如 1 SALT 问题是 p 选项useradd需要用单引号将密码哈希括起来以防止字段作为变量进行插值传递
如何更改 Flutter Web 中的 chrome 标题颜色？

顶部带有链接 URL 的标题的默认颜色是蓝色有人知道如何更改它的颜色吗将此元标记放在index html 文件中的 head 标记之间它将更改您的移动浏览器的顶部菜单颜色
LeafletJS 标记随缩放而移动

使用 LeafletJS 这是王牌到目前为止 P 我们没有 JSON 对象或任何东西所以我从 HTML 中取出值标题 latlng 并创建标记一般来说这可以正常工作但是它们的绘图存在问题当地图真正放大时它们似乎还不错但当您
jquery：我怎么知道我是否拥有它？

我需要 jquery 在本地浏览器上工作我如何知道它是否已安装以及如何安装我的问题是特定于能够运行此代码 onmouseover evt target setAttribute opacity 0 5 someDiv show onmo
具有多个 https 站点的 HAproxy

我们有几个在负载均衡器后面运行的 http 站点使用hearbeat 具有故障转移功能和一个 https 站点一切都运行良好但现在我想要添加另一个 https 站点我找不到任何托管多个 https 站点的参考资料有人使用 HA
在 pySpark 中使用 paramGrid 从 CrossValidator 中提取结果

我用 pySpark 训练随机森林我想要一个包含网格中每个点的结果的 csv 我的代码是 estimator RandomForestRegressor evaluator RegressionEvaluator paramGrid Pa
了解 openmp 中的折叠子句

我遇到了一个包含崩溃子句的 OpenMP 代码这对我来说是新的我试图理解它的含义但我认为我还没有完全理解它的含义我发现的一个定义是 COLLAPSE https computing llnl gov tutorials openMP

了解 openmp 中的折叠子句

了解 openmp 中的折叠子句 的相关文章

随机推荐

热门标签

了解 openmp 中的折叠子句的相关文章