OpenMP：无法并行化嵌套 for 循环

2024-05-15

我想将循环与其中的内循环并行化。我的代码如下所示：

    #pragma omp parallel for private(jb,ib) shared(n, Nb, lb, lastBlock, jj, W, WT) schedule(dynamic)   //private(ib, jb) shared(n, Nb, lb, lastBlock, jj, W, WT)       //parallel for loop with omp
    for(jb=0; jb<Nb; jb++)          
    {
            int lbh = (jb==Nb-1) ? lastBlock : lb;
            int ip = omp_get_thread_num();

            packWT(a, n, lb, s, jb, colNr, WT[ip], nr); //pack WWT[jb]      


            for(ib=jb; ib<Nb; ib++)
            {
                    int lbv = (ib==Nb-1) ? lastBlock : lb;

                    multBlock_2x4xk(a, n, jj + ib*lb, jj + jb*lb, W+ib*lb*lb, WT[ip], lb, lbv, lbh);    //MULT BLOCK - 2x4xK (W[jb]*W[ib])

            }
    }

我测量了 proc 计算这个循环所花费的时间。对于几个线程来说，这与对于一个线程来说是一样的。当我改变条款时

private(jb,ib)

for

private(jb)

一切都在改变。我的意思是，对于少数线程来说，proc 的计算速度比一个线程的计算速度要快。问题是什么？

The problem is that your inner for loops is not in canonical shape. Therefore openmp fails to parallelize the loops and no speedup can be achieved. The loops need to look like the following picture. Where start, idx and inc are not allowed to be changed during the parallel part of the code. canonical shape of for loops

我想我发现了你的问题。您正在调用这些函数：

  packWT(a, n, lb, s, jb, colNr, WT[ip], nr); packWT(a, n, lb, s, jb, colNr, WT[ip], nr);
  multBlock_2x4xk(a, n, jj + ib*lb, jj + jb*lb, W+ib*lb*lb, WT[ip], lb, lbv, lbh);

其中一个参数是循环变量 jb，因为 jb 可以在函数内部更改（取决于函数声明），编译器决定不并行化循环。为了避免这种情况，请将变量 jb 复制到局部变量并将局部变量传递给函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

parallelprocessing

openmp

OpenMP：无法并行化嵌套 for 循环的相关文章

C# 方法重载决策不选择具体的泛型覆盖

这个完整的 C 程序说明了这个问题 public abstract class Executor
使用 CMake 时如何导出 Emscripten 中的 C 函数

In 本教程 https emscripten org docs porting connecting cpp and javascript Interacting with code html interacting with code
转换 const void*

我有一个函数返回一个const void 我想用它的信息作为char 我可以将它投射为 C 风格的罚款 char variable但是当我尝试使用reinterpret cast like reinterpret cast
如何在类文件中使用 Url.Action() ？

如何在 MVC 项目的类文件中使用 Url Action Like namespace 3harf public class myFunction public static void CheckUserAdminPanelPermissi
按扩展名过滤搜索文件返回太多结果

我正在开发一个 C 控制台应用程序它必须管理 Windows 操作系统上的文件我需要获取具有特定扩展名的文件名列表我找到了很多解决方案最建议的是以下一种 HANDLE hFind WIN32 FIND DATA data hFin
未找到 Boost 库，但编译正常

我正在尝试在 C 中使用 boost 的文件系统使用时看起来编译没问题 c c Analyse c o Analyse o g W Wall L usr local lib lboost filesystem lboost system
从复选框列表中选择循环生成的复选框中的一个复选框

抱歉我的英语不好在我的 ASP NET 网站上我从 SQL 表导入软件列表看起来像这样但实际上要长得多 Microsoft Application Error Reporting br br Microsoft Applicatio
无法注册时间触发的后台任务

对于 Windows 8 应用程序在 C Xaml 中我尝试注册后台任务很难说但我想我的后台任务已正确注册但是当我单击调试位置工具栏上的后台任务名称时我的应用程序停止工作没有任何消息我查看了事件查看器上的日志得到具有入口
处理右值时的 insert 与 emplace

std string myString std unordered set
如何使用 Regex.Replace 从字符串中删除数字？

我需要使用Regex Replace从字符串中删除所有数字和符号输入示例 123 abcd33输出示例 abcd 请尝试以下操作 var output Regex Replace input d string Empty The d标识符
Eigen 和 OpenMP：由于错误共享和线程开销而没有并行化

系统规格 Intel Xeon E7 v3 处理器 4 插槽 16 核插槽 2 线程核心 Eigen 系列和 C 的使用以下是代码片段的串行实现 Eigen VectorXd get Row const int j const int
在 VS 中运行时如何查看 C# 控制台程序的输出？

我刚刚编写了一个名为 helloworld 的聪明程序它是一个 C NET 4 5 控制台应用程序在扭曲的嵌套逻辑迷宫深处使用了 Console WriteLine 当我在命令行运行它时它会运行并且我会看到输出我可以执行其他命令并
如何递归取消引用指针（C++03）？

我正在尝试在 C 中递归地取消引用指针如果传递一个对象那就是not一个指针这包括智能指针我只想返回对象本身如果可能的话通过引用返回我有这个代码 template
从 C# 使用 Odbc 调用 Oracle 包函数

我在 Oracle 包中定义了一个函数 CREATE OR REPLACE PACKAGE BODY TESTUSER TESTPKG as FUNCTION testfunc n IN NUMBER RETURN NUMBER as be
模板外部链接？谁能解释一下吗？

模板名称具有链接 3 5 非成员函数模板可以有内部链接任何其他模板名称应具有外部链接从具有内部链接的模板生成的实体与在其他翻译单元中生成的所有实体不同我知道使用关键字的外部链接 extern C EX extern C templat
Oauth2中如何同时撤销RefreshToken和使AccessToken失效

我正在使用 Owin Oauth2 授权和资源服务器相同开发单页面应用程序 AngularJS Net MVC Json Rest API 的身份验证流程我选择了 Bearer Token 路由而不是传统的 cookie session
模板类的模板构造函数的 C++ 显式模板特化

我有一个像这样的课程 template
了解 Lambda 表达式和委托 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我已经尝试解决这个问题很长一段时间了阅读在线博客和文章但到目前为止还没有成功什么是代表什么是 Lambda 表达式两者的优点
EntityFramework 6.0.0.0 读取数据，但不插入

我创建了一个基于服务的数据库 folderName gt Add New Item gt Data gt Service based Database文件到 WPF 应用程序中然后我用过Database First方法并创建了Person
如何在 sql azure 上运行 aspnet_regsql？ [复制]

这个问题在这里已经有答案了可能的重复将 ASP NET 成员资格数据库迁移到 SQL Azure https stackoverflow com questions 10140774 migrating asp net membersh

随机推荐

具有继承类型的 Aux 模式推理失败

我有一个复杂的玩具算法我希望纯粹在类型级别上表示根据饮食要求选择当天菜肴的修改对卷积表示歉意但我认为我们需要每一层才能达到我想要使用的最终界面我的代码有一个问题如果我们表达一个类型约束Aux 模式生成的类型基于另一个泛型类型它
为什么我的 Pygame 窗口在为对象设置动画时会闪烁？

所以我的 pygame 窗口不会停止闪烁我知道只要one项目在snake snakearray 不会闪烁 class for the array class snake snakearray ScreenConfigs width 2 S
如何通过start-stop-daemon正常关闭Spring Boot应用程序[重复]

这个问题在这里已经有答案了我们有一个多线程 Spring Boot 应用程序它作为守护进程在 Linux 机器上运行当我尝试像这样通过启动停止守护进程停止应用程序时 start stop daemon stop quiet retry
py2neo 引发完成（自我）错误

使用 py2neo 时我在尝试附加事务时收到以下错误 statement MERGE a Person name actorName n MERGE b Series title actorsFields 3 year actorsFie
可以在 pystan 或 pymc3 中使用样本权重吗？

如果我观察到的数据集具有权重例如跟踪多重性是否可以将其提供给 pystan 或 pymc3 类似于函数签名 http mc stan org rstanarm reference stan glm html http mc stan o
在 Firefox Add-on SDK 扩展中的“onInstalled”上执行脚本

我对 Mozilla 扩展开发非常陌生即使我刚刚知道扩展和附加开发是不同的我对我在 MDN Mozilla 开发者网络上看到的内容非常困惑我想在安装我的附加组件后立即执行脚本 content script js 以便用户不需要重新启
连接到远程 DB2 时出现“操作超时。ERRORCODE=-4499，SQLSTATE=08001”

我正在尝试使用 IBM Type 4 JDBC 驱动程序连接到远程 DB2 这是我的配置 Server Windows 7 专业版 DB2 LUW V10 5 DB2 SVCENAME 50000 TCP IP 进行通信 Client 操作
Hibernate 在使用序列时生成负 id 值

我有一个具有以下定义的类 Id SequenceGenerator name SEQ ACE WORKERS QUEUE STATS ID sequenceName SEQ ACE WORKERS QUEUE STATS ID alloca
重写规则无法正确过滤推荐垃圾邮件（不再）

我已将以下重写规则添加到我的 web config 中它运作良好阻止了所有提到的推荐垃圾邮件网站然而今天我突然发现social buttons com出现在我的谷歌分析中我在下面定义的规则怎么可能做到这一点
Flutter 中的 Android 许可证

4 天前一切正常我进行了更新许可证停止通过我到目前为止所做的事情检查了工具过时的东西 gt 不起作用 flutter doctor android licenses gt 不起作用 sdkmanager licenses gt 不起
如何从 javascript 终止会话

很多时候我们使用会话变量来存储页面中的数据当用户从一个页面跳转到另一个页面时我需要一种方法来终止 JavaScript 的会话是否可以如果是的话请指导我提前致谢您需要告诉服务器终止会话变量从 javascript 执行此操作的
列出运行时从开放泛型类型创建的封闭类型

当我列出当前 AppDomain 中的所有类型时我会看到带有通用占位符的通用类型但是如果我使用类型实例化泛型类型然后列出 appDomain 中的所有类型则我看不到新创建的封闭类型在下面的示例中输出仅为 Foo 1 T 我正在
refname 不明确且拉取失败

我运行了以下命令因为我想将生产分支移回而不必先签出 git branch f production HEAD 1 现在当我检查生产时我收到以下警告 warning refname production is ambiguous 然后我
关于在字典中查找所有有效单词的算法问题

给定一个字典只是一个字符串列表您收到来自外部来源的未知数量的信件给定字母串您将如何列出您可以通过这些字母的任意组合组成的所有有效单词来自字典因此如果您收到 applead 你应该找到apple bad pad lead等我知
设置 Apache POI 的路径

我想创建 Excel 文件并使用 java 程序在该文件中写入数据 That is here http www techbrainwave com p 554我在 java 文件所在的位置提取了 Apache POI 并将该路径包含在路径变
引用重载，与单独的值传递 + std::move 相比？

似乎有关 C 0x 右值的主要建议是向类中添加移动构造函数和移动运算符直到编译器默认实现它们但如果您使用 VC10 等待是一种失败的策略因为自动生成可能要到 VC10 SP1 才会出现或者在最坏的情况下直到 VC11 等待这一切的
如何在 NSDate 变量中仅设置时间？

我有 NSDate 变量只想更改时间不应更改日期是否可以例如用户在 DatePicker 日期中选择日期间隔如果是开始日期我想将时间设置为 00 00 00 如果是结束日期我将时间设置为 23 59 59 感谢你的帮助问候
Apple Silicon M1 Mac 中的 Xcode 错误“为 iOS 模拟器构建，但在为 iOS 构建的 dylib .. for 架构 arm64”中链接

我有一个应用程序可以在物理设备和 iOS 模拟器中使用英特尔处理器的旧 Mac 上编译和运行良好同样的应用程序也可以在配备 M1 处理器的较新 Apple Silicon Mac 上编译并正常运行physicaliPhone 设备 bu
理解 JavaScript 的单线程本质

我一直在阅读 John Resig 的 JavaScript Ninja 的秘密它解释了 JavaScript 是单线程的但是我尝试对此进行测试但我不确定要从这里删除什么 executing this in browser func
OpenMP：无法并行化嵌套 for 循环

我想将循环与其中的内循环并行化我的代码如下所示 pragma omp parallel for private jb ib shared n Nb lb lastBlock jj W WT schedule dynamic private

OpenMP：无法并行化嵌套 for 循环

OpenMP：无法并行化嵌套 for 循环 的相关文章

随机推荐

热门标签

OpenMP：无法并行化嵌套 for 循环的相关文章