嵌套循环、内循环并行化、重用线程

2024-03-17

免责声明：以下示例只是一个快速理解问题的虚拟示例。如果您正在考虑现实世界的问题，请考虑任何动态编程。

问题：我们有一个 n*m 矩阵，我们想要复制前一行的元素，如以下代码所示：

for (i = 1; i < n; i++)
    for (j = 0; j < m; j++)
        x[i][j] = x[i-1][j];

方法：外循环迭代必须按顺序执行，它们将按顺序执行。内循环可以并行化。我们希望最大限度地减少创建和终止线程的开销，因此我们希望只创建一次线程组，但是，这在 OpenMP 中似乎是一项不可能完成的任务。

#pragma omp parallel private(j)
{
   for (i = 1; i < n; i++)
   {   
      #pragma omp for scheduled(dynamic)
      for (j = 0; j < m; j++)
         x[i][j] = x[i-1][j];
   }
}

当我们申请时ordered外循环上的选项，代码将以顺序方式执行，因此不会有性能增益。我正在寻找上述场景的解决方案，即使我不得不使用一些解决方法。

我正在添加我的实际代码。这实际上比 seq 慢。版本。请查阅：

/* load input */
for (i = 1; i <= n; i++)
    scanf ("%d %d", &in[i][W], &in[i][V]);

/* init */
for (i = 0; i <= wc; i++)
    a[0][i] = 0;

/* compute */
#pragma omp parallel private(i,w)
{
    for(i = 1; i <= n; ++i) // 1 000 000
    {
        j=i%2;
        jn = j == 1 ? 0 : 1;

        #pragma omp for
        for(w = 0; w <= in[i][W]; w++) // 1000
            a[j][w] = a[jn][w];

        #pragma omp for
        for(w = in[i][W]+1; w <= wc; w++) // 350 000
            a[j][w] = max(a[jn][w], in[i][V] + a[jn][w-in[i][W]]);
    }
}

至于测量，我正在使用这样的东西：

double t;
t = omp_get_wtime();
// ...
t = omp_get_wtime() - t;

总结一下 OpenMP 中针对这种特殊情况的并行化：不值得。

Why?内循环的操作很简单。代码编译为-O3, so max()call 可能被函数体的代码替换。隐式屏障的开销可能足够高，以补偿性能增益，并且总体开销足够高，使得并行代码甚至比顺序代码更慢。我还发现，这种构造没有真正的性能提升：

#pragma omp parallel private(i,j)
{ 
   for (i = 1; i < n; i++)
   {   
      #pragma omp for
      for (j = 0; j < m; j++)
         x[i][j] = x[i-1][j];
   }
}

因为它的性能和这个类似

for (i = 1; i < n; i++)
{   
   #pragma omp parallel for private(j)
   for (j = 0; j < m; j++)
      x[i][j] = x[i-1][j];
}

感谢 GCC 中的内置线程重用libgomp，根据这篇文章：http://bisqwit.iki.fi/story/howto/openmp/ http://bisqwit.iki.fi/story/howto/openmp/

由于外循环无法并行化（没有ordered选项）看起来没有办法使用 OpenMP 显着提高相关程序的性能。如果有人觉得我做错了什么，而且这是可能的，我会很高兴看到并测试解决方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

嵌套循环、内循环并行化、重用线程的相关文章

如何使用 ASP.NET MVC 编辑多选列表？

我想编辑一个如下所示的对象我希望用 UsersGrossList 中的一个或多个用户填充 UsersSelectedList 使用 mvc 中的标准编辑视图我只得到映射的字符串和布尔值下面未显示我在 google 上找到的许多示例都
元组在 VS2012 中如何工作？

Visual Studio 2012 功能 tuples但不是可变参数模板这是如何完成的如何在不使用可变模板的情况下实现元组简而言之微软做了与之前在 NET 中实现类似元组的数据类型完全相同的事情创建许多版本每个版本都有固定数量
是否可以从 C++ 应用程序调用 C# 应用程序？

我是一名编程学生现在我已经上了两门 C 课程这个学期我将参加我的第一门 C 课程出于好奇是否可以从 C 应用程序调用 C 应用程序如果是的话是否还可以检查运行该程序的计算机是否具有 NET框架我只是很好奇我想如果可能的话这
C# 处理标准输入

我目前正在尝试通过命令行断开与网络文件夹的连接并使用以下代码 System Diagnostics Process process2 new System Diagnostics Process System Diagnostics Pr
将下拉列表与字典绑定

我将字典绑定到下拉列表举例来说我的字典中有以下项目 Test1 123 Test2 321 我希望下拉文本采用以下格式 Test1 Count 123 Test2 Count 321 我沿着以下路径走但没有运气 MyDropDown
全局使用和 .NET Standard 2.0

我最近意识到我可以使用 C 10 功能文件范围的命名空间在 NET Standard 2 0 项目中也可以通过设置
带有运算符语法的错误消息，但不带有函数语法的错误消息

为什么我在调用 unary 时收到错误消息使用运算符语法如果我用函数语法调用它就可以了现场演示 https godbolt org z j7AbeQ template
有什么方法可以重载 C# 中的扩展方法吗？

我有以下模型模式 public abstract class PARENTCLASS public class CHILD A CLASS PARENTCLASS public static class EXTENSION public s
在 C++11 中移出 stdpriority_queue 的元素

最小的工作示例 include
Xamarin - SignalR 挂在连接上

我正在尝试将我的 Xamarin 应用程序连接到托管在 Azure 上的 SignalR 后端我遇到的问题是每次我在 HubConnection 上调用 StartAsync 时它都会挂起客户端并且请求永远不会完成我尝试通过应用程序进
为什么不能调用带有 auto& 参数的 const mutable lambda？

include
将错误代码映射到 C++ 中的字符串

将错误代码从枚举映射到字符串的更有效方法是什么在 C 中例如现在我正在做这样的事情 std string ErrorCodeToString enum errorCode switch errorCode case ERROR ONE
doxygen c++：记录由“using”声明公开的私有继承成员

作为一个例子我有以下课程 class A public void methodOne class B private A public Brief description using A methodOne 我还没有找到强制 doxyge
ALTER TABLE ... ADD CONSTRAINT 失败时将事务回滚到保存点

有没有办法在事务中添加检查约束and如果失败回滚到以前的保存点而不是回滚整个事务就我而言当 ALTER TABLE ADD CONSTRAINT 命令失败时事务无法回滚到保存点尝试这样做会引发 InvalidOperationEx
为什么 f(i = -1, i = -1) 是未定义的行为？

我正在读关于违反评估顺序 http en cppreference com w cpp language eval order 他们举了一个令我困惑的例子 1 如果标量对象上的副作用相对于同一标量对象上的另一个副作用是无序的则行为未定义
使用 xslt 将 xml 转换为 xsl-fo 时动态创建超链接？

我想使用 xsl 文件在 PDF 报告中创建标题如果源文件包含超链接则应将其呈现为超链接否则呈现为纯文本例如我的 xml 如下所示 a href http google com target blank This is the h
如果“嵌入式”SQL 2008 数据库文件不存在，如何创建它？

我使用 C ADO Net 和在 Server Management Studio 中创建的嵌入式 MS SQL 2008 数据库文件附加到 MS SQL 2008 Express 创建了一个数据库应用程序有人可以向我指出一个资源该资
SQL Server“未找到网络路径”在不同环境中随机且不频繁地发生

类似如果不是同一个问题随机遇到网络路径未找到异常 https stackoverflow com questions 38696448 network path not found exception encountered rando
为什么表达式 a = a + b - ( b = a ) 在 C++ 中给出序列点警告？

以下是测试代码 int main int a 3 int b 4 a a b b a cout lt lt a lt lt a lt lt lt lt b lt lt b lt lt n return 0 编译此命令会出现以下警告 gt g
嵌入式二进制资源 - 如何枚举嵌入的图像文件？

我按照中的说明进行操作这本书 http www apress com book view 9781430225492 关于资源等的章节我不太明白的是如何替换它 images Add new BitmapImage new Uri Ima

随机推荐

d3js 在饼图周围重新分布标签

我正在使用 d3 js 创建一个外部带有标签的圆环图我使用基于饼图每片质心的三角函数来定位标签 g append g attr class percentage append text attr transform function d
持久 Akka 邮箱和无损

在 Akka 中当一个 actor 在处理消息时死亡内部onReceive 该消息丢失有没有办法保证无损有没有办法配置 Akka 始终保留消息before将他们发送到onReceive 以便在演员死亡时可以恢复并重播也许像持久邮箱
我应该如何在 Angular 模块中包含模型类？

我有几个类我想成为一个普通的 bean DTO 类它们不显示 component 类它们不是 Pipe 类也不应该是 Directive 至少我认为不应该是我希望能够将它们捆绑到一个模块中它们将在其他模块中使用但尽管有几个咒
scala string.split 不起作用

以下是我的 REPL 输出我不确定为什么 string split 在这里不起作用 val s Pedro groceries apple 1 42 s java lang String Pedro groceries apple 1 4
根据用户输入更改 AppID 和 AppName

我想在同一系统上多次安装同一应用程序例如两个用户使用两个不同的 Web 服务每个都有自己的在我的设置脚本中我想更改AppID and AppName基于用户的输入例如我的默认值AppName Service App 应该改为AppN
如何使用Vault在Ansible v2中运行playbook api

这是我所拥有的我知道这无需加密即可运行并且我可以运行 ansible vault 编辑 common yml with ANSIBLE VAULT PASSWORD FILE vault pass txt 在环境中设置 from col
Gerrit 可以在 Gitlab 之前工作吗？还是打算取代它

我认为我并没有真正理解 Gerrit 如何融入我团队现有的工作流程 Gerrit 是否打算成为代码的中心枢纽我一直把它想象成类似于 Atlassian 的 Crucible 它适合 Atlassian 的 Stash 或 Bitbuck
C# 反应式扩展当 OnNext 花费很长时间并且可观察到产生新事件时会发生什么

我是 Rx 新手我在想当 IObservable 非常快地产生大量事件而 OnNext 需要很长时间时会发生什么我猜想新事件会在内部以某种方式排队这样我就可以运行我们的内存我对吗考虑下面的小例子 Subject
如何对 json 数组值进行排序？

我想将此 json 转换为按日期排序的 html 表基本上我的 JSON 数据看起来像这样这里我要recurrence列出日期 var frequencyList project abc recurrenceList 2021 09 1
IBrokers reqMktData，如何在回调函数中添加超时？

我一直在使用来自 IBrokers 软件包的修改后的快照功能来从 IB 获取最后价格并且它对于流动性股票非常有效我打的电话是例如 reqMktData tws twsSTK AAPL eventWrapper eWrapper da
Ansible/Jinja2 - 映射列表中的嵌套键

当映射嵌套变量列表中的属性时我无法检索其键我想从下面检索 tls cert file 的密钥强调文字变量 vault config listener tcp address 0 0 0 0 8200 tls cert file etc
JS 线性变换和矩阵乘法失败

我正在学习线性代数并尝试制作一个具有基本线性变换的小程序旋转缩放平移这是完整的工作示例我编写了用于为每个变换生成每个矩阵的函数以及用于计算它们的函数矩阵与点相乘矩阵相乘 export const multiplyMatrixW
当我为rabbitmq-management创建用户时，发生了错误

当我为rabbitmq创建用户时 root localhost rabbitmqctl add user admin admin 发生错误消息 Creating user admin Error undef crypto hash sha
Yocto 构建上的 JAVA 安装错误

我在 Poky Linux 系统上安装 Java 时遇到了很多麻烦我正在使用 Yocto 构建我的系统配置如下本地配置文件 MACHINE intel corei7 64 DISTRO poky PACKAGE CLASSES pac
emberjs 文档就绪函数应该放在哪里？

我正在尝试附加一个预先输入 https github com twitter typeahead js 到我的模板之一中的文本输入因为 Ember 使用把手所以 jQuery 的文档就绪函数不是用于预输入定义的地方放置模板就绪代码
vim + iterm：如何使用鼠标执行除选择之外的所有操作？

好的有一个非常具体的设置问题我使用的是 Mac OS X iTerm 和 vim 我真的很喜欢使用鼠标在正常模式下单击选项卡在正常模式下滚动等例如我鼠标已经可以工作了在 iTerm vim 中但是我不喜欢使用视觉模式进行选择
在构建期间将 Visual Studio 项目文件复制到输出目录

当我生成 Visual Studio 项目时可执行文件将写入项目属性页中指定的输出目录我有一个包含一些额外文件的项目例如 ini文件由程序使用如何配置项目以将文件复制到输出目录以便当程序运行时它的 CWD 中有另一个文件的副本
优化 Node.js 内存消耗

我正在用 Node js Express 和 MongoDB 编写一个简单的 cms 我计划为每个站点运行不同的 Node js 进程问题是启动后该进程需要大约 90m 的 RAM 对我来说太大了 8 个站点占用了所有服务器 RAM 该内
删除从另一个指针分配的指针，我应该再次删除另一个指针吗？

所以这是我的例子来解释这个问题 void p1 int p2 p3 p2 new int p1 p2 p3 int p1 要释放内存以下 3 行是否彼此等效 delete p2 delete p3 delete int p1 我使用这样
嵌套循环、内循环并行化、重用线程

免责声明以下示例只是一个快速理解问题的虚拟示例如果您正在考虑现实世界的问题请考虑任何动态编程问题我们有一个 n m 矩阵我们想要复制前一行的元素如以下代码所示 for i 1 i lt n i for j 0 j lt m j

嵌套循环、内循环并行化、重用线程

嵌套循环、内循环并行化、重用线程 的相关文章

随机推荐

热门标签

嵌套循环、内循环并行化、重用线程的相关文章