C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器

2024-04-28

考虑以下代码：

#include <iostream>
#include <chrono>
#include <vector>
#include <numeric>
#include <cmath>
#include <omp.h>

using namespace std;

typedef std::chrono::steady_clock myclock;

double measure_time(myclock::time_point begin, myclock::time_point end)
{
    return std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count()/(double)1e6;
}

int main()
{
    int n = 20000;
    vector<double> v(n);
    iota(v.begin(), v.end(), 1.5);

    vector< vector<double> > D(n, vector<double>(n,0.0));

    myclock::time_point begin, end;

    begin = myclock::now();

    //#pragma omp parallel for collapse(2)
    //#pragma omp parallel for
    for(size_t i = 0; i < n - 1; i++){
        for(size_t j = i+1; j < n; j++){
            double d = sqrt(v[i]*v[i] + v[j]*v[j] + 1.5*v[i]*v[j]);
            D[i][j] = d;
            D[j][i] = d;
        }
    }

    end= myclock::now();
    double time = measure_time(begin, end);
    cout<<"Time: "<<time<<" (s)"<<endl;
    return 0;
}

用于编译：

g++ -std=c++11 -fopenmp -o main main.cpp

我获得了以下运行时间：

With #pragma omp parallel for collapse(2): 7.9425（秒）
With #pragma omp parallel for: 3.73262（秒）
没有 OpenGM：11.0935（秒）

系统设置：Linux Mint 18.3 64位，g++ 5.4.0，四核处理器。

我希望第一个比第二个更快（仅并行化外循环）并且比第三个快得多。

请问我做错了什么？第一个和第二个都在所有 8 个线程上运行。

预先感谢您的帮助！

当迭代依赖于另一个循环时，不应使用塌陷子句。看了解 openmp 中的折叠子句 https://stackoverflow.com/questions/28482833/understanding-the-collapse-clause-in-openmp/28483812#28483812.

在您的情况下，由于对称性，您正在遍历矩阵的下三角形（不包括对角线）。这将迭代次数大约减少了一半。如果你想融合/折叠双环，你可以像这样手动完成（参见结尾）这个答案 https://stackoverflow.com/a/33836073/2542702更多细节）。

for(size_t k=0; k<n*(n-1)/2; k++) {
    size_t i = k/n, j = k%n;
    if(j<=i) i = n - i - 2, j = n - j - 1;
    double d = sqrt(v[i]*v[i] + v[j]*v[j] + 1.5*v[i]*v[j]);
    D[i][j] = d;
    D[j][i] = d;
}

我认为大多数人认为折叠循环会带来更好的性能，但事实往往并非如此。根据我的经验，大多数时候性能没有差异，但在某些情况下，由于缓存问题，性能会更差。在某些情况下效果更好。你必须测试一下自己。

至于为什么您的代码在使用崩溃子句时速度慢了一倍，我只能猜测，因为您的 OpenMP 实现运行的内部循环的效果未指定j from [0,n)即完整矩阵而不是一半矩阵。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器的相关文章

中间件 API 的最佳实践是什么？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我们正在开发一个中间件 SDK 采用 C 和 Java 语言供游戏开发人员动画软件开发人员阿凡达开
CMake 和 Visual Studio：如何获得快速、安静的命令行构建？

我有一个 cmake 项目它成功地完成了我想要的一切但我有大约 100 个文件当我只需要重新编译一个文件时我厌倦了每次看到生成的巨大输出每个文件 30 行明确地说我正在编译cmake build 得到这个结果我需要传递给编译
C 中的复合语句表达式

下面的代码不起作用 int i void 999 100 添加括号就可以了为什么 int i void 999 100 还有另一种方法可以完成此类分配 int i void 999 100 是什么让他们与众不同在这份声明中 int i
将指针转换为浮点数？

我有一个unsigned char 通常这指向一块数据但在某些情况下指针就是数据即铸造一个int的价值unsigned char 指针 unsigned char intData unsigned char myInteger 反
我们如何将数据从一个打开的表单传递到另一个打开的表单？

winform中如何将数据从一个窗体传递到另一个打开的窗体在 Windows 应用程序中一个窗体打开另一个窗体当我在父表单中输入一些数据时这些数据将立即反映在另一个子表单中这将如何发生取决于你想要多花哨最简单的方法就是直接调用
避免集合已修改错误

Issue 我有以下代码 foreach var ItemA in GenericListInstanceB ItemA MethodThatCouldRemoveAnyItemInGenericListInstanceB 显然我得到一个错
使用静态类型代替变量

当您的项目不使用命名空间时有什么方法可以告诉编译器使用静态类型而不是变量吗例如我有一个名为 User 的类它具有各种静态和非静态方法假设调用了其中一个静态方法GetUser 我想称之为User GetUser 方法来自一个方法该
C++ 非类型参数包扩展

我正在编写由单一类型参数化的模板函数并且具有可变数量的相同类型而不是不同类型的参数它应该检查第一个值是否在其余值中我想这样写 include
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
C++ 中的 Java ArrayList [重复]

这个问题在这里已经有答案了在Java中我可以做 List
控制器中的异常处理 (ASP.NET MVC)

当您自己的代码抛出异常并从控制器中的操作调用时应该如何处理我看到很多最佳实践的例子其中根本没有 try catch 语句例如从存储库访问数据 public ViewResult Index IList
以标准用户身份打开默认浏览器 (C++)

我目前正在使用 ShellExecute 打开在用户浏览器中打开 URL 但在 Win7 和 Vista 中遇到了一些麻烦因为该程序作为服务运行提升当 ShellExecute 打开浏览器时它似乎读取本地管理员配置文件而不是用户
套接字：监听积压并接受

listen sock backlog 在我看来参数backlog限制连接数量这是我的测试代码 server initialize the sockaddr of server server sin family AF INET ser
如何用C++解析复杂的字符串？

我试图弄清楚如何使用解析这个字符串sstream 和C 其格式为 string int int 我需要能够将包含 IP 地址的字符串的第一部分分配给 std string 以下是该字符串的示例 std string 127 0 0 1 1
System.diagnostics.process 进程在托管后无法在 IIS 上运行？

我正在尝试从网络应用程序安装 exe 当我在本地运行应用程序从 asp 开发服务器时它安装正确但当我托管在 IIS 上时它不起作用我在asp net页面的Page load方法上编写了这段代码想要在客户端计算机上安装Test
需要使用 openssl 加密和解密文件的示例 C 代码

我正在用 Linux C 编写代码我需要使用以下命令来加密和解密文件 openssl 目前我使用系统命令 des3 e nosalt k 0123456789012345 in inp file out out file 进行加密使用
在类中使用 std::chrono::high_resolution_clock 播种 std::mt19937 的正确方法是什么？

首先大家好这是我在这里提出的第一个问题所以我希望我没有搞砸在写这篇文章之前我用谷歌搜索了很多我对编码 C 很陌生我正在自学考虑到有人告诉我只为任何随机引擎播种一次是一个很好的做法我在这里可能是错的什么是正确最佳更有效
具有多种类型的 C# 泛型类型推断

我有以下通用方法用于将一种类型的输入对象序列化为超类型如下所示 public string SerialiseAs
如何向 ItemsControl 中的 WPF 按钮添加相同的命令

如何将命令添加到 wpf 按钮该按钮是ItemsControl并正在修改ItemsSource itself 这是我的 XAML
如何将 char 转换为 unsigned int？

我有一个字符数组它实际上用作字节数组而不是用于存储文本在数组中有两个特定字节表示我需要存储到无符号 int 值中的数值下面的代码解释了设置 char bytes bytes 2 bytes 0 0x0C For the sake

随机推荐

从 android fb sdk 向 facebook 墙发布消息总是错误

我的 Android 版 fb sdk 有问题从下载http github com facebook facebook android sdk http github com facebook facebook android sdk 尝
Ionic框架和php mysql

我是 Ionic Apahce Cordova 的新手我创建了一个简单的应用程序它具有静态列表视图项但我想从 MYSQL 表获取数据并将其替换到我的静态列表中我用谷歌搜索了一下有人在研究它但我不知道应该把我的 php 文件放在哪
为 COM 互操作注册、gac 程序集时顺序重要吗？

在为 COM Interop 注册 NET 程序集时我做了两件事目前按以下顺序进行 regasm tlb MyDll tlb Mydll dll gacutil i Mydll dll I use regasm为 COM 注册类型库并g
在 Android 中 - 如何使用 ClickableSpan 只注册长点击

我想注册对包含在 ClickableSpan 中的文本的点击前提是点击时间超过 1 秒有什么办法可以做到这一点吗如果没有捕获双击也可以如果 onClick 方法捕获了一个包含有关点击的一些元数据的事件那就太好了那么如果点击长度
Espresso + Junit4 - 在运行所有测试之前登录一次

我想为我的一个应用程序编写一些自动化测试所有功能都需要登录所以我已经编写了测试但对于每个测试它都是进行登录并测试功能有没有办法帮助我只登录一次然后运行所有测试最简单的方法是仅用一种测试方法编写所有测试但我认为实现这一目标的方
iCloud Core Data 在 Xcode 6 / ios 8 SDK 中运行后不可用

我有一个使用 Core Data 和 iCloud 同步的应用程序它在 iOS 7 中运行良好自从在 XCode 6 中运行它以来即使在 iOS 7 设备上我也遇到了一些问题这是我的测试在 iOS 7 设备上从应用程序商店下载
as3命名空间-获取一个带有减号的属性[重复]

这个问题在这里已经有答案了可能的重复 e4x as3 如何访问名称中带有破折号的节点 https stackoverflow com questions 5317404 e4x as3 how to access a node with
通过 AJAX 加载 Google Maps API，控制台错误

我正在使用 jquery javascript ajax 和 php 构建一个完全动态的网站当我单击导航链接时浏览器会使用 ajax 打开该页面所以基本上所有页面都加载在同一个index php 中如果我转到位置选项卡其中有谷
带有标题的图片库，在 keystonejs 上使用 CloudinaryImage

我正在使用 keystonejs 和 CloudinaryImages 创建图像库 type Types CloudinaryImages 我需要能够为图像添加标题我也在读这个 https github com keystonejs ke
使用 Weblogic (beadep) 说“在服务器上运行”时未正确生成 application.xml

我在使用过程中总会遇到以下情况在服务器上运行在我的马化EAR项目情况如果我对 EAR 项目执行以下步骤 mvn 干净安装在服务器上运行将导致 The 应用程序 xml产生于Maven将是正确的
将 TextField 与 LibGDX 结合使用

我正在使用 LibGDX 开发一款 Android 游戏并且想要实现两个TextFields 登录到服务器据我所知我需要使用Stage https libgdx badlogicgames com nightlies docs api
我想从 Cakefile 运行 d3

我想从命令行执行一些 d3 代码最初我只是尝试了类似的方法 task data Build some data with d3 gt d3 require lib d3 v2 console log d3 version d3 versi
ActionsSdkApp 和 DialogflowApp for Google Assistant 有什么区别

为了构建 Google Assistant 应用程序 Google 提供了两个不同的 API 作为其 node js actions on google 库的一部分 https developers google com actions r
具有 ItemsControl 嵌入网格的 SharedGridSize 组

我正在尝试使用以下方法将多个网格嵌入到另一个网格中ItemsControl并使所有子网格共享相同的行高
Android 中的 EditText onClickListener

我想要一个 EditText 它在按下时创建一个 DatePicker 所以我写了下面的代码 mEditInit EditText findViewById R id date init mEditInit setOnClickListen
使用 Knockout 验证插件时 Knockout ViewModel isValid 错误

我是使用淘汰赛的新手我正在尝试将淘汰赛验证插件与映射插件一起使用我在视图模型对象上的 isValid 函数上遇到问题根据文档 isValid 应该返回一个 bool 来确定视图模型上的任何可观察量是否有效但是当我调用它时我收到一条
如何使用 Objective C 获取 iPhone 中的 GPS 坐标

我想从 iPhone 获取 GPS 坐标并将这些 GPS 坐标发送到网络服务该网络服务将获取我的 GPS 坐标并向我发送距离当前位置最近的 ATM 的位置现在我想分两个阶段进行第一阶段我只想将 GPS 坐标发送到网络服务作为回报
Angular 10 - CommonJS 或 AMD 依赖项可能导致优化救助

我已从 Angular 7 1 4 更新到 10 现在我收到类似这样的奇怪警告 C Sviluppo Welcome welcome cloud app src app calendario fasce mese mese componen
Xcode 7.1 在归档 swift ios 应用程序时挂起

Xcode 7 1 在归档应用程序时挂在复制 Swift 标准库处知道为什么吗对于面临同样问题的其他人在尝试了其他所有方法并失败后通过重新启动 mac 来修复它 D
C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器

考虑以下代码 include

C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器

C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器 的相关文章

随机推荐

热门标签

C++ OpenMP：嵌套循环，其中内部迭代器依赖于外部迭代器的相关文章