为什么 OpenMP 版本较慢？

2024-01-12

我正在尝试使用 OpenMP。我编写了一些代码来检查其性能。在具有 Kubuntu 11.04 的 4 核单 Intel CPU 上，使用 OpenMP 编译的以下程序比不使用 OpenMP 编译的程序慢约 20 倍。为什么？

我通过 g++ -g -O2 -funroll-loops -fomit-frame-pointer -march=native -fopenmp 编译它

#include <math.h>
#include <iostream>

using namespace std;

int main ()
{
  long double i=0;
  long double k=0.7;

  #pragma omp parallel for reduction(+:i)
  for(int t=1; t<300000000; t++){       
    for(int n=1; n<16; n++){
      i=i+pow(k,n);
    }
  }

  cout << i<<"\t";
  return 0;
}

问题是变量 k 被认为是共享变量，因此它必须在线程之间同步。避免这种情况的可能解决方案是：

#include <math.h>
#include <iostream>

using namespace std;

int main ()
{
  long double i=0;

#pragma omp parallel for reduction(+:i)
  for(int t=1; t<30000000; t++){       
    long double k=0.7;
    for(int n=1; n<16; n++){
      i=i+pow(k,n);
    }
  }

  cout << i<<"\t";
  return 0;
}

按照 Martin Beckett 在下面的评论中的提示，您也可以在循环外部声明 k const，而不是在循环内部声明 k。

否则，ejd是正确的——这里的问题似乎不是并行化不好，而是代码并行化时优化不好。请记住，gcc 的 OpenMP 实现还很年轻，远非最佳。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

openmp

为什么 OpenMP 版本较慢？的相关文章

VLC 媒体播放器有 C# 界面吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否可以使用 C 控制台应用程序中的包装器从 VLC 播放中当前播放的文件中读取曲目统计信息时间标
如何从字符串中提取子字符串直到遇到第二个空格？

我有一个像这样的字符串 o1 1232 5467 1232 5467 1232 5467 1232 5467 1232 5467 1232 5467 如何仅提取 o1 1232 5467 要提取的字符数并不总是相同因此我只想提取直到遇到
是否需要销毁运算符删除的形式才能真正销毁对象？

C 20 添加了破坏形式operator delete区别于std destroying delete t范围它导致delete表达式在调用之前不再销毁对象operator delete 目的是在显式调用对象的析构函数和释放内存之前允许
静态构造函数和 BeforeFieldInit？

如果类型没有静态构造函数则将执行字段初始值设定项就在使用该类型之前或者在某个时间点突发奇想运行时为什么这段代码 void Main start Dump Test EchoAndReturn Hello end Dump clas
使用 ADAL v3 使用 ClientID 对 Dynamics 365 进行身份验证

我正在尝试对我们的在线 Dynamics CRM 进行身份验证以使用可用的 API 我能找到的唯一关于执行此操作的官方文档是 https learn microsoft com en us dynamics365 customer enga
是否可以使用 http url 作为 DirectShow .Net 中源过滤器的源位置？

我正在使用 DirectShow Net 库创建一个过滤器图该过滤器图通过使用 http 地址和 WM Asf Writer 来流式传输视频然后在网页上我可以使用对象元素在 Windows Media Player 对象中呈现视频源
C# 中一次性对象克隆会导致内存泄漏吗？

检查这个代码 class someclass IDisposable private Bitmap imageObject public void ImageCrop int X int Y int W int H imageObject
Selenium - C# - Webdriver - 无法找到元素

在 C 中使用 selenium 我试图打开浏览器导航到 Google 并找到文本搜索字段我尝试下面的 IWebDriver driver new InternetExplorerDriver C driver Navigate GoT
MVC 5 中具有 ASP.NET Identity 的 Autofac 不会验证 OWIN 管道中的安全标记

我在 MVC 5 中设置了 AutoFac 来与 ASP NET Identity 一起使用表面上一切似乎都工作正常即用户可以创建帐户并登录但后来我发现当安全标记更改时用户不会注销通过在 AspNetUsers 表中进行暴力破解
如何防止 Blazor NavLink 组件的默认导航

从 Blazor 3 1 Preview 2 开始应该可以防止默认导航行为 https devblogs microsoft com aspnet asp net core updates in net core 3 1 preview
Unity c# 四元数：将 y 轴与 z 轴交换

我需要旋转一个对象以相对于现实世界进行精确旋转因此调用Input gyro attitude返回表示设备位置的四元数另一方面这迫使我根据这个四元数作为默认旋转来计算每个旋转将某些对象设置为朝上的简单方法如下 Vector3 up I
ASP.NET Core 中间件与过滤器

在阅读了 ASP NET Core 中间件之后我对何时应该使用过滤器以及何时应该使用中间件感到困惑因为它们似乎实现了相同的目标什么时候应该使用中间件而不是过滤器 9频道有一个关于此的视频 ASP NET 怪物 91 中间件与过滤器 h
C++ 指针引用混淆

struct leaf int data leaf l leaf r struct leaf p void tree findparent int n int found leaf parent 这是 BST 的一段代码我想问一下为什么
任何人都可以清楚地告诉如何在不使用像这样的预定义函数的情况下找到带有小数值或小数值的指数吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案例如 2 0 5 1 414 所以想要我是 c 的新手所以请解释简单的逻辑如果不是复杂的逻辑也足够了在数学中从整数取幂到实数
如何组合两个 lambda [重复]

这个问题在这里已经有答案了可能的重复在 C 中组合两个 lambda 表达式 https stackoverflow com questions 1717444 combining two lamba expressions in c
Streamwriter 覆盖 txt 文件中的文本

有没有什么方法可以重新打开流写入器而不创建新的写入对象因为此时当调用 WriteOdd 时 streamwriter 正在覆盖在它之前调用的 WriteEven public void WriteEven StreamWriter wr
.Net Reactive Extensions Framework (Rx) 是否考虑拓扑顺序？

Net 反应式扩展框架是否按拓扑顺序传播通知以最大限度地减少更新量就像 Scala Rx 所做的那样 Net 反应式扩展 Rx 是否可以 https github com lihaoyi scala rx wiki How it Work
ContentDialog Windows 10 Mobile XAML - 全屏 - 填充

我在项目中放置了一个 ContentDialog 用于 Windows 10 上的登录弹出窗口当我在移动设备上运行此项目时 ContentDialog 未全屏显示并且该元素周围有最小的填充在键盘上可见例如在焦点元素文本框上键盘和内
如何为有时异步的操作创建和实现接口

假设我有数百个类它们使用计算方法实现公共接口一些类将执行异步例如读取文件而实现相同接口的其他类将执行同步代码例如将两个数字相加为了维护和性能对此进行编码的好方法是什么到目前为止我读到的帖子总是建议将异步等待方法冒泡给调
嵌入式linux编写AT命令

我在向 GSM 模块写入 AT 命令时遇到问题当我使用 minicom b 115200 D dev ttySP0 term vt100 时它工作完美但我不知道如何在 C 代码中做同样的事情我没有收到任何错误但模块对命令没有反应有

随机推荐

将 QString 转换为 char* [重复]

这个问题在这里已经有答案了可能的重复 QString 到 char 的转换 https stackoverflow com questions 2523765 qstring to char conversion 我有一个函数 STL 中
分段阅读_第 2538 章

我是 IBM Websphere MQ 新手我正在尝试将消息添加到远程 websphere MQ 队列管理器我在尝试连接时遇到以下错误另外我尝试了论坛中提供的许多可能的解决方案例如将 net 框架更改为 3 5 当我 ping 远
是否可以在 Spring Boot 应用程序中使用 ObjectDB

我想在我的 Spring Boot 应用程序中使用 ObjectDB 我应该如何配置application yml文件我不想将 persistence xml 添加到我的应用程序中那可能吗您可以按照本教程操作 http spring
Rails：渲染 XML 添加标签

我有一个 Rails 控制器它将以 XML 格式输出散列例如 class MyController lt ApplicationController GET example xml def index output a gt b res
是否可以拥有多行 DataGridView 单元格而不换行文本？

我知道我可以设置WrapMode为真DefaultCellStyle of the RowTemplate 但这并没有给我我想要的行为我在每个单元格中显示字符串列表因此我希望识别回车符但我不希望长项目换行中的文本有谁知道是否可以实现
如何将元素转换为与第一个选定元素相同的大小？

我想将所有元素的大小设置为第一个选定元素的大小但我的代码似乎有问题不知何故第一个元素大小对其他人不起作用请参阅附件脚本 Make all elements same size function sameSizeElements var
C++ Builder：刷新 FireMonkey 可视组件

我在使用 C Builder 和 FireMonkey 时遇到问题我正在创建一个与 Datasnap Rest WebService 连接的移动应用程序有些请求有点长所以我想显示一条等待消息这是我的代码 lbl testConnex
iOS 上的 VoIP 套接字 - 未收到通知

我有一个 VoIP 应用程序它使用 TCP 服务在来电时唤醒它 TCP 套接字是使用以下代码片段创建的 CFReadStreamRef read NULL CFWriteStreamRef write NULL CFStreamCreat
可测试 iframe 应用程序的架构 - Facebook C# SDK 的最佳实践

我正在努力为我的项目建立基本架构ASP NET MVC Facebook iframe正在运行的应用程序微软Azure 我知道有一些基本示例以及如何使用该工具包但对于大型应用程序来说我似乎需要一个非常好的架构来开始开发此外许多其他
如何取消await Task.Delay()？

正如您在这段代码中看到的 public async void TaskDelayTest while LoopCheck for int i 0 i lt 100 i textBox1 Text i ToString await Task
在 S s = S() 中是否保证不会创建临时对象？

在下面的代码中有pS and s pS保证最后一行相等换句话说在声明中S s S 我能否确定暂时S不会被建造吗 include
SQL Server - 按所有组返回的记录数进行聚合

假设我的 SQL Server 2012 数据库中有下表 MyTable DateCol FkId Sector Value 2018 01 01 1 A 1 2018 01 02 1 A 2 2018 01 03 1 A 3 2018 0
画布 - 洪水填充在透明 PNG 图像的边缘留下白色像素

现在我尝试使用文章中的洪水填充算法执行洪水填充算法来填充透明PNG图像在洪水填充算法期间如何避免超过最大调用堆栈大小 https stackoverflow com questions 59833738 how can i avoid e
Git 更改 repo 目录和文件目录

我最终将 git 存储库移动到另一个目录以及所有文件的更改目录现在当我将文件添加到索引并提交它时它的行为就好像提交一个新文件而不提交差异尽管当我在 Git 扩展中提取历史记录时所有历史记录都在那里并且最近的提交仍然附加到主服务器
为什么这段代码容易受到缓冲区溢出攻击？

int func char str char buffer 100 unsigned short len strlen str if len gt 100 return 1 strncpy buffer str strlen str ret
如何将 VueComponent 传递给 $vuetify.goTo() 方法？

我有 3 个视图组件分别名为 home about 和 work 在App vue文件中
为什么没有 oracle Forms 或 Reports 反编译器？（技术上）

我不明白为什么我找不到这样的工具 oracle Forms 或 Reports 反编译器这是非常有价值的因为很多企业都使用基于oracle的系统有谁知道 FMX 或 REP 格式文件结构有什么特殊之处导致无法为其构建反编译器鉴于他
“iframe 元素上的frameborder 属性已过时。请改用CSS。”

我正在尝试使用 W3C 验证器验证我的网站但它不起作用我有一个 YouTube iframe 这是错误 iframe 元素上的frameborder 属性已过时请改用 CSS 截屏这是我的index html 裁剪后的 div cl
是什么杀死了我的进程，为什么？

我的应用程序在 Linux 上作为后台进程运行目前它是在终端窗口中的命令行启动的最近一名用户在执行该应用程序一段时间后它神秘地死掉了文本 Killed 在终端上这种情况发生过两次我问是否有人在不同的终端使用kill命令来终止进
为什么 OpenMP 版本较慢？

我正在尝试使用 OpenMP 我编写了一些代码来检查其性能在具有 Kubuntu 11 04 的 4 核单 Intel CPU 上使用 OpenMP 编译的以下程序比不使用 OpenMP 编译的程序慢约 20 倍为什么我通过 g g

为什么 OpenMP 版本较慢？

为什么 OpenMP 版本较慢？ 的相关文章

随机推荐

热门标签

为什么 OpenMP 版本较慢？的相关文章