使用 OpenMP 并行化 while 循环

2023-12-26

我有一个非常大的数据文件，这个数据文件中的每条记录有4行。我编写了一个非常简单的 C 程序来分析这种类型的文件并打印出一些有用的信息。该程序的基本思想是这样的。

int main()
{
  char buffer[BUFFER_SIZE];
  while(fgets(buffer, BUFFER_SIZE, stdin))
  {
    fgets(buffer, BUFFER_SIZE, stdin);
    do_some_simple_processing_on_the_second_line_of_the_record(buffer);
    fgets(buffer, BUFFER_SIZE, stdin);
    fgets(buffer, BUFFER_SIZE, stdin);
  }
  print_out_result();
}

这当然遗漏了一些细节（健全性/错误检查等），但这与问题无关。

该程序运行良好，但我正在使用的数据文件很大。我想我会尝试通过使用 OpenMP 并行化循环来加速程序。不过，经过一番搜索后，OpenMP 似乎只能处理for预先知道迭代次数的循环。因为我事先不知道文件的大小，甚至不知道像这样的简单命令wc -l运行时间很长，如何并行化这个程序？

正如 thiton 提到的，这段代码可能是 I/O 限制的。然而，如今许多计算机可能都配备了 SSD 和高吞吐量 RAID 磁盘。在这种情况下，您可以通过并行化来提高速度。此外，如果计算量很大，那么并行化会获胜。即使 I/O 由于带宽饱和而被有效串行化，您仍然可以通过将计算分配给多核来获得加速。

回到问题本身，您可以通过 OpenMP 并行化此循环。和stdin，我不知道并行化，因为它需要顺序读取并且没有结束的先验信息。但是，如果您正在处理典型文件，则可以做到。

这是我的代码omp parallel。我使用了一些 Win32 API 和 MSVC CRT：

void test_io2()
{
  const static int BUFFER_SIZE = 1024;
  const static int CONCURRENCY = 4;

  uint64_t local_checksums[CONCURRENCY];
  uint64_t local_reads[CONCURRENCY];

  DWORD start = GetTickCount();

  omp_set_num_threads(CONCURRENCY);

  #pragma omp parallel
  {
    int tid = omp_get_thread_num();

    FILE* file = fopen("huge_file.dat", "rb");
    _fseeki64(file, 0, SEEK_END);
    uint64_t total_size = _ftelli64(file);

    uint64_t my_start_pos = total_size/CONCURRENCY * tid;
    uint64_t my_end_pos   = min((total_size/CONCURRENCY * (tid + 1)), total_size);
    uint64_t my_read_size = my_end_pos - my_start_pos;
    _fseeki64(file, my_start_pos, SEEK_SET);

    char* buffer = new char[BUFFER_SIZE];

    uint64_t local_checksum = 0;
    uint64_t local_read = 0;
    size_t read_bytes;
    while ((read_bytes = fread(buffer, 1, min(my_read_size, BUFFER_SIZE), file)) != 0 &&
      my_read_size != 0)
    {
      local_read += read_bytes;
      my_read_size -= read_bytes;
      for (int i = 0; i < read_bytes; ++i)
        local_checksum += (buffer[i]);
    }

    local_checksums[tid] = local_checksum;
    local_reads[tid]     = local_read;

    fclose(file);
  }

  uint64_t checksum = 0;
  uint64_t total_read = 0;
  for (int i = 0; i < CONCURRENCY; ++i)
    checksum += local_checksums[i], total_read += local_reads[i];

  std::cout << checksum << std::endl
    << total_read << std::endl
    << double(GetTickCount() - start)/1000. << std::endl;
}

这段代码看起来有点脏，因为我需要精确分配要读取的文件量。然而，代码相当简单。请记住的一件事是您需要有一个每线程文件指针。您不能简单地共享文件指针，因为内部数据结构可能不是线程安全的。此外，该代码可以通过以下方式并行化parallel for。但是，我认为这种方法更自然。

简单的实验结果

我已测试此代码以读取 HDD (WD Green 2TB) 和 SSD (Intel 120GB) 上的 10GB 文件。

是的，使用 HDD 并没有获得任何加速。甚至观察到放缓。这清楚地表明该代码是 I/O 受限的。这段代码实际上没有任何计算。只是输入/输出。

然而，有了 SSD，我就有了加速1.2有 4 核。是的，加速比很小。但是，您仍然可以通过 SSD 获得它。而且，如果计算量增加一点（我只是放置一个非常短的忙等待循环），加速将是显着的。我能够获得 2.5 的加速。

总之，我建议您尝试并行化此代码。

另外，如果计算并不微不足道，我会推荐流水线。上面的代码只是简单的分成了几个大块，导致缓存效率很差。然而，管道并行化可能会产生更好的缓存利用率。尝试使用TBB进行管道并行化。它们提供了一个简单的管道构造。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 OpenMP 并行化 while 循环的相关文章

在两个 .cpp 文件之间定义全局变量 [重复]

这个问题在这里已经有答案了如何在 A cpp 和 B cpp 之间共享全球化 bool 变量其中它们都不包含其他 h 文件他们有其他联合头文件但彼此没有我可以在这些共享标头中定义全局变量吗 Thanks 我可以在这些共享标头中定
实体框架中的重复键异常？

我试图捕获当我将具有给定用户名的现有用户插入数据库时引发的异常正如标题所说我正在使用 EF 当我尝试将用户插入数据库时引发的唯一异常是 UpdateException 如何提取此异常以识别其是否是重复异常或其他异常 catch Up
C/C++ 中随机数生成器的实现[重复]

这个问题在这里已经有答案了我对 C 中随机数生成器的实现有点困惑它也与 C 中的明显不同如果我理解正确对 srand seed 的调用会以某种方式初始化可通过 rand 访问的隐藏变量种子该变量又将函数指向预先生成的序列例如例
C++ - 模板专业化和部分专业化

我一直在互联网和 stackoverflow 上寻找具体的答案但我似乎找不到我必须创建一个通用类然后实现特定的功能我的具体说明是您需要使用模板表达式参数以及模板类专业化和部分专业化我有一个模板类 template
可选参数“必须是编译时常量”

我有一个类分为两个部分文件如下所示 public partial class PersonRepository BaseRepository
C++：获取注册表值仅给出第一个字符[重复]

这个问题在这里已经有答案了我试图从注册表中获取字符串值但我只得到第一个字母 HKEY hKey char gamePath MAX PATH if RegOpenKeyEx HKEY CURRENT USER L Software Bl
如何在 C++ 的子目录中创建文件？

这是我的代码如何在子目录联系人中创建文件每次创建该文件时它都会出现在与我的程序相同的目录中 int main ofstream myfile contacts myfile open a myfile close 在构造函数中指定完整
未定义异常变量时通过引用捕获

捕获异常时标准指导是按值抛出按引用捕获据我了解这有两个原因如果由于内存不足异常而引发异常我们将不会调用可能终止程序的复制构造函数如果异常是继承层次结构的一部分我们可能会对异常进行对象切片如果我们有一个场景我们没有在 ca
C++ 析构函数：何时释放内存？

如果我删除一个导致其析构函数被调用的对象那么内存是在析构函数完成函数中的任何操作之前还是之后被释放仅当最小派生类子对象被销毁后才会释放内存所以如果你有 class Base class Derived public Base publ
IClaimsTransformation 未触发

我尝试过实施一个IClaimsTransformation我在 ASP NET CORE 3 1 Web 应用程序中找到的类 public class ClaimsTransformer IClaimsTransformation publ
ASP MVC 5 - 403 customError 不起作用

我正在尝试为我的应用程序创建自定义错误页面它在大部分情况下都有效但不适用于403 errors 我的网络配置
从 ef core 的子集合中删除一些项目

我有一个父表和子表其中父表与子表具有一对多关系我想删除一些子项并且希望父项的子集合反映该更改如果我使用删除选定的子项RemoveRange 那么子集合不会更新如果我使用Remove从子集合中删除子集合然后显然它不如使用效率高R
使用 cudamalloc()。为什么是双指针？

我目前正在浏览有关的教程示例http code google com p stanford cs193g sp2010 http code google com p stanford cs193g sp2010 学习CUDA 演示的代码 g
ASP.NET Web API Swagger（Swashbuckle）重复OperationId

I have a web api controller like below In swagger output I am having the below image And when I want to consume it in my
从存储过程返回 int 值并在 ASP.NET 代码中检查它以验证登录表单

当我多次尝试但没有得到有效结果时使此代码运行的真实顺序是什么 SQL存储过程的代码 set ANSI NULLS ON set QUOTED IDENTIFIER ON GO ALTER PROC dbo login proc usern
如果数组为空，LINQ 返回 null

public class Stuff public int x other stuff 我有一个IEnumerable
使 C# 编译器相信执行将在成员返回后停止

我认为目前这是不可能的或者这是否是一个好主意但这是我刚才正在考虑的事情我使用 MSTest 对我的 C 项目进行单元测试在我的一项测试中我执行以下操作 MyClass instance try instance getValue
获取大于某个数字的元素个数

我正在尝试解决以下问题数字被插入到容器中每次插入数字时我需要知道容器中有多少元素大于或等于当前插入的数字我相信这两个操作都可以以对数复杂度完成我的问题 C 库中有标准容器可以解决这个问题吗我知道std multiset可以在对数
计算两个日期之间的工作日数？

在C 中如何计算business 或工作日两个日期之间的天数我以前曾经遇到过这样的任务并且我已经找到了解决方案当可以避免的时候我会避免列举其间的所有日子这里就是这种情况正如我在上面的一个答案中看到的那样我什至没有提到创建一
如何设置 Swashbuckle 与 Microsoft.AspNetCore.Mvc.Versioning

我们有asp net core webapi 我们添加了Microsoft AspNetCore Mvc Versioning and Swashbuckle拥有招摇的用户界面我们将控制器指定为 ApiVersion 1 0 Route

随机推荐

如何在 Swift 中以编程方式将 HeaderView 从 nib 添加到 UiTableView

好吧我是一个使用 swift 语言的天真的 IOS 开发人员我有一个显示酒店功能列表的表格视图现在我想在表格视图中添加标题信息其中包含酒店图像酒店名称位于表格视图上方以便标题信息也随着表格视图内容滚动产品功能列表问题是带有
如何在 Rust 中正确包装 C 函数指针？ [复制]

这个问题在这里已经有答案了我有一个 C 结构体Foo带有函数指针在我的 Rust 绑定中我希望允许用户设置此函数指针但我希望避免用户必须处理 FFI 类型 foo h struct Foo void internal uint8 t
NSTextView 的 insertText 方法在 OS X v10.11 中已弃用。替代品是什么？

我在 AppKit API 参考中看到insertTextOS X v10 11 中已弃用该方法我应该用什么来代替文档说 void insertText id aString 该方法是用户输入文本的方法NSTextView 请参阅NSI
对 UITextView 应用字数限制

如何在 Objective C interface builder 中对 UITextView 应用字数限制我已经搜索了一段时间发现了字符数但没有找到字数有谁能给我指点一下吗您可以只计算空格数并对其进行限制这是一个 hack 但
如何在 WP7 上挂钩硬件搜索按钮

我有一个带有搜索页面的 WP7 应用程序我更愿意挂钩硬件搜索按钮而不是必须将搜索图标添加到菜单栏有谁知道如何做到这一点当前版本中的第三方应用程序无法使用硬件搜索按钮请参考此线程已回答类似问题 https stackoverflow
PPP 或以太网如何从错误中恢复？

查看数据链路级标准例如 PPP通用帧格式 http www tcpipguide com free t PPPGeneralFrameFormat htm or Ethernet http en wikipedia org wiki Et
@Input 属性的可观察值

我从带有复选框输入的数组中选择了一些值如本例所示 Visit http plnkr co edit N9NXBYcwhon6ITr8RP5y p preview 但我想使用输入装饰器将检查的数组数据传递给另一个组件如何使已检查的数据成为
具有不完整链的 SSL 证书通过了 .NET Core 2.2 中的验证

使用 NET Core 2 2 我需要重新创建不完整链 SSL 错误但是 ServerCertificateValidationCallback 为我提供了与我预期不同的证书链并且这些证书通过了验证有人可以解释这里出了什么问题吗调用
从页面或应用程序发布到 Facebook 用户的留言墙上

我可以让用户授权我的应用程序然后我可以使用以下代码在他们的墙上发布 new Facebook facebook gt api uid feed post array message gt My app says hi 这可行但出现在用户
如何在 azure 函数中访问 http 请求的所有字段（在 C# 中解析 JSON）？

microsoft azure 对我来说是一个全新的编程主题编程基础语言是C 我必须使用逻辑应用程序中的 Azure Funtion Http 触发器当新电子邮件到达时我将日志应用程序中收到的电子邮件中的所有可能数据提供给到天蓝色的
Kubernetes 持久卷访问模式：ReadWriteOnce、ReadOnlyMany 和 ReadWriteMany

据这位官员介绍document https kubernetes io docs concepts storage persistent volumes access modes Kubernetes持久卷支持三种类型的访问模式只读很多
在 Pandas 中使用 ELIF 创建列

Question 我无法弄清楚如何根据其他两列中的值创建新的 DataFrame 列我需要使用 if elif else 逻辑但我找到的所有文档和示例都只显示 if else 逻辑这是我正在尝试做的事情的示例 Code df comb
TSQL - 选择插入的行

有没有办法选择插入的行我正在尝试使用运行以下查询SqlCommand 它用于在数据库中保留给定的id INSERT INTO tbl id SELECT COUNT 1 AS id from tbl 有没有办法返回插入的 id 列以便我
需要 sigsuspend 的解释

我需要对 sigsuspend 主题进行澄清我有一个简化的例子 sigset t mask oldmask sigemptyset mask sigaddset mask SIGRTMIN 1 sigprocmask SIG BLOCK
如何恢复/重新创建 mysql 的默认“mysql”数据库

当我安装mysql时它附带了两个数据库 mysql和信息模式我不小心删除了mysql数据库有什么办法可以重新创建它吗另外由于它包含一个包含用户信息的表是否有什么方法可以在没有它的情况下查看用户信息如果您仍然能够登录我假设您不
Facebook API 错误子代码 33

我有一个应用程序可以获取leads当潜在客户填写表单时在 webhook 请求后来自 facebook 某些页面抛出此错误 error message Unsupported get request Object with ID 2333
通过react获取cookie

我需要知道我的用户是否已连接为此我想读取我在服务器端使用express session设置的cookie app use session secret crypted key resave false saveUninitialized
为什么用分号连接多个 MySQL 查询不能与 Perl DBI 一起使用？

我想使用将值插入到两个单独的 MySQL 表中DBI https metacpan org pod DBI 我尝试将两个工作结合起来INSERT通过插入一个来查询它们之间 dbh gt do q INSERT INTO testA tes
在 docker 中运行 npm update，而不使用该特定更新的缓存

背景我正在编写代码node js using npm and docker 我试图让我的 docker 文件在构建时使用缓存这样就不会花费太长时间我们有一个通用存储库用于保存在各种存储库中使用的逻辑并且通过 npm 包进行传播
使用 OpenMP 并行化 while 循环

我有一个非常大的数据文件这个数据文件中的每条记录有4行我编写了一个非常简单的 C 程序来分析这种类型的文件并打印出一些有用的信息该程序的基本思想是这样的 int main char buffer BUFFER SIZE while f

使用 OpenMP 并行化 while 循环

使用 OpenMP 并行化 while 循环 的相关文章

随机推荐

热门标签

使用 OpenMP 并行化 while 循环的相关文章