如何在 C++ MPI 代码中放置检查点?

2024-04-26

根据容错系统 https://www.elsevier.com/books/fault-tolerant-systems/koren/978-0-12-088525-1(第 6 章)由 Israel Koren 和 C. Mani Krishna 撰写:

检查点是进程整个状态的快照 拍摄的那一刻。它代表了我们想要的所有信息 需要从该点重新启动该过程。我们记录检查点 稳定存储上。

检查点是一种常见的容错技术。我打算通过在用 C++ 编写的不同 MPI 程序的源代码中实现检查点来测试检查点在实践中的工作原理。这是我第一次实现检查点,我不知道该怎么做。我正在寻找可以帮助我的示例或任何参考。我用谷歌搜索但没有找到有用的参考或教程。任何建议都非常感激。


C++ 和 MPI 不提供任何内置的检查点机制。您采取的策略可能取决于您正在编写的应用程序的类型。许多科学代码(求解偏微分方程/常微分方程)都有明确的时间步进或负载步进。

在这些情况下,我们倾向于分析重新启动算法所需的数据,并在每个时间步或每 n 个时间步结束时将其写入磁盘。

使用 MPI 分布式并行应用程序时面临的挑战之一是确保可以使用不同数量的列或数据分区读回数据。

您可能会发现将二进制文件写入磁盘很有趣的一种工具是Adios2 https://adios2.readthedocs.io/en/latest/.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 C++ MPI 代码中放置检查点? 的相关文章

随机推荐

  • EntityDataSource 在查询中将 * 替换为 % 通配符

    我有一个在很多地方使用 EntityDataSource 的应用程序 在 EDS 中 我根据 TextBox 中的用户输入手动构建Where 子句 我希望用户在查询数据时能够输入 星号 而不是 有没有像使用 Entity SQL 或 EDS
  • .crx 文件在 Chrome 中安装

    我刚刚创建了一个非常简单的 chrome 扩展 它运行良好 但是当我转换为 crx 文件并尝试用 chrome 打开它时 没有任何反应 我的chrome浏览器版本是19 0 1081 2 dev m 我的扩展使用jquery 1 4 2 m
  • NSFileHandle writeData:异常处理

    这可能是一个相当广泛的问题 但我找不到任何在线资源来解决或解释这个问题 问题是创建后NSFileHandle writer NSFileHandle fileHandleForWritingAtPath path 当你使用 writer w
  • Pandas.DataFrame interpolate() 方法='线性'和'最近'返回尾随 NaN 不一致的结果

    我在探索pandas DataFrame interpolate 用不同的方法 linear vs nearest 当尾部缺少数据时 我发现这两种方法的输出不同 例如 import pandas as pd version 0 16 2 o
  • Ruby on Rails 3:如何分别检索 POST 和 GET 参数?

    我知道你可以使用获取参数params 但问题是它合并了所有参数 无论它们是通过GET or POST 如果您通过以下方式发送请求GET 没问题 参数只能挤在URL里 但如果你发送一个POST具有类似 URL 的请求 blabla foo b
  • Puppeteer 无法在谷歌云功能中工作

    Puppeteer 无法在谷歌云中工作 镀铬错误如图所示 我已经在这里实施了该建议 Heroku 上的 Puppeteer 错误 找不到 Chromium https stackoverflow com questions 74385208
  • 致命信号11(和引擎项目)

    我正在创建由 andengine 框架提供支持的 android 游戏 box2d 扩展我收到 致命信号 11 这似乎是突然发生的 我想你可以随机称呼它 没有任何线索 至少 我不知道有任何线索可以帮助我解决这个问题 我的猜测是 1 我正在使
  • ASP.Net MVC 部分视图保持其模型状态?

    这可能又是一个新手问题 当我创建 ASP NET MVC2 应用程序时 会创建一个具有操作登录的帐户控制器 如下所示 HttpPost public ActionResult LogOn LogOnModel model string re
  • Laravel - 重定向到页面并滚动到页面底部

    我使用 Laravel 框架 在我的控制器中我有 return Redirect route home 这是重定向到主页 但我想实现页面在重定向时向下滚动以查看页脚 就像是href home footer 有办法吗 您可以生成路由的 URL
  • 如何在Python中一次读取一个字符串中的一个字母

    我需要将用户输入的字符串转换为莫尔斯电码 我们的教授希望我们这样做的方法是从 morseCode txt 文件中读取 将 morseCode 中的字母分成两个列表 然后将每个字母转换为莫尔斯电码 当有空格时插入新行 我有开始 它的作用是读取
  • 解析 Roslyn 中的嵌入表达式

    我正在尝试为类似 QML 的标记语言编写一个解析器 并且我希望允许在标记中使用 C 表达式 因此 一个示例可能如下所示 ClassName Property1 10 Property2 Math Sqrt 123 Property3 str
  • 如何通过 Rails 导入地图使用刺激组件

    我想将此刺激组件包含到我全新的 Rails 7 应用程序中 https www stimulus components com docs stimulus dropdown https www stimulus components com
  • 有没有办法让VS2010发布向导在发布网站时复制App_offline.htm?

    看到后汉塞尔曼 你做错了 视频 http www hanselman com blog WebDeploymentMadeAwesomeIfYoureUsingXCopyYoureDoingItWrong aspx我开始使用网络发布 htt
  • 有没有办法重命名已部署的 ClickOnce 应用程序?

    我的公司有一个 ClickOnce 应用程序 我们的客户已经使用该应用程序大约一年了 我们正在进行品牌重塑 并希望更改应用程序的名称 但是 仅更改 Visual Studio 中的所有正常名称选项 然后构建新的部署显然会更改现有应用程序正在
  • 在 Azure Pipelines 构建中使用 Azure Repos git 模块源进行身份验证

    我目前正在为 Azure DevOps 创建一个管道 以验证 Terraform 配置并将其应用到不同的订阅 我的 terraform 配置使用模块 这些模块 托管 在与 terraform 配置相同的 Azure DevOps 项目中的其
  • RGBA格式HEX转换成RGB格式HEX? PHP

    我想在 RGBA 格式的十六进制颜色之间来回转换 例如0xFF0000FF 和 RGB 格式的十六进制颜色 例如0xFF0000 在 PHP 中 我怎样才能做到这一点 这两个函数将满足您的需要 function rgbaToRgb rgba
  • MongoError:池正在耗尽,在集成测试中使用 MongoMemoryServer 时禁止新操作

    我在用着MongoMemoryServer编写集成测试 我有两个集成测试文件 当我运行 IT 测试时 我看到以下内容 我不明白为什么 我正在使用 jestjs 测试框架 当我有两个 IT 测试文件时 我看到以下错误 MongoError p
  • Windows 相当于 Mac OS X“打开”命令

    刘畅在这里问了一个与此非常相似的问题 Linux 相当于 Mac OS X 打开 命令 https stackoverflow com questions 264395 linux equivalent of the mac os x op
  • C#中如何终止线程?

    我想尝试使用 C 进行线程处理 我了解一些有关 C 线程处理的知识 所以我只是想问我是否想终止一个线程 我应该这样做smt Abort 或者函数结束后它会 自杀 另外 有没有类似的东西pthread exit 在 C 中 在 C 中 Thr
  • 如何在 C++ MPI 代码中放置检查点?

    根据容错系统 https www elsevier com books fault tolerant systems koren 978 0 12 088525 1 第 6 章 由 Israel Koren 和 C Mani Krishna