MPI Alltoallv 还是更好的单独发送和接收？（表现）

2024-05-04

我有许多进程（大约 100 到 1000 个），每个进程都必须将一些数据发送到其他一些进程（比如大约 10 个）。（通常，但并非总是必要，如果 A 发送到 B，B 也会发送到 A。）每个进程都知道它必须从哪个进程接收多少数据。

所以我可以用MPI_Alltoallv，许多或大部分消息长度为零。不过，我听说对于表现原因better to use several MPI_send and MPI_recv通讯而不是全球的MPI_Alltoallv。我不明白的是：如果一系列发送和接收调用比一个 Alltoallv 调用更有效，why is 全部不是 just 实施为 a 一系列的发送和接收？

对于我（和其他人？）来说，仅使用一个全局调用会方便得多。另外，我可能不得不担心不会遇到多个发送和接收的死锁情况（可以通过某种奇偶策略或更复杂的策略修复？或者通过使用缓冲发送/接收？）。

你同意吗MPI_Alltoallv是必要的slower比，比方说，10MPI_Send and MPI_Recv;如果是的话为什么以及多少？

通常，集体的默认建议是相反的：尽可能使用集体操作，而不是编写自己的代码。 MPI 库拥有的有关通信模式的信息越多，其内部优化的机会就越多。

除非有特殊的硬件支持，集体呼叫实际上是在发送和接收方面在内部实现的。但实际的通信模式可能不仅仅是一系列发送和接收。例如，使用树来广播一段数据可能比使用相同的等级将其发送到一堆接收器更快。优化集体沟通需要做很多工作，而且很难做得更好。

话说回来，MPI_Alltoallv有点不同。在 MPI 级别针对所有不规则通信场景进行优化可能很困难，因此可以想象一些自定义通信代码可以做得更好。例如，一个实现MPI_Alltoallv可能正在同步：它可能要求所有进程“签入”，即使它们必须发送 0 长度的消息。我认为这样的实现不太可能，但是这是野外的一个 http://www-01.ibm.com/support/docview.wss?uid=isg1IZ58190.

所以真正的答案是“这取决于”。如果库实现MPI_Alltoallv与任务不匹配，自定义通信代码将获胜。但在走这条路之前，请检查 MPI-3 邻居集合是否适合您的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MPI Alltoallv 还是更好的单独发送和接收？（表现）的相关文章

Javascript 定时通知 - setTimeout、setInterval

我正在创建一个网络应用程序允许用户管理日历 CRUD 事件任务提醒等我正在尝试实现一个功能他们将在事件任务前 x 分钟收到弹出提醒根据我的理解使用 javascript 确实只有一种方法可以做到这一点登录时检查数据库中是
模块化算术和 NTT（有限域 DFT）优化

我想使用 NTT 进行快速平方参见快速大数平方计算 https stackoverflow com q 18465326 2521214 但即使对于非常大的数字结果也很慢超过 12000 位所以我的问题是有没有办法优化我的 NTT
在 C# 中创建加密随机数的最快、线程安全的方法？

请注意在多个线程上并行生成随机数时加密随机数生成器不是线程安全的使用的发电机是RNGCryptoServiceProvider它似乎重复了很长一段随机位 128 位重现此情况的代码如下所示缺乏使用锁来保护访问RNGCryptoSe
PHP 脚本不断执行 mmap/munmap

我的 PHP 脚本包含一个循环它只不过是回显和取消引用指针如 tab othertab i gt 中的内容直到昨天这个脚本开始变得非常慢比以前慢了 50 倍之前它一直运行良好使用 strace 后我发现 90 的情况下脚
针对约 225 万行的单表选择查询的优化技术？

我有一个在 InnoDB 引擎上运行的 MySQL 表名为squares大约有 2 250 000 行表结构如下 squares square id int 7 unsigned NOT NULL ref coord lat doubl
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
Javascript 播放声音性能重吗？

我正在用 Javascript 制作一个简单的游戏当一个物体与墙壁碰撞时它会发出砰的声音声音的响度取决于物体的速度速度越高 gt 声音越大播放功能 playSound function id vol ID of the sou
处理大数据二进制文件

我正在处理包含原始数据的大型二进制文件每个大约 2 GB 这些文件具有明确定义的结构其中每个文件都是一个数组events 每个事件都是一个数组data banks Each event and data bank有一个结构 header
C++ Exp 与 Log：哪个更快？

我有一个 C 应用程序需要比较两个值并决定哪个值更大唯一的复杂之处是一个数字在对数空间中表示而另一个则不是例如 double log num 1 log 1 23 double num 2 1 24 如果我想比较num 1 and
并行化斐波那契序列生成器

我正在学习并行化在一项练习中我得到了一些我应该提高性能的算法其中之一是斐波那契数列生成器 array 0 0 array 1 1 for q 2 q lt MAX q array q array q 1 array q 2 我怀疑这
jQuery 选择器：为什么 $("#id").find("p") 比 $("#id p") 更快

该页面的作者 http 24ways org 2011 your jquery now with less suck http 24ways org 2011 your jquery now with less suck断言 jQuery
UITableView 由于阴影和边框而滞后

我有以下代码来向 UITableViewCell 的背景添加边框颜色和阴影我的问题是这段代码会导致 tableView 本身出现巨大的滞后请你告诉我如何优化我的代码防止 UITableView 的滞后 if cell viewWith
匹配集合 Parallel.Foreach

我正在尝试为 matchcollection 创建一个 Parallel Foreach 循环它在我构建的刮刀中我只需要知道在 Parallel Foreach 中放入什么 MatchCollection m Regex Matches
确保 Clojure 中只有一个服务实例正在运行/启动/停止的规范方法？

我正在用 Neo4j 支持的 Clojure 编写一个有状态服务器它可以服务套接字请求例如 HTTP 当然这意味着我需要能够从该服务器内启动和停止套接字服务器在设计方面我希望能够在此服务器中声明一个服务并启动和停止它我在 C
计算元组中与模式匹配的元素

我有一个矩阵m我想计算零的数量 m 2 0 2 2 4 4 5 4 0 9 4 8 2 2 0 0 我当前的代码如下 def zeroCount M return item for row in M for item in row coun
通过 mpi 发送 c++ std::vector

我知道存储一个std vector
具有单个成员的结构是否具有与成员类型相同的性能？

Does struct单个成员是否具有与成员类型相同的性能内存使用和速度 Example 这段代码是一个struct与单个成员 struct my int int value 是的表现my int与一样int 同意 harper htt
Julia Threads.@threads 比单线程性能慢

我正在尝试求解一维热方程的数值我正在使用有限差分并且在 Julia 中使用 threads 指令时遇到一些问题特别是下面有相同代码的两个版本第一个是单线程而另一个使用 threads 除了 thread指令之外它们是相同的 fu
错误：process_executor.py:702: ... 当一些作业被分配给执行器时，工作人员停止了。这可能是由于工作超时太短造成的

根据主题中的错误修复方法是什么环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
索引在 NOT IN 或 <> 子句中起作用吗？

我读过至少 Oracle 数据库中的普通索引基本上是 B 树结构因此存储处理适当根节点的记录小于根的记录被迭代地存储在树的左侧部分而大于根的记录被存储在右侧部分正是这种存储方法有助于通过树遍历实现更快的扫描因为深度和广度都

随机推荐

kubernetes 集群中 django 应用程序的 Nginx 配置

我在为部署在 kubernetes 中的 django 应用程序创建 nginx 配置文件时遇到困难 Nginx 和 app 是同一集群中的两个独立容器据我了解容器可以通过 127 0 0 1 XX 和主机名相互通信我为此使用 min
我如何在 ruby 中执行范围正则表达式，例如 awk /start/,/stop/

我想做一个 AWK 风格的范围正则表达式如下所示 awk hoststatus file 在 AWK 中这将打印文件中两个模式之间的所有行 hoststatus host name myhost modified attributes
如何在 Angular 4 材料的 Stepper 中提交表单

如何在角材料的步进器中提交表单数据我正在遵循角材料的示例https material angular io components stepper examples https material angular io components
如何将值与数据库值进行比较

我使用下面的代码在数据库中插入用户安装的应用程序包名称并且插入成功现在在日志中显示我想将系统安装的应用程序与此数据库值进行比较并仅显示数据集中的值那么我如何比较我在这个括号中写了什么 if p packageName equals
NoMethodError：未定义方法“needs_migration？”对于 ActiveRecord::Migrator:Class

我收到以下错误消息不知道如何解决它有人可以帮忙吗 NoMethodError 未定义方法 needs migration 为了 ActiveRecord 迁移器类这是 config ru 代码 require config envi
Xcode 的 Organizer 窗口中没有“Use for Development”

我今天注册了 Apple 的 99 美元 iOS 开发计划在 Xcode 中的证书标识符和配置文件下无论我单击什么它都会告诉我将您的设备连接到 Mac 然后在 Xcode 的管理器窗口中单击用于开发使用与您的 iOS 开发者计
切换到负载均衡器后，django 帖子收到 CSRF 验证失败

我有一个有效的登录模板可以发布帖子如下所示
根据列中的条件将 Pandas 数据框拆分为多个数据框

为了为 ML 任务正确准备数据我需要能够将原始数据帧拆分为多个较小的数据帧我想要获取上面的所有行包括 BOOL 列的值为 1 的行对于每次出现的 1 即 n 个数据帧其中 n 是 1 出现的次数数据样本 df pd DataFr
Webdriver - 等待在 Firefox 中不起作用

在我的应用程序中我有一个用于在屏幕上显示记录的元素所以在第一页上它会显示类似显示 2100 的 1 10 之类的内容这是该元素的 CSS 它适用于所有浏览器 span GridPagingInfo 在我位于 iframe 中的应用
以角度搜索输入字段？

这里我有folderObjs数组和该数组的控制台位于下面的代码中我将搜索输入字段放在搜索输入字段中我想按角度搜索该数组的folderName和folderSize 这怎么可能 HTML
有没有办法过滤掉 TortoiseSVN 日志中仅属性的更改？

SVN 的 mergeinfo 功能确实很有用但是当文件上的所有更改都是 svn 属性时它会在修订日志中放置一个日志条目而我们通常不希望看到这些有没有办法过滤掉 TortoiseSVN 日志中仅属性的更改拉起日志选择您要比较的两
我可以在不同的 Spring 控制器中使用不同参数的相同映射值吗？

有什么办法可以完成这样的事情我有一个用于导航的表单
为什么在 numpy 数组上使用 *= 会修改原始数组？

下面的代码演示了使用a 3修改原始数据集而a a 3才不是 data np array 1 0 3 4 a data 0 b data 1 a 3 b b 3 print data gives 3 0 3 4 the a 3语句修改了矩阵
PHP：将 UTC 时间更改为太平洋时间（PST/PDT）[重复]

这个问题在这里已经有答案了我有一个 Datetime 对象并通过以下方式获取时间 today date Y m d H i s temp date gt getTimeStamp 我希望能够将其转换为加利福尼亚州的当前时间但我需要考虑
如何使用 c 使用 libpng 更改 png 图像的 RGB 值？

更改 png 图像的 rgb 值的推荐方法是什么现在我正在使用示例代码来查看 libpng 的工作方式它只打开一个 png 图像并写入另一个 png 图像但是我想更改这个新图像的 RGB 值使其变为全蓝色绿色或红色无论我选择什么
将带有我的 URL 的 ExtensionInstallSources 首选项添加到 Chrome 首选项后，仍然不允许安装“.crx”打包应用程序

我添加了偏好设置ExtensionInstallSources 按照 http www chromium org administrators policy list 3 ExtensionInstallSources http www c
如何从 python 发布到 hipchat

我有一些 python 工具我想将它们的更新发送到 hipchat 房间我在其他地方使用 shell 脚本执行此操作因此我知道它在我们的环境中有效但我似乎无法将令牌推送到 hipchat API 一定是简单的事情首先这会正确进行
在 ASP.Net MVC 中向“View/Shared”文件夹添加子目录并调用视图

我目前正在使用 ASP Net MVC3 和 Razor 开发一个网站在 View Shared 文件夹中我想添加一个名为 Partials 的子文件夹我可以在其中放置所有部分视图为了更好地组织网站只要我在调用视图时始终引用 Pa
导入错误：无法导入名称 md5

真的不知道这里发生了什么我需要在弹性beanstalk上部署我的flask应用程序但不知何故改变了路径并且无法再运行python application py dotnet info NET Core SDK reflecting an
MPI Alltoallv 还是更好的单独发送和接收？（表现）

我有许多进程大约 100 到 1000 个每个进程都必须将一些数据发送到其他一些进程比如大约 10 个通常但并非总是必要如果 A 发送到 B B 也会发送到 A 每个进程都知道它必须从哪个进程接收多少数据所以我可以用MPI A

MPI Alltoallv 还是更好的单独发送和接收？ （表现）

MPI Alltoallv 还是更好的单独发送和接收？ （表现） 的相关文章

随机推荐

热门标签

MPI Alltoallv 还是更好的单独发送和接收？（表现）

MPI Alltoallv 还是更好的单独发送和接收？（表现）的相关文章