MPI+CUDA 与纯 MPI 相比有何优势？

2024-04-22

加速应用程序的常用方法是使用 MPI 或更高级别的库（例如在幕后使用 MPI 的 PETSc）并行化应用程序。

然而，现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃/更大的问题感兴趣。

与传统的、经过试验和测试的并行编程 MPI 模型相比，使用混合 MPI+CUDA 编程模型有什么明显的优势吗？我是在粒子方法的应用领域专门问这个问题

我问这个问题的原因之一是，我在网络上到处都看到这样的说法：“粒子方法自然映射到 GPU 的架构”或类似的说法。但他们似乎从来没有证明为什么我使用 CUDA 比仅使用 MPI 来完成同样的工作更好。

这有点像苹果和橘子。

MPI 和 CUDA 是根本不同的架构。最重要的是，MPI 允许您将应用程序分布在多个节点上，而 CUDA 允许您在本地节点内使用 GPU。如果在 MPI 程序中，您的并行进程需要很长时间才能完成，那么是的，您应该研究如何通过使用 GPU 而不是 CPU 来完成工作来加速它们。相反，如果您的 CUDA 应用程序仍然需要很长时间才能完成，您可能希望使用 MPI 将工作分发到多个节点。

这两种技术几乎是正交的（假设集群上的所有节点都支持 CUDA）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

CUDA

MPI

MPI+CUDA 与纯 MPI 相比有何优势？的相关文章

如何将数据存储在对象的对象列表中？

我有以下代码将年龄相同且得分最高的用户分组我现在有而不是Map
优化数组压缩

假设我有一个数组k 1 2 0 0 5 4 0 我可以按如下方式计算掩码m k gt 0 1 1 0 0 1 1 0 仅使用掩码 m 和以下操作左移右移 And Or 加减乘我可以将 k 压缩为以下形式 1 2 5 4 以下是我目
使用 BigInteger 进行 Karatsuba 乘法

我首先使用 long 编写了 Karasuba 算法的代码我认为它工作得很好使用相同的逻辑我将代码转换为 BigInteger 但由于某些原因它给出了 StackOverflowError 我不明白为什么请帮忙 EDIT1 长时间
用于反恶意软件代码的类 Aho-Corasick 算法

有没有类似的算法阿霍科拉西克 http en wikipedia org wiki Aho E2 80 93Corasick string matching algorithm 它可以同时匹配一组模式并适用于反恶意软件比较所有已知的商业
CSS Hex 到速记十六进制转换

将十六进制转换为速记十六进制的正确算法是什么例如 996633很容易被转换为 963 但如果是这样怎么办 F362C3 我的第一个猜测是我只取每种颜色的第一个值并使用它所以 F362C3变成 F6C 但我不知道如何从数学上证明这种方法的
在 O(nloglogn) 最坏情况时间内对具有 O(logn) 个不同元素的 n 元素数组进行排序

目前的问题是标题本身的内容即给出一种算法该算法在 O log logn 最坏情况时间内对具有 O log n 个不同元素的 n 元素数组进行排序有任何想法吗此外您通常如何处理具有多个非不同元素的数组 O 日志日志 n 时间足以让
集合划分比差分获得更好的结果

分区问题 https en wikipedia org wiki Partition problem已知是 NP 困难的根据问题的特定实例我们可以尝试动态规划或一些启发式方法例如差分法也称为 Karmarkar Karp 算法后者
计算流数据的直方图 - 在线直方图计算

我正在寻找一种算法来生成大量流数据的直方图最大值和最小值事先未知但标准差和平均值在特定范围内我很欣赏你的想法 Cheers 我刚刚找到了一个解决方案秒从流式并行决策树算法构建在线直方图论文的 2 2 该算法由 Hive 项目中的
用于检索编辑距离接近的字符串的数据结构

例如从一组英语单词开始是否有一种结构算法允许使用单词 right 作为查询来快速检索诸如 light 和 tight 之类的字符串即我想检索与查询字符串编辑距离较小的字符串 The BK tree http blog notdot
对 Big O 表示法仍然有点困惑

所以我一直在尽力理解 Big O 表示法但仍然有一些事情我感到困惑所以我一直读到如果某件事是 O n 那么它usually指的是算法的最坏情况但它不一定要指最坏的情况这就是为什么我们可以说插入排序的最佳情况是 O n 但是我无法真
自动适合衣服的算法？

想象一下客户要求您设计一款软件以满足一些相当粗略的规格如下所示 1 它将面向时尚行业营销 2 用户将是设计衣服和东西的人可能有一个特定的术语但我没有想到 3 由于各种原因能够快速制作原型设计并查看它们在模型上的外观会很有用
使用 CUDA 进行逐元素向量乘法

我已经在 CUDA 中构建了一个基本内核来执行逐元素两个复向量的向量向量乘法内核代码插入如下 multiplyElementwise 它工作正常但由于我注意到其他看似简单的操作如缩放向量在 CUBLAS 或 CULA 等库中进行了
查找二维空间中圆内的所有点

我表示我的 2D 空间考虑一个窗口其中每个像素显示为 2D 数组中的一个单元格即 100x100 的窗口由相同维度的数组表示现在给定窗口中的一个点如果我画一个半径的圆r 我想找到该圆圈中的所有点我想我应该检查半径周围方形区域中的
垂直和水平平行度

最近在并行领域工作我了解到有两个术语垂直并行和水平并行有人说openmp 共享内存并行是垂直并行而mpi 分布式内存并行是水平并行为什么这些术语这么称呼我不明白原因这么称呼它们只是术语吗这些术语似乎没有被广泛使用也
如何修复错误嵌套/未闭合的 HTML 标签？

我需要通过使用正确的嵌套顺序关闭任何打开的标签来清理用户提交的 HTML 我一直在寻找一种算法或Python代码来做到这一点但除了PHP等中的一些半生不熟的实现之外还没有找到任何东西例如类似的东西 p p ul li Foo bec
贪心算法的使用示例？

贪心算法有什么用一个真实的例子最小生成树 Prim http en wikipedia org wiki Prim s algorithm的算法和克鲁斯卡尔的 http en wikipedia org wiki Kruskal s a
如何在cmake中添加cuda源代码的定义

我使用的是 Visual Studio 2013 Windows 10 CMake 3 5 1 一切都可以使用标准 C 正确编译例如 CMakeLists txt project Test add definitions D WINDOW
以与版本页面上相同的方式区分两个字符串的算法是什么？

我正在尝试按短语区分两个字符串类似于 StackOverflow 在版本编辑页面上区分两个字符串的方式执行此操作的算法是什么是否有 gems 或其他标准库可以实现此目的编辑我见过其他比较算法 Differ http github
生成非连续组合

我正在尝试创建一个生成器支持执行 next 的迭代器可能在 python 中使用yield 它给出来自 1 2 n n 和 r 是参数的 r 元素的所有组合这样在选出的r个元素没有两个是连续的例如对于 r 2 且 n 4 生成
用 ruby 解决旅行商问题（50 多个位置）

我在一家快递公司工作目前我们手动解决了 50 多个地点的路线我一直在考虑使用 Google Maps API 来解决这个问题但我读到有 24 点的限制目前我们在服务器中使用 Rails 因此我正在考虑使用 ruby 脚本来获取

随机推荐

使用react-google-maps-api将自定义标记作为React组件

我们正在转换自google map react https github com google map react google map react readme to react google maps api这意味着更多原生 Googl
使用 COMPS 构建 C/C++ 应用程序时出错：硬编码路径

我正在尝试构建一个使用 C C 绑定开发的 COMPASs 应用程序当我构建应用程序时出现以下错误您知道我该如何解决这个问题吗 xxxx xxx c increment gt buildapp increment BSC Barcel
Crash Firebase vs Crashlytics vs HockyApp

我一直在应用程序中使用 Crashlytics 我们的客户端使用 HockeyApp 并且我是通过 Google Firebase 最近的更新了解到的有谁有机会使用上述工具您的概述和建议是什么您是否喜欢其中一个为什么祝你有美好的一
Laravel 将数据传递给路由

我是 Laravel 5 的新手我需要一些帮助因为我无法解决我的简单问题我有一个数据列表http sample com partners http sample com partners如果我单击数据链接我希望将其重定向到 http
如何从服务器中的客户端池中识别客户端 - 设计

好的我正在使用一个客户端服务器库服务器可以接受来自客户端的多个连接每次调用 Accept 时如果成功客户端套接字的句柄就会被推送到映射并以假定的唯一 ID 作为键这样当服务器稍后想要向特定客户端发送消息时它就会使用该 ID
mysql 其中字符串以数字结尾

我的表列包含如下值 id item 1 aaaa11a112 2 aa1112aa2a 3 aa11aa1a11 4 aaa2a222aa 我只想选择项目值以数字结尾的行有这样的事吗 select from table where ite
Maven 对特定存储库使用 SOCKS 代理

我试图将 Maven 配置为在访问特定存储库时使用袜子代理但不将其用于 Maven 中央存储库我用过export MAVEN OPTS DsocksProxyHost
单击单个单元格并使用 Javascript 添加颜色到 HTML 表格

我创建了一个 HTML 表带有用户输入的列和行并且还具有选择颜色的动态方式现在我希望能够单击表格中的各个单元格并用所选颜色为它们着色到目前为止我有这个代码我的最终目标是当我再次点击提交时能够重置颜色流程将是选择桌子尺寸选
当其父对象设置为不显示时，如何获取对象的最小高度？

为什么我无法获取min height当一个物体的parent被设定为display none 但如果最小高度是我仍然可以得到物体的高度not in use 例如 css li display none object display blo
确定 Linux 或 Windows 是 C++ 语言

我正在用 C 编写一个跨平台兼容函数该函数根据输入文件名创建目录我需要知道机器是 Linux 还是 Windows 并使用适当的正斜杠或反斜杠对于下面的代码如果机器是Linux那么isLinux true 如何确定操作系统 bool
再次将服务注入域对象

我有一个对地理数据进行操作的特定域我正在 TypeScript 和 NodeJS 中实现这个项目并有以下类 Point 包含纬度和经度的值对象 Area 包含点集作为形状定义的值对象 Sector 实体它不是持久的但它是可变的包含
提交表单不会在 jquery ajax 调用中停止

我得到以下代码 ajax type POST async false url CheckIdExist data param success function result if result true return false error
如何解析不寻常的日期字符串

您好我有一个不寻常的日期格式我想将其解析为 DateTime 对象 string date 20101121 2010 11 21 string time 13 11 41 HH mm ss 我想用DateTime Tryparse 但
Android.mk 与 Application.mk

我对 Android mk 和 Application mk 的使用有点模糊我尝试阅读 APPLICATION MK HTML ANDROID MK HTML 在NDK 附带的文档 http developer android com s
如何将类元数据转换为 JSON 字符串

如何生成类元数据的 JSON for eg C 类 public class Product public int Id get set public string Name get set public bool IsActive get
WebClient 最大连接池限制？

如果远程服务阻塞我可以发送多少个并发请求意思是什么是最大连接数spring在使用时内部使用的池限制WebClient Autowired private WebClient webClient webClient post uri u
卸载 Magento 自定义扩展及其数据库

我创建了一个扩展并创建了扩展的 zip 文件以便我可以通过 Magento Connect 安装它当我使用 Magento Connect 卸载自定义扩展时它只会删除我的扩展文件和文件夹但不会删除我的扩展的数据库表我还想删除我的数
如何在react 16.4.1中使用leaflet-polylinedecorator

我正在尝试在react 16 4 1中使用传单插件polylinedecorator 所以没有钩子然而我能找到的关于如何在 React 中使用此插件的唯一示例是使用钩子请参阅如何将 Polylinedac orator 与 Reac
在 Windows 中更改 Angular 项目中的任何内容时，Docker 不会重新编译

我正在尝试对您的角度应用程序进行 dockerize 为此我创建了一个 Dockerfile 但每当我尝试编辑或更新任何组件时它都不会编译我的角度应用程序这是泊坞窗文件 FROM node latest RUN mkdir usr sr
MPI+CUDA 与纯 MPI 相比有何优势？

加速应用程序的常用方法是使用 MPI 或更高级别的库例如在幕后使用 MPI 的 PETSc 并行化应用程序然而现在每个人似乎都对使用 CUDA 来并行化他们的应用程序或使用 MPI 和 CUDA 的混合来解决更雄心勃勃更大的问题感兴

MPI+CUDA 与纯 MPI 相比有何优势？

MPI+CUDA 与纯 MPI 相比有何优势？ 的相关文章

随机推荐

热门标签

MPI+CUDA 与纯 MPI 相比有何优势？的相关文章