为什么 Hadoop 不使用 MPI 来实现?

2024-03-10

如果我错了,请纠正我,但我的理解是,Hadoop 不使用 MPI 进行不同节点之间的通信。

造成这种情况的技术原因是什么?

我可以冒险进行一些猜测,但我对 MPI 是如何“在幕后”实现的了解不够,无法知道我是否正确。

想想看,我对 Hadoop 的内部结构也不完全熟悉。我在概念层面上理解该框架(映射/组合/洗牌/减少以及它如何在高层次上工作),但我不知道具体的实现细节。我一直假设 Hadoop 正在传输序列化数据结构(也许GPBs http://code.google.com/apis/protocolbuffers/docs/overview.html)通过 TCP 连接,例如在洗牌阶段。如果这不是真的,请告诉我。


Hadoop/map-reduce 的一大特点是容错性。大多数(任何?)当前的 MPI 实现都不支持容错。正在考虑将其用于未来版本OpenMPI http:////www.open-mpi.org/faq/?category=ft.

桑迪亚实验室 http://www.sandia.gov/~sjplimp/mapreduce.html有一个使用 MPI 的 map-reduce 版本,但它缺乏容错能力。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Hadoop 不使用 MPI 来实现? 的相关文章

随机推荐

  • Matplotlib - 单值等高线图

    我想绘制一些数据的等值线图 但字段中的所有值可能都相同 这会导致 matplotlib 中出现错误 这是有道理的 因为实际上没有要创建的轮廓 例如 如果你运行下面的代码 你会得到一个错误 但删除第二个定义zi它按预期运行 如果某些数据是均匀
  • PowerShell 从远程 PC 删除桌面项目

    我有 200 台电脑需要删除一些特定的图标 我使用 ComputerName 创建了一个 CSV 文件 每行 1 个名称 我有另一个文件 其中包含需要从桌面删除的图标的文件名 Shortcut1 lnk 等 该其他文件也是 CSV 每行 1
  • 强制执行必须在*不同*字段中的每个子类中实现的属性的最佳方法是什么?

    我正在尝试想出 最好 的实施方式SQL 数据服务灵活的实体模型 http msdn microsoft com en us library cc512402 aspx其中每个类都可以存储为一个实体 甚至派生类 示例 每个子类都有不同的 st
  • 如何在不使用 for 循环的情况下对不同大小的矩阵的各个部分求和?

    我有一个相对较大的矩阵 NxN N 20 000 和一个 Nx1 向量 用于标识必须分组在一起的索引 我想将矩阵的各个部分相加 原则上可以有不同数量的元素和非相邻元素 我很快写了一个双 for 循环 它可以正常工作 但当然效率很低 探查器将
  • 使用 Python 从 Gmail 下载特定电子邮件

    有人可以帮我定制现有的代码示例吗 我可以从下面的文章中看到如何连接到gmail并下载内容 但我不知道如何搜索特定电子邮件并仅下载时间戳和正文 文章 如何从 Gmail 下载所有带附件的电子邮件 https stackoverflow com
  • 如何使用 C# 将 Excel 单元格设置为只读?

    Range range Range this workSheet Cells 1 1 range AllowEdit false 当我设置AllowEdit属性设置为 false 编译错误将显示 错误 属性或索引器 无法将 Microsof
  • Babel 转译地图可以在 IE11 中使用吗?

    查看Map文档 看起来IE11中并不完全支持 https developer mozilla org en US docs Web JavaScript Reference Global Objects Map https develope
  • setTimeout 不延迟 $.each 中的函数调用

    我的网站上有几个div 我想一一更新 为了不一次向服务器发送超过 200 个请求 我希望每个请求延迟 1 秒 我尝试过的 var tourBox tour box tourBox each function var box this set
  • InheritedWidget - 在 navigator.push 之后在 null 上调用 getter

    导航到新小部件后 我在尝试访问 InheritedWidget 时遇到问题 我有这样的顶级小部件 class App extends StatelessWidget build context return MaterialApp titl
  • 如何安装阴影罐子而不是原始罐子

    我将 maven shaded plugin 添加到我的项目中 它正确构建了着色的 uber jar 但仍然安装了原始的 Thin jar 我想安装阴影的超级罐子 以便下游项目可以依赖这个阴影的超级罐子 我该怎么做 谢谢 这是我的 pom
  • Matlab 中的非线性回归工具箱 (nlinfit)

    有谁知道MATLAB工具箱中非线性回归的算法和目标函数是什么 我正在查看 MATLAB 网站 但它没有提供信息 None
  • 如何在 ASP.NET 中通过 LAN 访问您的网站 [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我有一个 asp net 网页应用程序 我希望使用局域网 LAN 或无线局域网 WLAN 访问它 我不知道从哪里开始 我需要配置什么才能让其他人访问我
  • Unity / EntLib:将依赖项注入 CustomTraceListener

    抱歉 这是一个非常特殊的话题 所以很多人可能不感兴趣 但是 我需要做以下事情 我有一个应用程序 它提供对某种控制台窗口的日志记录 它是一个 WPF 窗口 因为应用程序要求 而且应用程序即使在这里也需要看起来很华丽 我们的特殊客户要求这样做
  • 在鼠标移动时从画布获取像素颜色

    是否可以获取鼠标下像素点的RGB值 有完整的例子吗 这是我到目前为止所拥有的 function draw var ctx document getElementById canvas getContext 2d var img new Im
  • android中如何进行XML解析?

    我是 android 和 xml 的新手 所以 我想知道什么是 xml 解析以及我们如何以及在哪里可以在 android 应用程序开发中使用它 我还想知道用于此目的的语法 谢谢 要了解 XML 的介绍 为什么不首先阅读维基百科条目 http
  • 如何使用 NSFetchedResultsController 在日期之后生成部分

    我提供了一个托管对象列表 其中每个对象都有一个 timeStamp 属性 我想使用 timeStamp 属性按时间顺序对列表进行排序 这是我使用 NSSortDescriptor 所做的 但我也想根据整个日期生成部分 每天一个部分 下面将给
  • IntelliJ IDEA 中的变更列表是什么?

    IntelliJ IDEA 中的变更列表是什么 它类似于提交吗 添加一个时 我有以下选项 名称 文本字段 评论 文本字段 使此更改列表处于活动状态 复选框 跟踪上下文 复选框 变更列表 http www jetbrains com idea
  • AttributeError:“builtin_function_or_method”对象没有属性“decode”

    我正在尝试从网站上抓取电子邮件 当我运行代码时 我收到错误 但我并不真正理解该错误 Traceback most recent call last File Email Scrapper py line 37 in
  • 动态添加多个字段的引导验证

    我正在使用 bootstrap v3 1 1 我想使用 bootstrap 验证来验证表单 但其中包含一个用于克隆 3 个字段的按钮 通过克隆 一切都很好 但我无法验证克隆的字段 这是我的 HTML 表单
  • 为什么 Hadoop 不使用 MPI 来实现?

    如果我错了 请纠正我 但我的理解是 Hadoop 不使用 MPI 进行不同节点之间的通信 造成这种情况的技术原因是什么 我可以冒险进行一些猜测 但我对 MPI 是如何 在幕后 实现的了解不够 无法知道我是否正确 想想看 我对 Hadoop