Hadoop 发行版差异

2023-12-31

有人可以概述一下可用的各种 Hadoop 发行版之间的各种差异吗:

  • Cloudera - http://www.cloudera.com/hadoop http://www.cloudera.com/hadoop
  • Yahoo - http://developer.yahoo.net/blogs/hadoop/ http://developer.yahoo.net/blogs/hadoop/

使用 Apache Hadoop 发行版作为基准。

有没有好理由在标准 Apache Hadoop 发行版上使用这些发行版之一?


免责声明:今年夏天我在 Cloudera 实习(但我最好的一些朋友在雅虎!:-))

Yahoo 发行版是 Hadoop 20 的一个版本,他们在其集群的某些子集上运行(运行?)。它包括一组用于稳定性、错误修复等的补丁。它是一个源代码版本;它没有管理员友好的功能,如 rpm 或 debian 软件包等。

Cloudera 发行版以 rpm 和 deb 形式打包(源代码也可用)。这意味着您可以通过标准方法等获取更新。它还包括稳定性和错误修复补丁。它是不断维护的(并不是说雅虎不是——我想人们可以去 github 上检查他们上次更新它的时间)。它还封装了 Pig 和 Hive。

Cloudera 的 Hadoop 20 发行版处于测试阶段,18 被认为是稳定的(有关更多信息,请访问Cloudera 博客 http://www.cloudera.com/blog/2009/09/10/cdh2-clouderas-distribution-for-hadoop-2/)。 18版本还包含Hive和Pig的包;对于 20,您必须自己构建它们(Pig 或 Hive 还没有支持 20 的官方版本,尽管存在补丁)。 Cloudera 和 Yahoo 版本 20 之间很可能存在重大重叠;两者都提供清单,因此您可以检查。 Cloudera 发行版的最新文档位于http://archive.cloudera.com http://archive.cloudera.com

雅虎不为其分发提供支持;他们将修补版本作为服务提供给社区,因此感兴趣的人可以构建雅虎内部运行的内容。考虑到 Yahoo 集群的规模,这是一个重大贡献,特别是如果您不是一直遵循 JIRA 的 Hadoop 开发人员。 Cloudera 在商业上支持他们的发行版,并通过 Hadoop 邮件列表提供一些社区支持,对于发行版特定的问题,在他们的 GetSatisfaction 页面上提供。

两者与普通的 Apache 发行版有很大不同,因为它们在版本之间进行修补(cloudera 版本 20 有 60 多个补丁!)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop 发行版差异 的相关文章

随机推荐

  • Laravel 4 分页计数

    我在我的特定视图 站点中设置了分页 并且它有效 问题是我有一个 php 计数器 foreach players as player tr td count td 每当我切换页面时 它都会从 1 开始 我怎样才能改变这一点 为了实现这一点 您
  • Selenium 不使用 InternetExplorerDriver 单击按钮的解决方法

    我在网页上有一个按钮 当我通过 IE 运行时 Webdriver 不会单击该按钮 我已经尝试了以下解决方法 但没有成功 通过 JavaScript 点击 JavascriptExecutor driver executeScript arg
  • 在 C 中使用 strncpy 更有效地复制 n 个字符

    我想知道是否有一种更干净 更有效的方法来执行以下操作strncpy考虑到max字符数 我觉得自己做得太过分了 int main void char string hello world foo int max 5 char str mall
  • 从类访问 LocationManager/ LocationListener

    我有点迷失在这里 在我的主要活动中 我注册了一个 LocationManager 并将其连接到 LocationListener 以使用 myLocation getLatitude 等 现在我需要使用另一个类中的 Location 方法
  • 数据注释或应用程序验证块

    DataAnnotations 和应用程序验证块有什么区别 DataAnnotations 是一个基于属性的模型 用于 注释 数据 它位于 NET 框架本身中 它最明显的用途是验证 例如 ASP NET MVC 所做的那样 Validati
  • biglm 和 lm 之间的 AIC 不同

    我一直在尝试使用 biglm 在大型数据集 大约 60 000 000 行 上运行线性回归 我想用AIC来进行模型选择 然而 当我在较小的数据集上使用 biglm 时 我发现 biglm 返回的 AIC 变量与 lm 返回的变量不同 这甚至
  • 如何确定隐藏/溢出文本是在元素的顶部还是底部

    我想扩展 Shog9 的答案 如何从javascript判断html元素是否有溢出内容 https stackoverflow com questions 143815 how to determine from javascript if
  • SQL 查询忽略相邻的匹配行

    我有一个活动表 其中包含各种活动和哈希值 actorEntity subjectEntity activity type 在某些情况下 用户可能会在几秒钟内执行完全相同的活动两次 这意味着数据库中会有两个相邻的行具有完全相同的数据 对于某些
  • Objective-C 中的“isa”变量是否等于 Java 中的“instanceof”

    简单的问题 Objective C 中的 isa 实例变量提供与 Java 中的 instanceof 运算符相同的功能是否公平 这些是不同的概念 一个是一个member一个结构体 而另一个是一个operator 模仿严格的解释instan
  • 如何创建一个仅在其类型具有特定成员函数时才编译的类? [复制]

    这个问题在这里已经有答案了 我有一个名为has f我希望它只接受具有以下内容的模板参数f成员函数 我该怎么做呢 这是我尝试过的 template
  • 在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)?

    我对此感到非常困难 contained within MA u008EEIKIAI should be MA EIKIAI nature of string p string3 MA u008EEIKIAI puts string3 MAE
  • 使用 LAPACK 访问子矩阵

    LAPACK 中有一个函数可以给我特定子矩阵的元素吗 如果是的话 C 的语法是什么 或者我需要编码吗 没有用于访问子矩阵的函数 然而 由于 LAPACK 例程中矩阵数据的存储方式 您不需要它 这节省了大量的复制工作 并且 部分 选择了数据布
  • 如何从控制器返回通用响应?

    Net Core 应用程序并调用其他 Net Core Web API 应用程序 我正在调用控制器方法如下 public async Task
  • 使用 java 将 .cer 转换为 .jks

    我想将扩展名为 cer 的文件转换为 jks 文件 有人可以帮我解决这个问题吗 我用谷歌搜索但没有得到太多信息 即使是教程或链接也可以 我猜想使用的是Java Key Store 谢谢 我使用 BouncyCastle 库 最新版本 1 5
  • 将 SCSS 附加到 HTML 文档 [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 这个问题似乎偏离主题 因为它缺乏足够的信息来诊断问题 更详细地描述您的问题或包括一个最小的例子 http stackoverflow co
  • 焦点输入字段的边框半径

    我们如何调整输入字段焦点的边框半径 HTML
  • 如何使用QtCreator远程调试图形应用程序?

    我开发了一个跨平台的 Qt 应用程序 现在我需要 想要在远程主机上运行它并加载 GUI 表单 我知道有两种方法可以做到这一点 通过连接到 QtCreator 的控制台在远程显示器 可能是虚拟的 上打开应用程序ssh 使用远程 X 会话运行
  • Android Studio 显示错误“无效选项 --enable whpx”

    android studio 在运行 AVD 时显示错误 如下所示 无效选项 启用 whpx 请建议一个更好的解决方案来删除它 尝试这个 Android 模拟器需要 Windows Hypervisor Platform WHPX 确保 W
  • Array.prototype.forEach替代实现参数

    在开发我最新的 Web 应用程序并需要使用Array forEach函数 我不断发现以下代码用于添加对没有内置该函数的旧浏览器的支持 Copyright c Mozilla Foundation http www mozilla org T
  • Hadoop 发行版差异

    有人可以概述一下可用的各种 Hadoop 发行版之间的各种差异吗 Cloudera http www cloudera com hadoop http www cloudera com hadoop Yahoo http developer