您好,我是 Hadoop 新手,对版本名称非常困惑,我应该使用 1.x(强大的支持和学习资源)、2.2 或 0.23 中的哪一个。
我读到 hadoop 正在从 v0.23 完全迁移到 YARN(link1 ).
但与此同时,整个网络都在说 hadoop v2.0 正在迁移到 YARN(link2)并且我可以在 Hadoop 2.2 本身中看到 YARN 配置文件。
- 但由于 0.23 对我来说似乎是最新版本,2.2 也可以吗
支持纱线? (参考链接1,它说hadoop将支持YARN
v0.23)
- 作为初学者,我应该选择 1.x 还是 2.x 版本
hadoop的学习视角。
- 还有其他与hadoop一起使用的技术吗,比如pig、hive等?
最新版本的 hadoop 是否可用?
Thanks.
UPDATE
谢谢大家的回复。
我最终使用了 hadoop 2.2,因为所有著名的教程和资源都已经过时了,尽管我找到了一本好书来开始使用 v2.2。
《Hadoop:权威指南,第三版》作者:Tom White(Buy Here)
支持hadoop v2.2。
The 源代码是在github上给出的https://github.com/tomwhite/hadoop-book
正如github上提到的,本书的代码经过测试
This version of the code has been tested with:
* Hadoop 1.2.1/0.22.0/0.23.x/2.2.0
* Avro 1.5.4
* Pig 0.9.1
* Hive 0.8.0
* HBase 0.90.4/0.94.15
* ZooKeeper 3.4.2
* Sqoop 1.4.0-incubating
* MRUnit 0.8.0-incubating
希望能帮助到你..!!!
有一些活跃的版本系列。 1.x 版本系列是 0.20 的延续
发布系列。 0.23 发布几周后,以前称为 0.20.205 的 0.20 分支被重新编号为 1.0。 0.20.205 和 1.0 之间几乎没有功能差异。这只是重新编号。
0.23 包括几个主要的新功能,包括一个新的 MapReduce 运行时,称为 MapReduce 2,在称为 YARN(又一个资源协商器)的新系统上实现,YARN 是用于运行分布式应用程序的通用资源管理系统。同样,2.x 版本是 0.23 版本系列的延续。所以2.2也支持YARN。
根据Hadoop 2.2 发行说明
我建议从Cloudera分配,因为你刚开始学习。 CDH 4.5 包含您正在寻找的 YARN 功能。你也可以尝试霍顿工厂分配。与这些供应商合作的优点是,您无需担心哪个版本的组件(例如 Hive、Pig)可以与您的 Hadoop 安装配合使用。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)