据我所知,YARN 被引入并取代了 JobTracker 和 TaskTracker。
我看过一些Hadoop 2.6.0/2.7.0安装教程,他们正在配置mapreduce.framework.name
作为纱线和mapred.job.tracker
属性为本地或主机:端口。
描述为mapred.job.tracker
财产是
“MapReduce 作业跟踪器运行的主机和端口。如果是“本地”,
然后作业作为单个映射和化简任务在进程中运行。”
我的疑问是,如果我们使用 YARN ,为什么要配置它,我的意思是 JobTracker 不应该正常运行?
如果我的问题很愚蠢,请原谅我。
编辑:这些是我正在谈论的教程。
http://chaalpritam.blogspot.in/2015/01/hadoop-260-multi-node-cluster-setup-on.html http://chaalpritam.blogspot.in/2015/01/hadoop-260-multi-node-cluster-setup-on.html
http://pingax.com/install-apache-hadoop-ubuntu-cluster-setup/ http://pingax.com/install-apache-hadoop-ubuntu-cluster-setup/
https://chawlasumit.wordpress.com/2015/03/09/install-a-multi-node-hadoop-cluster-on-ubuntu-14-04/ https://chawlasumit.wordpress.com/2015/03/09/install-a-multi-node-hadoop-cluster-on-ubuntu-14-04/
这只是一个猜测,但那些讨论在 YARN 中配置 JobTracker 的教程要么是由不知道 YARN 是什么的人编写的,要么是他们设置它以防您有一天决定停止使用 YARN。你是对的:YARN 中不存在 JobTracker 和 TaskTracker。如果需要,您可以添加属性,但它们将被忽略。使用 YARN 添加了替换 JobTracker 和 TaskTracker 的每个组件的新属性,例如yarn.resourcemanager.address
取代mapred.jobtracker.address
.
如果在 YARN 下运行 Hadoop 时列出 Java 进程,您将看不到任何进程JobTracker
or TaskTracker
:
10561 Jps
20605 NameNode
17176 DataNode
18521 ResourceManager
19625 NodeManager
18424 JobHistoryServer
您可以阅读更多有关YARN 在这里是如何工作的 http://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-site/YARN.html.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)