我有一个具有 4 个节点的完全分布式 Hadoop 集群。当我将作业提交给 Jobtracker 时,Jobtracker 认为 12 个映射任务对我的工作来说很酷,但奇怪的事情发生了。这 12 个映射任务始终在单个节点上运行,而不是在整个集群。在我提出问题之前,我已经做了以下事情:
- 尝试不同的工作
- 运行 start-balance.sh 重新平衡集群
但它不起作用,所以我希望有人能告诉我原因以及如何解决它。
如果输入数据文件的所有块都在该节点中,则调度程序优先考虑同一节点
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)