我读过很多关于在机器集群上运行的 Hadoop 和 Map-Reduce 的内容。有人知道 Apache 发行版是否可以在具有多个内核的 SMP 上运行吗?特别是,多个Map-Reduce进程是否可以在同一台机器上运行。调度程序将负责将它们分布在多个核心上。谢谢。 - 公斤
是的。每台机器上都有多个map和reduce槽,这些槽由RAM和CPU决定(每个JVM实例默认需要1GB,因此具有16核的8GB机器仍应有7个任务槽)
from hadoop 维基 http://wiki.apache.org/hadoop/FAQ#I_see_a_maximum_of_2_maps.2BAC8-reduces_spawned_concurrently_on_each_TaskTracker.2C_how_do_I_increase_that.3F
使用配置旋钮:mapred.tasktracker.map.tasks.maximum 和
mapred.tasktracker.reduce.tasks.maximum 来控制数量
映射/减少同时在任务跟踪器上生成。默认情况下,它
设置为 2,因此最多可以看到 2 张地图,并且 2 会减少
TaskTracker 上的给定实例。
您可以在每个任务跟踪器的基础上设置它们以准确反映
你的硬件(即在更强大的任务跟踪器上将它们设置为更高的编号)
ETC。)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)