如何与 hadoop 2.x 并行运行 MapReduce 任务?

2023-12-26

我希望我的地图和减少任务并行运行。然而,尽管尝试了所有的技巧,它们仍然按顺序运行。我读自如何在 Elastic MapReduce 上的 Hadoop 2.4.0 中设置每个节点并发运行任务的精确最大数量 https://stackoverflow.com/questions/25193201/how-to-set-the-precise-max-number-of-concurrently-running-tasks-per-node-in-hado,使用以下公式,可以设置并行运行的任务数。

min (yarn.nodemanager.resource.memory-mb / mapreduce.[map|reduce].memory.mb, 
 yarn.nodemanager.resource.cpu-vcores / mapreduce.[map|reduce].cpu.vcores)

然而,我这样做了,正如你可以从纱线站点.xml and mapred-site.xml我正在使用下面。但任务仍然按顺序运行。请注意,我使用的是开源 Apache Hadoop,而不是 Cloudera。迁移到 Cloudera 可以解决问题吗?另请注意,我的输入文件足够大dfs.块大小也不应该是一个问题。

纱线站点.xml

    <configuration>
    <property>
      <name>yarn.nodemanager.resource.memory-mb</name>
      <value>131072</value>
    </property>
    <property>
      <name>yarn.nodemanager.resource.cpu-vcores</name>
      <value>64</value>
    </property>
    </configuration>

mapred-site.xml

    <configuration>
    <property>
      <name>mapred.job.tracker</name>
      <value>localhost:9001</value>
    </property>

    <property>
      <name>mapreduce.map.memory.mb</name>
      <value>16384</value>
    </property>

    <property>
      <name>mapreduce.reduce.memory.mb</name>
      <value>16384</value>
    </property>

    <property>
        <name>mapreduce.map.cpu.vcores</name>
        <value>8</value>
    </property>

    <property>
        <name>mapreduce.reduce.cpu.vcores</name>
        <value>8</value>
    </property>
    </configuration>

Container是为集群各节点执行Map/Reduce任务而预留的逻辑执行模板。

The yarn.nodemanager.resource.memory-mb属性告诉 YARN 资源管理器为节点中要分派的所有容器保留足够的 RAM 内存以执行 Map/Reduce 任务。这是为每个容器保留的内存的最大上限。

但在你的情况下,节点中的可用内存几乎是11GB,并且你已经配置了yarn.nodemanager.resource.memory-mb到近 128GB(131072) ,mapreduce.map.memory.mb & mapreduce.reduce.memory.mb为16GB。 Map/Reduce 容器所需的上限大小为 16GB,高于 11GB 的可用内存*。这可能是您在节点中仅分配一个容器用于执行的原因。

我们将减少mapreduce.map.memory.mb , mapreduce.reduce.memory.mb属性比可用内存的值要多一个容器并行运行。

另请参阅一些增加可用内存的方法,因为它已经使用了 90% 以上。

希望这可以帮助 :) ..

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何与 hadoop 2.x 并行运行 MapReduce 任务? 的相关文章

随机推荐

  • 实体管理器是否需要关闭每个查询?

    我将在一年内使用 JPA 作为数据库框架使用 Java 开发系统 每次查询时 我都不关闭EntityManager IMO的理解是JPA自动关闭实体管理器执行查询后 getSingleResult or 获取结果列表 如果没有那么垃圾收集会
  • 为什么 ob_start('ob_gzhandler') 会破坏这个网站?

    我有一个网站 如果存在 ob start ob gzhandler 则会在浏览器中抛出内容编码错误 如果我删除该语句 它就可以正常运行 该站点与许多其他站点使用相同的框架 服务器和托管包 无论声明是否在其中 它们都有效 该语句位于框架中 而
  • SendMessage WM_SETTEXT 到 TextBox 不会触发 TextChanged 事件

    我有代码获取文本框控件的句柄并使用 Windows API 来更改文本 更新文本时不会触发 TextChanged 事件 有没有办法使用 Windows API 触发 TextBox TextChanged 事件 Update 我认为该事件
  • Microsoft SQL Server 2008 主键的含义

    主键的概念对于SQL Server数据库引擎有什么意义 我的意思不是在 ID 列上创建的聚集 非聚集索引 我的意思是约束对象 主键 存在与否有什么关系吗 备择方案 更改表添加主键聚集 更改表创建聚集索引 这有什么不同吗 一般来说 KEY 是
  • Python - Pyodbc 连接错误

    我正在尝试使用Python3 4连接到SQL Server数据库 这是适合我的代码 cnxn pyodbc connect DRIVER ODBC Driver 13 for SQL Server SERVER DESKTOP GDM2HQ
  • CSS 媒体查询有多慢?

    当我组织 CSS 时 我喜欢将相关样式保留在一起 页眉样式位于一个部分 页脚样式全部位于同一位置 等等 抱歉 OOCSS 拥护者 我最近一直在尝试针对较小 较大屏幕的媒体查询 为了与我的组织方案保持一致 我必须为代码的每个部分所针对的每个屏
  • 在 Win32 控制台应用程序中使用 ShutdownBlockRequestCreate

    阻止在 Windows 7 上运行的 Win32 控制台应用程序提前终止的正确方法是什么 Vista 推出后 有关方式发生了变化应用程序关闭 http msdn microsoft com en us library ms700677 28
  • R 中指定列数的矩阵的 rowsum

    我正在尝试获取 R 矩阵中某一行的列总和 但是 我不希望对整行进行求和 而只对指定数量的列进行求和 即在本例中对角线上方的所有列进行求和 我尝试过 sum 和 rowSums 函数 但它们要么给我奇怪的结果 要么给我错误消息 为了进行说明
  • 使用 jQuery / JavaScript 进行组合键

    我很好奇我如何使用我在这个问题底部编写的以下 jQuery 插件代码来实现关键组合 到目前为止 它的工作原理是它允许用户简单地通过执行正常的 jQuery 语法来创建按键命令 并为按键命令提供一个事件 如下所示 window jkey a
  • A延伸B;类型“Pick> & B”不可分配给类型“A”.ts(2322)

    这是错误还是我误解了打字稿的内容 示例代码如下 type Omit
  • JSP 模板可以在 Java 中使用吗?

    我对 JSP 还很陌生 到目前为止 处理流程似乎是首先运行 Java 然后填充 JSP 模板 我想知道是否有一种方法可以从 Java 内部使用 JSP 模板 我的意思是 假设我在类路径上有一个简单的 SimpleDiv jsp 模板 如下所
  • 使用 mocha 运行时,仍然收到 babel-plugin-syntax-dynamic-import 动态导入的语法错误

    所有 babel 模块 插件均位于最新版本的 babel v6 上 Mocha 版本为 v4 0 1 Setup babelrc presets stage 3 env targets browsers last 2 versions no
  • 如何在 WhatsApp 中一次性向多个号码发送消息?

    我正在尝试使用 Flutter 通过 WhatsApp 向多个电话号码发送消息 sendMessage async var number 201020402642 201030666895 var baseUrl https api wha
  • 动态链接和 jQuery Lightbox 问题:在 lightbox 中加载图像...完全难住了!

    我有一个可以动态创建照片库链接的功能 当单击缩略图时 该函数还会生成更大的图像作为 div 的背景图像 我想做的是第三个事件 如果用户单击 div 中的放大图像 jQuery Fancybox 会加载 div 中显示的图像的更大版本 问题是
  • 在 Android 上运行 docker

    在 Android 4 4 KitKat 中 Google 正在将 Linux 内核升级到 3 8 版 这是 Docker 所需的内核版本 我不知道 AUFS 部分 但有没有办法通过此更新在 Android 上运行 docker 容器 根据
  • 如何在 Rust 中指定链接器路径?

    我正在尝试将 Rust 程序与库声音库 http libsound io 我使用的是 Windows 并且可以下载 GCC 二进制文件 如果我将它放在与我的项目相同的文件夹中 我可以像这样链接它 link name libsoundio 1
  • C# 十六进制字符串到字节图像和过滤

    我需要一些帮助将十六进制字符串转换为图像 做了一些研究 我想到了这段代码 private byte HexString2Bytes string hexString int bytesCount hexString Length 2 byt
  • 使用 OAuth 和 PowerShell 更新 Azure DevOps Wiki 页面

    我正在尝试通过在 Azure DevOps 发布管道中创建新页面来自动创建发行说明使用其 Rest API 的 Azure DevOps wiki https learn microsoft com fr fr rest api azure
  • Flutter-图像选择器包:通过删除操作依次显示图像

    在我的 Flutter pr 项目中 我使用图像选择器 https pub dev packages image picker插件用于从 Android 移动图库中选择图像或使用相机捕获图像并逐个显示它们 并在每张图像下方显示删除图标 点击
  • 如何与 hadoop 2.x 并行运行 MapReduce 任务?

    我希望我的地图和减少任务并行运行 然而 尽管尝试了所有的技巧 它们仍然按顺序运行 我读自如何在 Elastic MapReduce 上的 Hadoop 2 4 0 中设置每个节点并发运行任务的精确最大数量 https stackoverfl