如何与 hadoop 2.x 并行运行 MapReduce 任务？

2023-12-26

我希望我的地图和减少任务并行运行。然而，尽管尝试了所有的技巧，它们仍然按顺序运行。我读自如何在 Elastic MapReduce 上的 Hadoop 2.4.0 中设置每个节点并发运行任务的精确最大数量 https://stackoverflow.com/questions/25193201/how-to-set-the-precise-max-number-of-concurrently-running-tasks-per-node-in-hado，使用以下公式，可以设置并行运行的任务数。

min (yarn.nodemanager.resource.memory-mb / mapreduce.[map|reduce].memory.mb, 
 yarn.nodemanager.resource.cpu-vcores / mapreduce.[map|reduce].cpu.vcores)

然而，我这样做了，正如你可以从纱线站点.xml and mapred-site.xml我正在使用下面。但任务仍然按顺序运行。请注意，我使用的是开源 Apache Hadoop，而不是 Cloudera。迁移到 Cloudera 可以解决问题吗？另请注意，我的输入文件足够大dfs.块大小也不应该是一个问题。

纱线站点.xml

    <configuration>
    <property>
      <name>yarn.nodemanager.resource.memory-mb</name>
      <value>131072</value>
    </property>
    <property>
      <name>yarn.nodemanager.resource.cpu-vcores</name>
      <value>64</value>
    </property>
    </configuration>

mapred-site.xml

    <configuration>
    <property>
      <name>mapred.job.tracker</name>
      <value>localhost:9001</value>
    </property>

    <property>
      <name>mapreduce.map.memory.mb</name>
      <value>16384</value>
    </property>

    <property>
      <name>mapreduce.reduce.memory.mb</name>
      <value>16384</value>
    </property>

    <property>
        <name>mapreduce.map.cpu.vcores</name>
        <value>8</value>
    </property>

    <property>
        <name>mapreduce.reduce.cpu.vcores</name>
        <value>8</value>
    </property>
    </configuration>

Container是为集群各节点执行Map/Reduce任务而预留的逻辑执行模板。

The yarn.nodemanager.resource.memory-mb属性告诉 YARN 资源管理器为节点中要分派的所有容器保留足够的 RAM 内存以执行 Map/Reduce 任务。这是为每个容器保留的内存的最大上限。

但在你的情况下，节点中的可用内存几乎是11GB，并且你已经配置了yarn.nodemanager.resource.memory-mb到近 128GB(131072) ，mapreduce.map.memory.mb & mapreduce.reduce.memory.mb为16GB。 Map/Reduce 容器所需的上限大小为 16GB，高于 11GB 的可用内存*。这可能是您在节点中仅分配一个容器用于执行的原因。

我们将减少mapreduce.map.memory.mb , mapreduce.reduce.memory.mb属性比可用内存的值要多一个容器并行运行。

另请参阅一些增加可用内存的方法，因为它已经使用了 90% 以上。

希望这可以帮助：） ..

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何与 hadoop 2.x 并行运行 MapReduce 任务？的相关文章

如何将变量的全部内容发送/导出到文本文件/xml 文件/剪贴板？

我想将实例的内容最好以树形形式发送给某人打印屏幕是不行的因为类太复杂了您需要将输出转回实例吗在这种情况下其他答案都是正确的如果您只想手动检查实例的内容理想情况下您的类都将实现toString 你可以将其重定向到一个文件如
ScheduledThreadPoolExecutor如何在特定时间运行任务？

特别是它是否像这样在内部实现了 while true 循环 while System currentTimeMillis lt timeToRunTask Thread sleep 1000 doTask From http grepco
android.view.InflateException：二进制 XML 文件行 #11：膨胀类 ImageView 时出错

我只是尝试制作一个小的 android java xml 应用程序来计算游戏的分数它给了我这个错误 Error inflateing class ImageView 有人知道解决方案吗我实际上搜索了 ppl 说添加这个 android
如何使用 Maven Failsafe 插件运行 JUnit 5 集成测试？

当我运行命令时 Maven Failsafe 插件找不到我的 JUnit 5 集成测试mvn clean failsafe integration test 尽管它可以找到文件我有junit jupiter api and junit j
单元测试组合服务方法

我正在为一个类编写 junit 单元测试该类使用以下方法实现公开的接口 public Set
如何配置 Spring-WS 以使用 JAXB Marshaller？

感谢您到目前为止对此的帮助我正在更新问题因为我没有显示我需要的所有内容并显示了建议的更改肥皂输出仍然不是我想要的 servlet xml
javax.persistence.RollbackException：提交事务时出错]，根本原因是 java.lang.StackOverflowError：null

我有一个使用 Spring Data REST 框架的 Spring Boot API 从 spring boot starter parent 2 1 0 RELEASE 继承的依赖项我正在尝试执行 PUT 或 PATCH 请求来更新实
OpenNLP 与斯坦福 CoreNLP

我一直在对这两个包进行一些比较但不确定该往哪个方向走我简单地寻找的是命名实体识别人地点组织等性别识别一个不错的训练 API 据我所知 OpenNLP 和斯坦福 CoreNLP 提供了非常相似的功能然而 Stanford C
Android WebView文件上传

我正在开发一个 Android 应用程序基本上它是一个WebView和一个进度条 Facebook 的移动网站 m facebook com 已加载到WebView 当我单击选择文件按钮上传图像时没有任何反应我已经尝试了所有的解决
在 Junit 测试中使用 ReflectionTestUtils.setField()

我是 JUnittesting 的新手所以我有一个问题谁能告诉我为什么我们使用ReflectionTestUtils setField 在我们的 Junit 测试示例中正如评论中提到的 java 文档很好地解释了用法但我还想给你们举
关于Java泛型的一些问题

假设我有以下接口和实现类 interface Foo
java.lang.Object的hashCode具体使用的算法是什么

中使用的算法是什么JVM实施java lang Object的隐含的hashCode 方法 OpenJDK or Oracle JDK答案中首选它依赖于实现并且在很大程度上该算法是entirely取决于实施只要它是一致的但是根据
从 Android 访问云存储

我一直无法找到任何有关如何从 Android 应用程序使用云存储的具体文档我确实遇到过这个客户端库 https cloud google com storage docs reference libraries然而 Google Clou
Android 解析 JSON 卡在 get 任务上

我正在尝试解析一些 JSON 数据我的代码工作了一段时间我不确定我改变了什么突然破坏了代码当我运行代码时我没有收到任何运行时错误或警告我创建一个新的 AsyncTask 并执行它当我打电话时 get 在这个新任务中调试器在此行
Java String ReplaceAll 方法给出非法重复错误？

我有一个字符串当我尝试运行时replaceAll方法我收到这个奇怪的错误 String str something op str str replaceAll o n it works fine str str replaceAll n
android 中的 java.net.URL ..新手问题

我是java新手正在尝试android开发以下代码生成 malformedURLException 有人可以帮助我识别异常吗任何提示都会非常有帮助 package com example helloandroid import and
如何将库添加到 LIBGDX 项目的依赖项 gradle

一切都在问题中我已经尝试了在 SO 和其他网站中找到的所有答案但没有运气这就是我迄今为止尝试过的 adding compile fileTree dir lib include jar 到我的 build gradle adding
Java 中的微分方程

我正在尝试用java创建一个简单的SIR流行病模型模拟程序基本上 SIR 由三个微分方程组定义 S t l t S t I t l t S t g t I t R t g t I t S 易感人群 I 感染人群 R 康复人群 l t c
Android Google 地图无法在当前主题中找到样式“mapViewStyle”

添加谷歌地图视图时我扩展了MapView 使用xml编辑器将其添加到活动中并将我的谷歌地图api密钥手动添加到布局xml文件中我的权限在清单文件中允许互联网我想知道的是在 xml 编辑器中我收到错误无法在当前主题中找到样式 m
将数组值导出到 csv 文件 java

我只需要帮助将数组元素导出到 csv 文件我不知道我的代码有什么问题任何帮助将不胜感激谢谢 for int index 0 index lt cols length index FileWriter fw new FileWriter

随机推荐

实体管理器是否需要关闭每个查询？

我将在一年内使用 JPA 作为数据库框架使用 Java 开发系统每次查询时我都不关闭EntityManager IMO的理解是JPA自动关闭实体管理器执行查询后 getSingleResult or 获取结果列表如果没有那么垃圾收集会
为什么 ob_start('ob_gzhandler') 会破坏这个网站？

我有一个网站如果存在 ob start ob gzhandler 则会在浏览器中抛出内容编码错误如果我删除该语句它就可以正常运行该站点与许多其他站点使用相同的框架服务器和托管包无论声明是否在其中它们都有效该语句位于框架中而
SendMessage WM_SETTEXT 到 TextBox 不会触发 TextChanged 事件

我有代码获取文本框控件的句柄并使用 Windows API 来更改文本更新文本时不会触发 TextChanged 事件有没有办法使用 Windows API 触发 TextBox TextChanged 事件 Update 我认为该事件
Microsoft SQL Server 2008 主键的含义

主键的概念对于SQL Server数据库引擎有什么意义我的意思不是在 ID 列上创建的聚集非聚集索引我的意思是约束对象主键存在与否有什么关系吗备择方案更改表添加主键聚集更改表创建聚集索引这有什么不同吗一般来说 KEY 是
Python - Pyodbc 连接错误

我正在尝试使用Python3 4连接到SQL Server数据库这是适合我的代码 cnxn pyodbc connect DRIVER ODBC Driver 13 for SQL Server SERVER DESKTOP GDM2HQ
CSS 媒体查询有多慢？

当我组织 CSS 时我喜欢将相关样式保留在一起页眉样式位于一个部分页脚样式全部位于同一位置等等抱歉 OOCSS 拥护者我最近一直在尝试针对较小较大屏幕的媒体查询为了与我的组织方案保持一致我必须为代码的每个部分所针对的每个屏
在 Win32 控制台应用程序中使用 ShutdownBlockRequestCreate

阻止在 Windows 7 上运行的 Win32 控制台应用程序提前终止的正确方法是什么 Vista 推出后有关方式发生了变化应用程序关闭 http msdn microsoft com en us library ms700677 28
R 中指定列数的矩阵的 rowsum

我正在尝试获取 R 矩阵中某一行的列总和但是我不希望对整行进行求和而只对指定数量的列进行求和即在本例中对角线上方的所有列进行求和我尝试过 sum 和 rowSums 函数但它们要么给我奇怪的结果要么给我错误消息为了进行说明
使用 jQuery / JavaScript 进行组合键

我很好奇我如何使用我在这个问题底部编写的以下 jQuery 插件代码来实现关键组合到目前为止它的工作原理是它允许用户简单地通过执行正常的 jQuery 语法来创建按键命令并为按键命令提供一个事件如下所示 window jkey a
A延伸B；类型“Pick> & B”不可分配给类型“A”.ts(2322)

这是错误还是我误解了打字稿的内容示例代码如下 type Omit
JSP 模板可以在 Java 中使用吗？

我对 JSP 还很陌生到目前为止处理流程似乎是首先运行 Java 然后填充 JSP 模板我想知道是否有一种方法可以从 Java 内部使用 JSP 模板我的意思是假设我在类路径上有一个简单的 SimpleDiv jsp 模板如下所
使用 mocha 运行时，仍然收到 babel-plugin-syntax-dynamic-import 动态导入的语法错误

所有 babel 模块插件均位于最新版本的 babel v6 上 Mocha 版本为 v4 0 1 Setup babelrc presets stage 3 env targets browsers last 2 versions no
如何在 WhatsApp 中一次性向多个号码发送消息？

我正在尝试使用 Flutter 通过 WhatsApp 向多个电话号码发送消息 sendMessage async var number 201020402642 201030666895 var baseUrl https api wha
动态链接和 jQuery Lightbox 问题：在 lightbox 中加载图像...完全难住了！

我有一个可以动态创建照片库链接的功能当单击缩略图时该函数还会生成更大的图像作为 div 的背景图像我想做的是第三个事件如果用户单击 div 中的放大图像 jQuery Fancybox 会加载 div 中显示的图像的更大版本问题是
在 Android 上运行 docker

在 Android 4 4 KitKat 中 Google 正在将 Linux 内核升级到 3 8 版这是 Docker 所需的内核版本我不知道 AUFS 部分但有没有办法通过此更新在 Android 上运行 docker 容器根据
如何在 Rust 中指定链接器路径？

我正在尝试将 Rust 程序与库声音库 http libsound io 我使用的是 Windows 并且可以下载 GCC 二进制文件如果我将它放在与我的项目相同的文件夹中我可以像这样链接它 link name libsoundio 1
C# 十六进制字符串到字节图像和过滤

我需要一些帮助将十六进制字符串转换为图像做了一些研究我想到了这段代码 private byte HexString2Bytes string hexString int bytesCount hexString Length 2 byt
使用 OAuth 和 PowerShell 更新 Azure DevOps Wiki 页面

我正在尝试通过在 Azure DevOps 发布管道中创建新页面来自动创建发行说明使用其 Rest API 的 Azure DevOps wiki https learn microsoft com fr fr rest api azure
Flutter-图像选择器包：通过删除操作依次显示图像

在我的 Flutter pr 项目中我使用图像选择器 https pub dev packages image picker插件用于从 Android 移动图库中选择图像或使用相机捕获图像并逐个显示它们并在每张图像下方显示删除图标点击
如何与 hadoop 2.x 并行运行 MapReduce 任务？

我希望我的地图和减少任务并行运行然而尽管尝试了所有的技巧它们仍然按顺序运行我读自如何在 Elastic MapReduce 上的 Hadoop 2 4 0 中设置每个节点并发运行任务的精确最大数量 https stackoverfl

如何与 hadoop 2.x 并行运行 MapReduce 任务？

如何与 hadoop 2.x 并行运行 MapReduce 任务？ 的相关文章

随机推荐

热门标签

如何与 hadoop 2.x 并行运行 MapReduce 任务？的相关文章