Hadoop 溢出故障

2024-01-14

我目前正在开发一个使用 Hadoop 0.21.0、985326 以及一个由 6 个工作节点和一个头节点组成的集群的项目。提交常规 MapReduce 作业失败，但我不知道为什么。以前有人见过这个异常吗？

org.apache.hadoop.mapred.Child: Exception running child : java.io.IOException: Spill failed
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.checkSpillException(MapTask.java:1379)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.access$200(MapTask.java:711)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer$Buffer.write(MapTask.java:1193)
    at java.io.DataOutputStream.write(DataOutputStream.java:90)
    at org.apache.hadoop.io.Text.write(Text.java:290)
    at org.apache.hadoop.io.serializer.WritableSerialization$WritableSerializer.serialize(WritableSerialization.java:100)
    at org.apache.hadoop.io.serializer.WritableSerialization$WritableSerializer.serialize(WritableSerialization.java:84)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:967)
    at org.apache.hadoop.mapred.MapTask$NewOutputCollector.write(MapTask.java:583)
    at org.apache.hadoop.mapreduce.task.TaskInputOutputContextImpl.write(TaskInputOutputContextImpl.java:92)
    at org.apache.hadoop.mapreduce.lib.map.WrappedMapper$Context.write(WrappedMapper.java:111)
    at be.ac.ua.comp.ronny.riki.invertedindex.FilteredInvertedIndexBuilder$Map.map(FilteredInvertedIndexBuilder.java:113)
    at be.ac.ua.comp.ronny.riki.invertedindex.FilteredInvertedIndexBuilder$Map.map(FilteredInvertedIndexBuilder.java:1)
    at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:144)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:652)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:328)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:217)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:742)
    at org.apache.hadoop.mapred.Child.main(Child.java:211)
Caused by: java.lang.RuntimeException: java.lang.NoSuchMethodException: org.apache.hadoop.io.ArrayWritable.<init>()
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:123)
    at org.apache.hadoop.io.serializer.WritableSerialization$WritableDeserializer.deserialize(WritableSerialization.java:68)
    at org.apache.hadoop.io.serializer.WritableSerialization$WritableDeserializer.deserialize(WritableSerialization.java:44)
    at org.apache.hadoop.mapreduce.task.ReduceContextImpl.nextKeyValue(ReduceContextImpl.java:145)
    at org.apache.hadoop.mapreduce.task.ReduceContextImpl.nextKey(ReduceContextImpl.java:121)
    at org.apache.hadoop.mapreduce.lib.reduce.WrappedReducer$Context.nextKey(WrappedReducer.java:291)
    at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:168)
    at org.apache.hadoop.mapred.Task$NewCombinerRunner.combine(Task.java:1432)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.sortAndSpill(MapTask.java:1457)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.access$600(MapTask.java:711)
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer$SpillThread.run(MapTask.java:1349)
Caused by: java.lang.NoSuchMethodException: org.apache.hadoop.io.ArrayWritable.<init>()
    at java.lang.Class.getConstructor0(Class.java:2706)
    at java.lang.Class.getDeclaredConstructor(Class.java:1985)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117)
    ... 10 more

目前，我正在尝试一些配置参数，希望这个错误消失，但到目前为止还没有成功。我正在调整的配置参数是：

mapred.map.tasks = 60
mapred.reduce.tasks = 12
Job.MAP_OUTPUT_COMPRESS（或mapreduce.map.output.compress）= true
Job.IO_SORT_FACTOR（或mapreduce.task.io.sort.factor）= 10
Job.IO_SORT_MB（或mapreduce.task.io.sort.mb）= 256
Job.MAP_JAVA_OPTS（或mapreduce.map.java.opts）=“-Xmx256”或“-Xmx512”
Job.REDUCE_JAVA_OPTS（或mapreduce.reduce.java.opts）=“-Xmx256”或“-Xmx512”

谁能解释一下为什么会出现上述异常？以及如何避免呢？或者只是一个简短的解释 hadoop 溢出操作意味着什么？

好了，所有问题都解决了。

Map-Reduce序列化操作需要intern一个默认构造函数org.apache.hadoop.io.ArrayWritable.
Hadoops 实现没有为 ArrayWritable 提供默认构造函数。
这就是抛出 java.lang.NoSuchMethodException: org.apache.hadoop.io.ArrayWritable.() 并导致奇怪的溢出异常的原因。

一个简单的包装器使 ArrayWritable 真正可写并修复了它！奇怪的是 Hadoop 没有提供这个。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop 溢出故障的相关文章

将多个前缀行过滤器设置为扫描仪 hbase java

我想创建一台扫描仪它可以为我提供带有 2 个前缀过滤器的结果例如我想要其键以字符串 x 开头或以字符串 y 开头的所有行目前我知道只能使用一个前缀方法如下 scan setRowPrefixFilter prefixFiltet 在
Hive ParseException - 无法识别“结束”“字符串”附近的输入

尝试从现有 DynamoDB 表创建 Hive 表时出现以下错误 NoViableAltException 88 at org apache hadoop hive ql parse HiveParser IdentifiersParser
为什么组合器输入记录的数量比映射的输出数量多？

Combiner 在 Mapper 之后 Reducer 之前运行它将接收给定节点上的 Mapper 实例发出的所有数据作为输入然后它将输出发送到Reducers 因此组合器输入的记录应小于映射输出的记录 12 08 29 13 38
在 Hadoop 中按文件中的值排序

我有一个文件其中每行包含一个字符串然后是一个空格然后是一个数字例子 Line1 Word 2 Line2 Word1 8 Line3 Word2 1 我需要按降序对数字进行排序然后将结果放入文件中为数字分配排名所以我的输出应该
在 mongo 中，如何使用 Map Reduce 来按最近排序来获取组

我看到的 MapReduce 示例使用了诸如 count 之类的聚合函数但是使用 MapReduce 来获取每个类别中前 3 个项目的最佳方法是什么我假设我也可以使用 group 函数但很好奇因为他们声明分片环境不能使用 group
使用 Hadoop 映射两个数据集

假设我有两个键值数据集数据集A和B 我们称它们为数据集A和B 我想用 B 组的数据更新 A 组中的所有数据其中两者在键上匹配因为我要处理如此大量的数据所以我使用 Hadoop 进行 MapReduce 我担心的是为了在 A 和 B
是否值得购买 Mahout in Action 以跟上 Mahout 的速度，或者还有其他更好的来源吗？

我目前是一个非常随意的用户阿帕奇马胡特 http mahout apache org 我正在考虑购买这本书象夫在行动 http www manning com owen 不幸的是我很难理解这本书的价值并且认为它是一本曼宁早期访问计划 h
Hadoop安装问题：

我跟着this http www bogotobogo com Hadoop BigData hadoop Install on ubuntu single node cluster phpHadoop 安装教程不幸的是当我运行全部启动
Oozie SSH 操作

Oozie SSH 操作问题 Issue 我们正在尝试在集群的特定主机上运行一些命令我们为此选择了 SSH Action 我们面对这个 SSH 问题已经有一段时间了这里真正的问题可能是什么请指出解决方案 logs AUTH FAILE
将日期字符串转换为“MM/DD/YY”格式

我刚刚看到这个例子我该如何解决这个问题 Hive 元存储包含一个名为 Problem1 的数据库其中包含一个名为 customer 的表 customer 表包含 9000 万条客户记录 90 000 000 每条记录都有一个生日字段
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
hadoop中reducer的数量

我正在学习hadoop 我发现减速器的数量非常令人困惑 1 reducer的数量与partition的数量相同 2 reducer 的数量是 0 95 或 1 75 乘以节点数每个节点的最大容器数 3 减速机数量设定为mapred re
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
hive 从两个数组创建映射或键/值对

我有两个具有相同数量值的数组它们映射为 1 1 我需要从这两个数组创建一个键值对或映射键值任何想法或提示都会有帮助当前表结构 USA WEST NUMBER Street City 135 Pacific Irvine USA
带有安全 Kafka 抛出的 Spark 结构化流：无权访问组异常

为了在我的项目中使用结构化流我正在 hortonworks 2 6 3 环境上测试 Spark 2 2 0 和 Kafka 0 10 1 与 Kerberos 的集成我正在运行下面的示例代码来检查集成我能够在 Spark 本地模式下的
是否可以只迭代一个流一次并执行 2 个或更多操作？

给定代码 List
纱线上的火花，连接到资源管理器 /0.0.0.0:8032

我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点当然都在linux机器上我在idea IDE中以spark独立模式运行spark程序它运行成功
运行时异常：java.lang.NoSuchMethodException：tfidf$Reduce.()

如何解决这个问题 tfidf是我的主类为什么运行jar文件后会出现这个错误 java lang RuntimeException java lang NoSuchMethodException tfidf Reduce
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918

随机推荐

如何指定emacs中ESS会话打开的R版本？ [复制]

这个问题在这里已经有答案了当我想在 emacs 中打开 R 会话时我使用M x R 但是我们的服务器在 usr bin R 中有 R 2 12 在 usr local bin R 中有 R 2 15 事实上如果我问whereis R
android studio 将Json解析为字符串

我有这个 JSON 对象 1 id module f83d6101cc adresse mac 00 6A 8E 16 C6 26 mot de passe mp0001 name a 2 id module 64eae5403b adre
在服务器上运行选项未出现在 Eclipse 中

我正在学习 SpringMVC 框架并查看了他们的代码副本 https src springframework org svn spring samples mvc basic trunk https src springframework
Hibernate：插入问题 - 找不到父键

我在将实体插入数据库时遇到问题我正在使用 Hibernate JPA 这是我的数据库结构 Table User CGU USER ID as PK Table Industries CGI INDUSTRY ID PK CGI INDU
PHP 中带有类型提示的动态返回类型？

对于标准方法我知道可以在注释中指定返回类型例如 Load this entity from the database with the specified primary key param int Key return BaseEnt
如何避免重复常见的可观察配置？

我正在使用 Retrofit 在 Android 中编写一个 API 客户端这种代码会重复很多次 myObservableFromRetrofit subscribeOn Schedulers io observeOn AndroidS
如何将RequestMappingHandlerMapping和资源处理程序添加到Spring MVC配置类

我有一个像这样的 Spring MVC 配置类 Configuration EnableWebMvc public class WebConfig extends WebMvcConfigurerAdapter Bean public In
Flutter：我可以将参数传递给按钮上 onPress 事件中定义的函数吗？

我有一个简单的表单带有一个用于计算表单的按钮我认为最好点击按钮开始计算操作并将变量传递给哑函数而不是让函数知道它不需要知道的文本字段我可以这样做吗或者我的计算函数是否需要访问我的文本字段 new Container color C
使用 JavaScript 滚动时响应式动画页面元素 [编辑：视差滚动]

我确信这个问题过去曾被提起过然而我对一个术语不知所措 On this web page https squareup com careers creative对于 square 用户滚动浏览标题为在 Square 不同学科协作设计精美简
ImageFont.textsize()返回值的单位是什么？

我正在尝试使用 PIL 来预先计算给定文本行在给定字体和大小下所采用的大小 PIL 似乎或多或少是唯一可行的解决方案我不确定返回值的单位是什么font textsize The doc http effbot org imagingbo
在绘图和小平面条之间移动轴标签

我试图将小面条移动到图的最左侧以便标签位于条形旁边分组条位于其左侧请参见下面的示例我认为这必须通过 Grob 来完成但我对这种级别的操作缺乏经验并且希望得到指导 Data structure list dept structur
如何在存储过程中迭代记录集？

我需要从存储过程迭代记录集并使用每个字段作为参数执行另一个存储过程我无法在代码中完成此迭代我在互联网上找到了示例但它们似乎都涉及计数器我不确定我的问题是否涉及计数器我需要相当于 T SQL 的foreach 目前我的第一个存储
如何使用多行字符串示例比较 Cucumber 步骤中的 xml 输出？

Chargify 在他们的项目中有这个 Cucumber 场景docs http docs chargify com api customers api usage xml customers read Scenario Retrieve
想要在按我的应用程序的启动器图标后返回到上一个活动

假设我有一个活动 A 启动活动 B 并自行终止现在我按下主页按钮或以其他方式离开应用程序导致活动 B 的 onPause gt onStop 然后再次单击启动器中的应用程序图标所发生的情况是活动 A 再次启动当然是因为我在清单
使用 C# 替换本机 .exe 中的字符串

如何捕获本机 Windows exe 文件中的所有字符串并稍后使用 C 将它们替换为其他字符串背景我想创建一个 C 工具来从简单的 exe 文件中提取和替换字符串这有可能吗您需要启动一个 PE COFF 解析器如果你的字符串存储
使用sql从多个字段中选择不同的字段

我有 5 列对应于问答游戏数据库中的答案对错 1 错 2 错 3 错 4 我想返回所有可能的答案而不重复我希望在不使用临时表的情况下完成此任务是否可以使用类似的东西 select c1 c2 count from t group b
受保护的成员/字段真的那么糟糕吗？

现在如果您阅读 MSDN 中 C 的命名约定您会注意到它指出属性始终优先于公共字段和受保护字段有些人甚至告诉我你永远不应该使用公共或受保护的领域现在我同意我还没有找到需要拥有公共领域的理由但受保护的领域真的那么糟糕吗如果您需要
原始变量和引用变量的内存分配[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions type name 对于引用类型这
Java：返回 java.util.Date 格式的字符串[重复]

这个问题在这里已经有答案了我将以 201201 格式接收输入即 YYYYMM 格式现在我想按原样返回值 201201 但它应该采用 java util Date 格式我很困惑 String strDate 201201 Simple
Hadoop 溢出故障

我目前正在开发一个使用 Hadoop 0 21 0 985326 以及一个由 6 个工作节点和一个头节点组成的集群的项目提交常规 MapReduce 作业失败但我不知道为什么以前有人见过这个异常吗 org apache hadoop

Hadoop 溢出故障

Hadoop 溢出故障 的相关文章

随机推荐

热门标签

Hadoop 溢出故障的相关文章