Hadoop 中的数据复制错误

2024-01-07

我正在我的机器上实现 Hadoop 单节点集群，方法如下迈克尔·诺尔的教程 http://www.michael-noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_%28Single-Node_Cluster%29并遇到数据复制错误：

这是完整的错误消息：

> hadoop@laptop:~/hadoop$ bin/hadoop dfs -copyFromLocal
> tmp/testfiles testfiles
> 
> 12/05/04 16:18:41 WARN hdfs.DFSClient: DataStreamer Exception:
> org.apache.hadoop.ipc.RemoteException: java.io.IOException: File
> /user/hadoop/testfiles/testfiles/file1.txt could only be replicated to
> 0 nodes, instead of 1   at
> org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:1271)
>     at
> org.apache.hadoop.hdfs.server.namenode.NameNode.addBlock(NameNode.java:422)
>     at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)  at
> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
>     at java.lang.reflect.Method.invoke(Method.java:597)     at
> org.apache.hadoop.ipc.RPC$Server.call(RPC.java:508)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:959)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:955)     at
> java.security.AccessController.doPrivileged(Native Method)  at
> javax.security.auth.Subject.doAs(Subject.java:396)  at
> org.apache.hadoop.ipc.Server$Handler.run(Server.java:953)
> 
>     at org.apache.hadoop.ipc.Client.call(Client.java:740)   at
> org.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:220)  at
> $Proxy0.addBlock(Unknown Source)    at
> sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)     at
> sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
>     at
> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
>     at java.lang.reflect.Method.invoke(Method.java:597)     at
> org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:82)
>     at
> org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:59)
>     at $Proxy0.addBlock(Unknown Source)     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.locateFollowingBlock(DFSClient.java:2937)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.nextBlockOutputStream(DFSClient.java:2819)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.access$2000(DFSClient.java:2102)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:2288)
> 
> 12/05/04 16:18:41 WARN hdfs.DFSClient: Error Recovery for block null
> bad datanode[0] nodes == null 12/05/04 16:18:41 WARN hdfs.DFSClient:
> Could not get block locations. Source file
> "/user/hadoop/testfiles/testfiles/file1.txt" - Aborting...
> copyFromLocal: java.io.IOException: File
> /user/hadoop/testfiles/testfiles/file1.txt could only be replicated to
> 0 nodes, instead of 1 12/05/04 16:18:41 ERROR hdfs.DFSClient:
> Exception closing file /user/hadoop/testfiles/testfiles/file1.txt :
> org.apache.hadoop.ipc.RemoteException: java.io.IOException: File
> /user/hadoop/testfiles/testfiles/file1.txt could only be replicated to
> 0 nodes, instead of 1   at
> org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:1271)
>     at
> org.apache.hadoop.hdfs.server.namenode.NameNode.addBlock(NameNode.java:422)
>     at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)  at
> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
>     at java.lang.reflect.Method.invoke(Method.java:597)     at
> org.apache.hadoop.ipc.RPC$Server.call(RPC.java:508)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:959)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:955)     at
> java.security.AccessController.doPrivileged(Native Method)  at
> javax.security.auth.Subject.doAs(Subject.java:396)  at
> org.apache.hadoop.ipc.Server$Handler.run(Server.java:953)
> 
> org.apache.hadoop.ipc.RemoteException: java.io.IOException: File
> /user/hadoop/testfiles/testfiles/file1.txt could only be replicated to
> 0 nodes, instead of 1   at
> org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:1271)
>     at
> org.apache.hadoop.hdfs.server.namenode.NameNode.addBlock(NameNode.java:422)
>     at sun.reflect.GeneratedMethodAccessor7.invoke(Unknown Source)  at
> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
>     at java.lang.reflect.Method.invoke(Method.java:597)     at
> org.apache.hadoop.ipc.RPC$Server.call(RPC.java:508)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:959)     at
> org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:955)     at
> java.security.AccessController.doPrivileged(Native Method)  at
> javax.security.auth.Subject.doAs(Subject.java:396)  at
> org.apache.hadoop.ipc.Server$Handler.run(Server.java:953)
> 
>     at org.apache.hadoop.ipc.Client.call(Client.java:740)   at
> org.apache.hadoop.ipc.RPC$Invoker.invoke(RPC.java:220)  at
> $Proxy0.addBlock(Unknown Source)    at
> sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)     at
> sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
>     at
> sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
>     at java.lang.reflect.Method.invoke(Method.java:597)     at
> org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:82)
>     at
> org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:59)
>     at $Proxy0.addBlock(Unknown Source)     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.locateFollowingBlock(DFSClient.java:2937)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.nextBlockOutputStream(DFSClient.java:2819)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream.access$2000(DFSClient.java:2102)
>     at
> org.apache.hadoop.hdfs.DFSClient$DFSOutputStream$DataStreamer.run(DFSClient.java:2288)

另外当我执行时：

bin/stop-all.sh

它表示 datanode 尚未启动，因此无法停止。虽然，输出jps说数据节点存在。

I tried 格式化名称节点, 更改所有者权限，但似乎不起作用。希望我没有错过任何其他相关信息。

提前致谢。

对我有用的解决方案是逐一运行名称节点和数据节点，而不是一起使用bin/start-all.sh。使用这种方法会发生的情况是，如果您在网络上设置数据节点时遇到一些问题，并且 stackoverflow 上的许多帖子表明 namenode 需要一些时间来启动，则错误是清晰可见的，因此，应该给它一些时间在启动数据节点之前启动。另外，在这种情况下，我遇到了名称节点和数据节点不同ID的问题，为此我必须更改与名称节点具有相同ID的数据节点的ID。

分步程序将是：

启动名称节点bin/hadoop namenode。检查是否有错误（如果有）。
启动数据节点bin/hadoop datanode。检查是否有错误（如果有）。
现在使用“bin/start-mapred.sh”启动任务跟踪器、作业跟踪器

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

replication

Hadoop 中的数据复制错误的相关文章

Amazon MapReduce 日志分析最佳实践

我正在解析 Apache Nginx Darwin 视频流服务器生成的访问日志并按日期引用者用户代理聚合每个交付文件的统计信息每小时都会生成大量日志而且这个数字在不久的将来可能会急剧增加因此通过 Amazon Elastic
使用 python 从 HDFS 获取文件名列表

这里是 Hadoop 菜鸟我搜索了一些有关 hadoop 和 python 入门的教程但没有取得太大成功我还不需要使用映射器和缩减器进行任何工作但这更多是一个访问问题作为Hadoop集群的一部分 HDFS 上有一堆 dat 文件
Cat 文件与 HDFS 中的模式不匹配？

我正在尝试 cat 与 hadoop HDFS 中的以下模式不匹配的文件 hdfs dfs cat gz 如何捕获所有不以 gz 结尾的文件编辑抱歉但我需要在 Hadoop 中管理文件显然 hdfs 附带的命令非常少编辑2 所有文
Hive（查找连续 n 列中的最小值）

我在 Hive 中有一个表有 5 列即电子邮件 a first date b first date c first date d first date a b c d 是用户可以执行的 4 个不同操作上表中的 4 列表示用户执行第一个
从只读 couchdb 复制

我有一台服务器其中包含一个 couchdb 数据库其中包含我的应用程序所需的信息它包含几兆字节的内容一些每天都会变化的文档添加最新新闻删除旧文档更新一些文档应用程序会尽可能与服务器数据库同步以便离线使用此信息然而这些信
将 hadoop fs 路径转换为 EMR 上的 hdfs:// 路径

我想知道如何将数据从 EMR 集群的 HDFS 文件系统移动到 S3 存储桶我认识到我可以直接在 Spark 中写入 S3 但原则上之后执行它也应该很简单到目前为止我还没有发现在实践中这是正确的 AWS 文档建议s3 dist cp
将多个前缀行过滤器设置为扫描仪 hbase java

我想创建一台扫描仪它可以为我提供带有 2 个前缀过滤器的结果例如我想要其键以字符串 x 开头或以字符串 y 开头的所有行目前我知道只能使用一个前缀方法如下 scan setRowPrefixFilter prefixFiltet 在
Hive 中字符串数据类型是否有最大大小？

谷歌了很多但没有在任何地方找到它或者这是否意味着只要允许集群 Hive 就可以支持任意大字符串数据类型如果是这样我在哪里可以找到我的集群可以支持的最大字符串数据类型大小提前致谢 Hive 列表的当前文档STRING作为有效的数据类
Spark MLLib 存在问题，导致概率和预测对于所有内容都相同

我正在学习如何将机器学习与 Spark MLLib 结合使用目的是对推文进行情感分析我从这里得到了一个情感分析数据集 http thinknook com wp content uploads 2012 09 Sentiment Ana
Hive查询快速查找表大小（行数）

是否有 Hive 查询可以快速查找表大小即行数而无需启动耗时的 MapReduce 作业这就是为什么我想避免COUNT I tried DESCRIBE EXTENDED 但这产生了numRows 0这显然是不正确的对新手问题表示歉
在 Hadoop 中处理带标头的文件

我想在 Hadoop 中处理很多文件每个文件都有一些头信息后面跟着很多记录每个记录都存储在固定数量的字节中对此有何建议我认为最好的解决方案是编写一个自定义的InputFormat http hadoop apache org co
异常：java.lang.Exception：使用 master 'yarn' 运行时，必须在环境中设置 HADOOP_CONF_DIR 或 YARN_CONF_DIR。在火花中

我是新的阿帕奇火花我已经在spark独立模式下测试了一些应用程序但我想运行应用程序yarn模式我正在windows中运行apache spark 2 1 0 这是我的代码 c spark gt spark submit2 master
获取 emr-ddb-hadoop.jar 将 DynamoDB 与 EMR Spark 连接

我有一个 DynamoDB 表需要将其连接到 EMR Spark SQL 才能对该表运行查询我获得了带有发行标签 emr 4 6 0 和 Spark 1 6 1 的 EMR Spark Cluster 我指的是文档使用 Spark 分
如何将Hive数据表迁移到MySql？

我想知道如何将日期从 Hive 转移到 MySQL 我看过有关如何将 Hive 数据移动到 Amazon DynamoDB 的示例但没有看到有关如何将 Hive 数据移动到 MySQL 等 RDBMS 的示例这是我在 DynamoDB
如何在 Hadoop 中将 String 对象转换为 IntWritable 对象

我想转换String反对IntWritableHadoop 中的对象任何过程都可以进行转换 IntWritable value new IntWritable Integer parseInt someString 并处理以下可能性par
遍历 ArrayWritable - NoSuchMethodException

我刚刚开始使用 MapReduce 并且遇到了一个奇怪的错误我无法通过 Google 回答该错误我正在使用 ArrayWritable 制作一个基本程序但是当我运行它时在Reduce过程中出现以下错误 java lang Runti
hive 从两个数组创建映射或键/值对

我有两个具有相同数量值的数组它们映射为 1 1 我需要从这两个数组创建一个键值对或映射键值任何想法或提示都会有帮助当前表结构 USA WEST NUMBER Street City 135 Pacific Irvine USA
带有安全 Kafka 抛出的 Spark 结构化流：无权访问组异常

为了在我的项目中使用结构化流我正在 hortonworks 2 6 3 环境上测试 Spark 2 2 0 和 Kafka 0 10 1 与 Kerberos 的集成我正在运行下面的示例代码来检查集成我能够在 Spark 本地模式下的
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output

随机推荐

React 动态设置状态属性

我正在使用 React 并且有一些方法可以单独设置组件的状态我有以下方法 setLineColor value this setState stroke value gt this props data this getStyleData
如何在 Xcode 4 上创建新的“模板”类别并在那里使用我自己的文件模板？

我想开始为 iOS 应用程序使用我自己的模板我不想要任何重大的改变但更简单的事情比如添加删除一些样板代码添加一些pragma mark部分对每个文件硬编码我公司的名称和一些注释改变缩进等等等等等等我们的想法是我们将在创
在 Java 中列出文件（按修改日期排序）的最佳方法？

我想获取目录中的文件列表但我想对其进行排序以使最旧的文件排在第一位我的解决方案是调用 File listFiles 并根据 File lastModified 重新使用列表但我想知道是否有更好的方法编辑按照建议我当前的解决方案
组织毡尖笔：使用 JS 通过相邻项目的相似性优化 2D 网格中项目的排列 [更新]

UPD 该问题已更新具体细节和代码请参见下文警告这个问题是关于优化矩阵中项目的排列这不是比较颜色最初我决定提供有关我的问题的背景会有帮助我现在对这个决定感到后悔因为结果恰恰相反关于颜色的无关紧要的讨论太多而几乎没有关于实
TS2538 类型“未定义”不能用作索引类型。当检查分配给变量时

我收到 TS 错误 TypeScript 错误类型未定义不能用作索引类型 TS2538 对于这个简单的函数根据提供的索引从数组获取对象 const myArr Array name John name Tom function ge
如何忽略asp.net表单中的url路由

我正在使用 NET 3 5 SP1 框架并且在我的应用程序中实现了 URL 路由我收到 JavaScript 错误 Error ASP NET Ajax client side framework failed to load Reso
如何改变GtkTextView的背景颜色？

如何改变GtkTextView的背景颜色我尝试使用普通的小部件设置 bg 功能但 gtk 只是更改 GtkText 视图的边框颜色另外有人可以用简单的例子向我解释一下如何更改 GtkTextView 中的文本颜色字体文本大小 G
在 SQL Server 2008 R2 中获取时区

如何获取 Microsoft SQL Server 2008R2 中的时区列表在 SQL Server 2008 中使用时区数据 http blogs msdn com b sqlprogrammability archive 2008
UDP 服务器出现分段错误

我使用 UDP 编写了以下回显服务器但我不知道为什么它在 sendto 函数中给我分段错误它接收良好但在将数据发送回客户端时出现问题我已经尝试找到问题几个小时了但一无所获有人可以指出错误或我可能做错了什么吗谢谢 include
Angularjs 使用自定义插值符号作为范围

我目前有一个 underscore js 模板我也想将其与 Angular 一起使用并且仍然可以与 underscore 一起使用我想知道是否可以使用指令更改特定范围的插值开始和结束符号如下所示 angular directive
Android 中用于接听电话的滑块按钮

我想为来电开发自己的接受和拒绝按钮为了防止从口袋里拿出手机时意外接听或拒绝来电我想制作一个滑块式按钮或类似的东西我是接听电话不仅仅是点击接听按钮这更像是从左向右或相反滑动手指让按钮随着时间变宽就像安卓一样有什
自定义 ASP.NET Identity 2.0 UserStore - 是否需要实现所有接口？

我创建了一个自定义IUserStore
h2o 模型不适合驱动程序节点的内存错误

我通过 H2O 中的 R 代码运行 GBM 模型并得到以下错误相同的代码在几周内运行良好想知道这是 H2O 方面的错误还是用户系统上的配置 water exceptions H2OModelBuilderIllegalArgument
将MySQL数据库置于版本控制之下？

我目前在我的 PHP 项目中使用 SVN 我想我也应该将我的数据库置于版本控制之下但是最好的方法是什么我是否只需在 SVN 中的项目中创建一个 db 文件夹将 SQL 更改粘贴到名为 from 1 0 to 2 0 sql 的文件中并
使用 jQuery 实际设置选项元素上的选定属性

我正在使用 jQuery 中的选项元素生成一个选择列表简化后看起来像这样 var sel
std::shuffle 的使用和实用性？

如果你查看 C 11 中随机洗牌的规范就会发现有 3 个函数我的问题是的典型用途和优点是什么 template lt class RandomIt class URNG gt void shuffle RandomIt first R
#if 0 ..... #endif 块到底有什么作用？

In C C 放置在 if 0 endif block if 0 Code goes here endif 代码是否只是被跳过并因此不被执行它不仅没有被执行甚至没有被编译 if是一个预处理器命令在实际编译步骤之前对其进行评估该块内的
如何在 Android 中读取 Chrome 历史记录

只看历史可以吗通过使用以下代码我可以获得历史记录和书签但我只想阅读历史记录 String proj new String Browser BookmarkColumns TITLE Browser BookmarkColumns UR
Ruby 轻松搜索哈希数组中的键值对

假设我有这个哈希数组 href gt https company campfirenow com name gt Company id gt 123456789 product gt campfire href gt https basec
Hadoop 中的数据复制错误

我正在我的机器上实现 Hadoop 单节点集群方法如下迈克尔诺尔的教程 http www michael noll com wiki Running Hadoop On Ubuntu Linux 28Single Node Cluste

Hadoop 中的数据复制错误

Hadoop 中的数据复制错误 的相关文章

随机推荐

热门标签

Hadoop 中的数据复制错误的相关文章