清除 HDFS 后，某些数据节点仍然显示已使用的块池

2024-01-04

Hadoop版本：2.7.3 数据节点：32 区块大小：512m 复制：3

我使用命令清除了HDFS中的所有数据hdfs dfs -rm -r /*

清除HDFS集群后，少数数据节点仍然显示Block pool used，尽管块数为零。

The screen shot of hdfs webui

的输出hdfs fsck /如下

Connecting to namenode via http://ip-10-0-2-7:50070/fsck?ugi=ubuntu&path=%2F
FSCK started by ubuntu (auth:SIMPLE) from /10.0.2.7 for path / at Tue Jul 18 04:34:19 UTC 2017
Status: HEALTHY
 Total size:    0 B
 Total dirs:    1
 Total files:   0
 Total symlinks:        0
 Total blocks (validated):  0
 Minimally replicated blocks:   0
 Over-replicated blocks:    0
 Under-replicated blocks:   0
 Mis-replicated blocks:     0
 Default replication factor:    3
 Average block replication: 0.0
 Corrupt blocks:        0
 Missing replicas:      0
 Number of data-nodes:      32
 Number of racks:       1
FSCK ended at Tue Jul 18 04:34:19 UTC 2017 in 1 milliseconds
The filesystem under path '/' is HEALTHY

我知道块删除是异步过程，但是具有Block Pool Used不设置为0，需要花费很多时间来释放块。任何人都可以帮我弄清楚为什么在这些服务器上，块删除很慢，或者由于使用块而导致的任何其他问题。

造成这种情况的潜在原因有几个：

最近对集群软件进行了升级，使用HDFS滚动升级 http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsRollingUpgrade.html功能，且升级尚未最终确定。在滚动升级期间，文件删除实际上不会删除 DataNode 上的底层块文件。相反，块文件会被维护，这样如果操作员选择回滚升级，集群的数据可以恢复到升级前的状态。因此，在滚动升级窗口期间，DataNode 指标（例如“已使用的块池”）继续显示消耗的空间。检查滚动升级是否正在进行的一个简单方法是访问 NameNode Web UI。概述选项卡将显示一条有关“滚动升级已开始”的消息。要完成升级，请运行hdfs dfsadmin -rollingUpgrade。之后，DataNode 将开始（异步）删除块文件。
集群的用户使用了HDFS 快照 http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsSnapshots.html。快照维护创建快照时文件系统路径的状态。为了支持这一点，DataNode 可能需要为以前删除的文件保留块，以防用户选择读取包含数据的旧快照。跑步hdfs fsck与-includeSnapshots参数可以显示是否有正在使用的快照。
由于某种 I/O 错误（磁盘故障、底层块文件权限冲突），DataNode 无法删除块文件。这不太可能，但如果出现问题，DataNode 日志将显示更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

HDFS

hadoop273

清除 HDFS 后，某些数据节点仍然显示已使用的块池的相关文章

Hive - 通过聚合跨组的值来创建映射列类型

我有一个看起来像这样的表 customer category room date 1 A aa d1 1 A bb d2 1 B cc d3 1 C aa d1 1 C bb d2 2 A aa d3 2 A bb d4 2 C bb d4
Spark 2.0 弃用了“DirectParquetOutputCommitter”，没有它如何生活？

最近我们从 HDFS 上的 EMR gt S3 上的 EMR 启用了一致视图的 EMRFS 迁移我们意识到 Spark SaveAsTable 镶木地板格式写入 S3 的速度比 HDFS 慢约 4 倍但我们发现使用 DirectPa
java.lang.IllegalArgumentException：错误的 FS：，预期：hdfs://localhost:9000

我正在尝试实现reduce side join 并使用mapfile reader来查找分布式缓存但在stderr中检查时它没有查找值它显示以下错误 lookupfile文件已经存在于hdfs中并且似乎已正确加载进入缓存如标准输出中
使用 python 从 HDFS 获取文件名列表

这里是 Hadoop 菜鸟我搜索了一些有关 hadoop 和 python 入门的教程但没有取得太大成功我还不需要使用映射器和缩减器进行任何工作但这更多是一个访问问题作为Hadoop集群的一部分 HDFS 上有一堆 dat 文件
将 hadoop fs 路径转换为 EMR 上的 hdfs:// 路径

我想知道如何将数据从 EMR 集群的 HDFS 文件系统移动到 S3 存储桶我认识到我可以直接在 Spark 中写入 S3 但原则上之后执行它也应该很简单到目前为止我还没有发现在实践中这是正确的 AWS 文档建议s3 dist cp
HDP 3.1.0.0-78 升级后无法使用 ResourceManager UI 终止 YARN 应用程序

我最近将 HDP 从 2 6 5 升级到 3 1 0 它运行 YARN 3 1 0 并且我无法再使用旧的 8088 cluster apps 或新的 8088 从 YARN ResourceManager UI 终止应用程序 ui2 ind
连接到 Hive 时使用 Spark 进行 Kinit

我正在尝试从独立的 Spark 连接到 Hive hadoop 集群具有 kerberos 身份验证有人可以让我知道如何在 Spark 程序中执行 kinit 我可以连接到配置单元吗更新我的 Spark 与 Hadoop 位于不同的集
Hive ParseException - 无法识别“结束”“字符串”附近的输入

尝试从现有 DynamoDB 表创建 Hive 表时出现以下错误 NoViableAltException 88 at org apache hadoop hive ql parse HiveParser IdentifiersParser
Hive查询快速查找表大小（行数）

是否有 Hive 查询可以快速查找表大小即行数而无需启动耗时的 MapReduce 作业这就是为什么我想避免COUNT I tried DESCRIBE EXTENDED 但这产生了numRows 0这显然是不正确的对新手问题表示歉
使用 Hadoop 映射两个数据集

假设我有两个键值数据集数据集A和B 我们称它们为数据集A和B 我想用 B 组的数据更新 A 组中的所有数据其中两者在键上匹配因为我要处理如此大量的数据所以我使用 Hadoop 进行 MapReduce 我担心的是为了在 A 和 B
在 Hadoop 中处理带标头的文件

我想在 Hadoop 中处理很多文件每个文件都有一些头信息后面跟着很多记录每个记录都存储在固定数量的字节中对此有何建议我认为最好的解决方案是编写一个自定义的InputFormat http hadoop apache org co
是否值得购买 Mahout in Action 以跟上 Mahout 的速度，或者还有其他更好的来源吗？

我目前是一个非常随意的用户阿帕奇马胡特 http mahout apache org 我正在考虑购买这本书象夫在行动 http www manning com owen 不幸的是我很难理解这本书的价值并且认为它是一本曼宁早期访问计划 h
Oozie SSH 操作

Oozie SSH 操作问题 Issue 我们正在尝试在集群的特定主机上运行一些命令我们为此选择了 SSH Action 我们面对这个 SSH 问题已经有一段时间了这里真正的问题可能是什么请指出解决方案 logs AUTH FAILE
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
如何在 Hadoop 中将 String 对象转换为 IntWritable 对象

我想转换String反对IntWritableHadoop 中的对象任何过程都可以进行转换 IntWritable value new IntWritable Integer parseInt someString 并处理以下可能性par
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
猪参考

我正在学习 Hadoop Pig 并且我总是坚持引用元素请查找下面的示例 groupwordcount group chararray words bag of tokenTuples from line token chararray
Hive - 线程安全的自动递增序列号生成

我遇到一种情况需要将记录插入到特定的 Hive 表中其中一列需要是自动递增的序列号即在任何时间点都必须严格遵循 max value 1 规则记录从许多并行的 Hive 作业插入到这个特定的表中这些作业每天每周每月批量运行现在
使用Spring批处理从HDFS读取文件

我必须编写一个 Spring 批处理它将从 HDFS 读取文件并更新 MySQL DB 中的数据 HDFS 中的源文件包含一些 CSV 格式的报告数据有人能给我举一个从 HDFS 读取文件的例子吗 Thanks The FlatFile
将 CSV 转换为序列文件

我有一个 CSV 文件我想将其转换为 SequenceFile 我最终将使用它来创建 NamedVectors 以在聚类作业中使用我一直在使用 seqdirectory 命令尝试创建 SequenceFile 然后使用 nv 选项将该输

随机推荐

如何在网格框中随机填充颜色

如何在网格框中随机填充颜色而不是如图所示有序网格 http www freeimagehosting net uploads 4ed76557de jpg http www freeimagehosting net uploads 4e
如何打印单个 JPanel 的内容？

我有一个JPanel有两个带图片的标签我需要打印这些内容JPanel 请帮帮我我怎样才能只打印这个JPanel的内容因为我的上也有不同的组件JFrame但我只需要打印this JPanel Thanks 下面是打印任何 Swing 组
在打字稿中获取枚举键作为联合字符串的通用类型？

考虑以下打字稿枚举 enum MyEnum A B C 如果我想要另一种类型即该枚举键的联合字符串我可以执行以下操作 type MyEnumKeysAsStrings keyof typeof MyEnum A B C 这非常有用现在
在 iOS 8 - iOS 11 中从操作表委托以模态方式呈现视图控制器

所以我注意到在 iOS8 beta 3 中 Update 在 iPad 上的 iOS 11 2 中当尝试从委托方法中呈现视图控制器时仍然会发生这种情况UIActionSheet 什么也没发生并且日志消息输出到调试控制台表明在转换警报
Windows 7 计算机上的 WAMP Server 2 托盘图标中的菜单不可用

我已在 Windows 7 计算机上下载并安装了 WAMP Server 版本 2 1d 当我从开始菜单中选择启动 WAMP 服务器时会出现托盘图标但没有任何功能当我将鼠标悬停时工具提示告诉我 2 个服务中的 1 个已启动
CakePHP 中的 .ctp 文件有何用途？

我开始使用 CakePHP 并且正在阅读manual http book cakephp org view 57 Controller Methods 大约在页面的中间有这样的评论 Render the element in views
提交 HTML 表单后，servlet 操作出现在 URL 而不是 JSP 文件中

我创建了一个简单的登录页面如果用户输入正确的用户名和密码页面将被重定向到成功页面否则它将被重定向到索引页面在登录页面中我向 servlet 提供了表单提交操作一旦 servlet 验证输入它将分派到相应的 jsp 页面我的问
Mule 流程：如何从 XML 文件中删除 BOM 标记

我已经为 Mule 流程输入了复杂的大型 XML 文件文件结束点 gt 字节数组到字符串 gt 分割器 gt 我有org xml sax SAXParseException 序言中不允许有内容当我尝试使用 Splitter 组件处理输入文
如何拦截 WCF 错误并返回自定义响应？

考虑以下非常基本的 WCF 服务实现 public enum TransactionStatus Success 0 Error 1 public class TransactionResponse public TransactionSt
使用 MinGW 在 Windows 上构建 protobuf

我一直在按照彼得的回答中的步骤进行如何使用 MinGW 在 Windows 中构建 Google 的 protobuf https stackoverflow com questions 9243816 how to build googl
如果字符超出 Vue.js 中的限制，则仅显示名称的一部分

我试图在用户登录后显示一条消息如果字符数超过 8 个如何仅显示名称的前 8 个字符后跟例如蒙娜丽莎 new Vue el app data username AVERYLONGGGNAMMEEE 这是我的jsfiddle 演示 h
更改使用
嵌入的 SVG 的颜色
我在 StackOverflow 上只找到了一种解决方案但用户说这对他们不起作用所以我将 SVG 图像嵌入到 html 中我不明白在这种情况下如何改变悬停时的颜色在这个片段中https jsfiddle net annaolsh

App关闭时不触发AlarmManager

我有一些应用程序内通知要在特定时间向用户显示但应用程序关闭时不会显示任何内容设置闹钟 Intent alarmIntent new Intent mMotherActivity ReminderAlarmManager class if

xamarin ios 10 在我的应用程序中以编程方式打开应用程序商店应用程序

我正在尝试在我的应用程序中以编程方式打开应用程序商店应用程序我想做的是我正在调用一项服务来检查当前的应用程序版本如果需要更新我应该打开应用程序商店应用程序让用户更新我的应用程序注意该应用程序尚未发布到商店我仍处于编码阶段我

D3、SVG 和 Javascript：需要将唯一图像分配给动态创建的节点

我正在使用以下 Javascript SVG D3 代码 http bl ocks org 1095795 http bl ocks org 1095795 代码在这里 https gist github com 1095727 https

C 指针 - 指向同一地址

include

Paypal IPN，更改账户中的ipn url后未收到所有交易响应

我正在我的项目中实现 ipnlistner 我在我的 paypal 帐户中设置了 iPN url 但我没有收到对该 url 的所有交易 ipn 响应但是当我检查帐户中的 IPN 历史记录时它显示所有 IPN 均已发送例如昨天它显示所有

Laravel 路由冲突问题

我在 laravel 中有以下网址 1 需要更改自 localhost laravel page 2 to localhost laravel 2 我的 Route php 是 Route get page id array as gt p

std::erf 的精度是多少？

C 11 在标准中引入了非常有用的数学函数例如erf http en cppreference com w cpp numeric math erf and erfc http en cppreference com w cpp nume

清除 HDFS 后，某些数据节点仍然显示已使用的块池

Hadoop版本 2 7 3 数据节点 32 区块大小 512m 复制 3 我使用命令清除了HDFS中的所有数据 hdfs dfs rm r 清除HDFS集群后少数数据节点仍然显示Block pool used 尽管块数为零 The sc
热门标签

VNA

S参数

矩阵运算

app安全

吊打面试官专栏

MATLAB GUI

文档工程师

技术写作

数据库及MySql

作业题

作业

待修改

Qt Widgets

ctf

技术运维随笔

VTK入门

服务器小程序空间

编译错误

程序化内容生成

JSON

基础编程

C胎神游戏

多步预测
Powered by Hwhale

清除 HDFS 后，某些数据节点仍然显示已使用的块池

清除 HDFS 后，某些数据节点仍然显示已使用的块池 的相关文章

随机推荐

热门标签

清除 HDFS 后，某些数据节点仍然显示已使用的块池的相关文章