FSDataInputStream中的seek()方法

2023-11-04

FSDataInputStream实现了Seekable接口

实现方法：

其中的seek(long pos)方法可以 ,对任意位置进行重新定位，与java.io.inputstream中的skip()不同。

举个例子对，hdfs中的一个文件进行两次输出：

文件中内容如下：

在Eclipse中创建一个类对数据进行读取：

package test01;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

public class test01 {
	public static void main(String[] args) throws Exception {
		Configuration conf=new Configuration();
		URI uri=new URI("hdfs://192.168.137.133:8020");
		FileSystem fs=FileSystem.get(uri, conf);
		FSDataInputStream in= fs.open(new Path("/a.txt"));
		System.out.println("1.当前所在位置："+in.getPos());
		System.out.println("2.输出内容：");
		IOUtils.copyBytes(in, System.out, in.available());
		System.out.println("3.此时所在位置："+in.getPos());
		System.out.println("...........................................");
		System.out.print("4.重新定位：");
		System.out.println("...........................................");
		in.seek(0);
		System.out.println("获取当前位置："+in.getPos());
		System.out.println("第二次内容输出：");
		IOUtils.copyBytes(in, System.out, in.available());
		System.out.println("获取当前位置："+in.getPos());//获取当前位置
		System.out.println("完成！");
		in.close();
		fs.close();
	}
}

控制台输出结果：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

DFDataInputStream

Seekable接口

FSDataInputStream中的seek()方法的相关文章

删除 Pig 输出中的括号和逗号

目前我的输出如下 130 1 131 1 132 1 133 1 137 1 138 2 139 1 140 1 142 2 143 1 我想要这样 130 1 131 1 132 1 我的代码如下 A LOAD user links sm
如何在linux中的hdfs超级组中添加用户？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在研究 hdfs 然后我发现某些内容没有为超级用户执行权限检查如果我的 linux 用户是 sandy 并且我想将 sandy 添加
Kafka Streams 在 HDFS 上查找数据

我正在使用 Kafka Streams v0 10 0 1 编写一个应用程序并希望通过查找数据来丰富我正在处理的记录该数据带时间戳的文件每天或每天 2 3 次写入 HDFS 目录我怎样才能将其加载到Kafka Streams应
HDFS 在大量小文件和 128 Mb 块大小上的行为

我有很多多达数十万个小文件每个文件 10 100 Kb 我的 HDFS 块大小等于 128 MB 我的复制因子等于 1 为每个小文件分配 HDFS 块有什么缺点吗我见过相当矛盾的答案答案说最小的文件占用整个块 https stac
在hbase中创建表

我是 hbase 和 hadoop 的新手无论如何我已经成功建立了一个由3台机器组成的hadoop集群现在我需要一些帮助来建立数据库我有一个表评论包含字段 user id comments 对评论的评论可以多个和状态字段相同
是否可以直接从文件加载镶木地板表？

如果我有一个二进制数据文件可以转换为 csv 格式有什么方法可以直接从中加载镶木地板表吗许多教程显示将 csv 文件加载到文本表然后从文本表加载到镶木地板表从效率的角度来看是否可以像我已有的那样直接从二进制文件加载镶木地板表理
使用 python 从 HDFS 获取文件名列表

这里是 Hadoop 菜鸟我搜索了一些有关 hadoop 和 python 入门的教程但没有取得太大成功我还不需要使用映射器和缩减器进行任何工作但这更多是一个访问问题作为Hadoop集群的一部分 HDFS 上有一堆 dat 文件
如何使用新的 Hadoop API 来使用 MultipleTextOutputFormat？

我想编写多个输出文件如何使用 Job 而不是 JobConf 来执行此操作创建基于密钥的输出文件名的简单方法 input data type key value cupertino apple sunnyvale banana cupe
Hive（查找连续 n 列中的最小值）

我在 Hive 中有一个表有 5 列即电子邮件 a first date b first date c first date d first date a b c d 是用户可以执行的 4 个不同操作上表中的 4 列表示用户执行第一个
将 hadoop fs 路径转换为 EMR 上的 hdfs:// 路径

我想知道如何将数据从 EMR 集群的 HDFS 文件系统移动到 S3 存储桶我认识到我可以直接在 Spark 中写入 S3 但原则上之后执行它也应该很简单到目前为止我还没有发现在实践中这是正确的 AWS 文档建议s3 dist cp
Spark超时可能是由于HDFS中文件超过100万个的binary Files()

我正在通过以下方式读取数百万个 xml 文件 val xmls sc binaryFiles xmlDir 该操作在本地运行良好但在纱线上失败并显示 client token N A diagnostics Application app
为什么组合器输入记录的数量比映射的输出数量多？

Combiner 在 Mapper 之后 Reducer 之前运行它将接收给定节点上的 Mapper 实例发出的所有数据作为输入然后它将输出发送到Reducers 因此组合器输入的记录应小于映射输出的记录 12 08 29 13 38
使用 Hadoop 映射两个数据集

假设我有两个键值数据集数据集A和B 我们称它们为数据集A和B 我想用 B 组的数据更新 A 组中的所有数据其中两者在键上匹配因为我要处理如此大量的数据所以我使用 Hadoop 进行 MapReduce 我担心的是为了在 A 和 B
如果 HBase 不是运行在分布式环境中，它还有意义吗？

我正在构建数据索引这将需要以形式存储大量三元组 document term weight 我将存储多达几百万个这样的行目前我正在 MySQL 中将其作为一个简单的表来执行我将文档和术语标识符存储为字符串值而不是其他表的外键我正在重
异常：java.lang.Exception：使用 master 'yarn' 运行时，必须在环境中设置 HADOOP_CONF_DIR 或 YARN_CONF_DIR。在火花中

我是新的阿帕奇火花我已经在spark独立模式下测试了一些应用程序但我想运行应用程序yarn模式我正在windows中运行apache spark 2 1 0 这是我的代码 c spark gt spark submit2 master
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
获取行 HBase 的特定列族中的列

我正在编写一个应用程序通过 JSP 显示 HBase 中特定表中的数据我想获取一行的特定列族中的所有列有什么办法可以做到这一点吗 public String getColumnsInColumnFamily Result r Stri
hadoop中reducer的数量

我正在学习hadoop 我发现减速器的数量非常令人困惑 1 reducer的数量与partition的数量相同 2 reducer 的数量是 0 95 或 1 75 乘以节点数每个节点的最大容器数 3 减速机数量设定为mapred re
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
如何使用 Amazon 的 EMR 在 CLI 中使用自定义 jar 指定 mapred 配置和 java 选项？

我想知道如何指定mapreduce配置例如mapred task timeout mapred min split size等等当使用自定义 jar 运行流作业时当我们使用 ruby 或 python 等外部脚本语言运行时我们可以使

随机推荐

TCP与UDP

前言 TCP和UDP是两个传输层最有代表性的传输层协议 TCP一般提供可靠的信息传输而UDP常被用于广播和细节控制交给应用的通信传输传输层的定义在传输层 IP首部有一个协议字段用来区分使用的是什么协议用端口号进行处理的具体程序在
在Vitis IDE中使用第三方库 libtiff 保存 tiff 文件

目的和思路一个Vitis IDE 裸机项目需要将视频帧无损地保存下来由于每帧的像素数据是 16bit 1通道的 bayer 格式满足这一需求的图像格式似乎只有 tiff 格式开源的tiff 库是 libtiff 而在 Vitis
nginx安装及部署

下载官方网站 https nginx org en download html Windows下安装安装下载后解压切记不能含有中文路径文件结构如图我解压的路径就有中文记得拷贝放置于英文目录下即可启动两种方法 1 直接双击该
C语言（函数与预处理、指针）

一函数与预处理一一维数组 1 一维数组的定义格式为类型说明符数组名常量表达式例如 int a 10 它表示定义了一个整形数组数组名为a 有10个元素 2 在定义数组时需要指定数组中元素的个数方括弧中的常量表达式用来表示元
基于 FFmpeg 的跨平台视频播放器简明教程（七）：使用多线程解码视频和音频

系列文章目录基于 FFmpeg 的跨平台视频播放器简明教程一 FFMPEG Conan 环境集成基于 FFmpeg 的跨平台视频播放器简明教程二基础知识和解封装 demux 基于 FFmpeg 的跨平台视频播放器简明教程三视频
69. Sqrt(x)

Implement int sqrt int x Compute and return the square root of x where x is guaranteed to be a non negative integer Sinc
新闻分析：解密代号A1S

本周二SAP董事长特拉普纳 Hasso Plattner 在Software 2007会议上发言时阐述了SAP新的软件设计方法 SAP表示在过去的三年中有3000多名工程师都在运用这种新的软件设计方法在开发代号为A1S的新产品虽然这一代号
HTML的input类型为hidden导致无法reset改字段的value问题

问题关键根据HTML规范 hidden是非ui类元素不接受用户处理所以form的 reset并不影响它 http stackoverflow com questions 6367793 why does the reset butto
一种通用的业务监控触发方案设计

一背景业务监控是指通过技术手段监控业务代码执行的最终结果或者状态是否符合预期实现业务监控主要分成两步一在业务系统中选择节点发送消息触发业务监控二系统在接收到mq消息或者定时任务调度时根据消息中或者任务中的业务数据查询业务执行
go-micro 在linux下安装出现service auth not found

1 安装micro linux下执行该命令 wget q https raw githubusercontent com micro micro master scripts install sh O bin bash 2 micro se
vue 实现md5、base64加密

背景前端使用密码登录的时候一般都会使用密文传输否则控制台就能看到密码具体实现如下使用 md5 进行加密 1 安装 cnpm install save js md5 2 在 main js 全局引用 import md5 from
pycharm console 报错

描述 pycharm的console本来用的好好地但是我也不知道自己改了啥结果报错了报错 Error Console process terminated with error Traceback most recent call l
Inheritance___CH_17

17 1 Introduction to inheritance A hierarchy is a diagram that shows how various objects are related Most hierarchies ei
华为交换机配置链路聚合

文章目录 1 拓扑图 2 任务描述 3 Sw1配置 4 Sw2配置 5 Lacp模式链路聚合演示 https blog csdn net qq 45042462 article details 120938052 1 拓扑图 2 任务描述
正则表达式校验版本号

需求校验版本号规则 X Y Z 1 99 0 99 0 99 要求 1 必须是三位例如 x x x的形式 2 每位x的范围分别为1 99 0 99 0 99 3 不允许的情况 0 x x 01 x x x 0x x x 00 x x
Python根据Excel名单实现文件夹下文件批量改名

班级收集截图通过缓存快速获取图片可是文件夹内的文件是乱码所以采用Python进行批量改名操作 import os import xlrd count 1 path C Users White Desktop 18 文件所在文件夹 ex
排查Linux服务器是否被入侵步骤

作为一个Linux运维工程师能够清晰地鉴别异常机器是否已经被入侵了显得至关重要以下是结合centos7 9操作系统进行排查Linux操作系统是否被入侵其他Linux发行版的操作类似 1 入侵者可能会删除机器的日志信息可以查看日志信息
No projects are found to import 问题如何解决

在myeclipse中导入项目遇到 No projects are found to import 导致原因项目目录中没有 project或者 classpath 解决方案 1 project classpath直接拷贝到相应位置即可 2
大数据——Java 知识点整理

1 JDK 和 JRE 有什么区别 JDK Java Development Kit 的简称 java开发工具包提供了java的开发环境和运行环境 JRE Java Runtime Environment 的简称 java运行环境为ja
FSDataInputStream中的seek()方法

FSDataInputStream实现了Seekable接口实现方法其中的seek long pos 方法可以对任意位置进行重新定位与java io inputstream中的skip 不同举个例子对 hdfs中的一个文件进行两次

FSDataInputStream中的seek()方法

FSDataInputStream中的seek()方法 的相关文章

随机推荐

热门标签

FSDataInputStream中的seek()方法的相关文章