Hadoop URL读取数据

2023-05-16

URL.setURLStreamHandlerFactory(),每个虚拟机只能调用一次这个方法，因此通常在静态中调用这个方法！这个限制以为着如果程序其他的组件已经声明一个实例，则将无法使用这个方法读取。

1.在Eclipse中配置好相关环境

<!-- https://mvnrepository.com/artifact/junit/junit -->
<dependency>
    <groupId>junit</groupId>
    <artifactId>junit</artifactId>
    <version>4.12</version>
    <scope>test</scope>
</dependency>

<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common -->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-common</artifactId>
    <version>2.6.4</version>
</dependency>

<!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-hdfs -->
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-hdfs</artifactId>
    <version>2.6.4</version>
</dependency>

2.在hdfs中上传一个文件文件，随意输入几个数据进行测试

3 .在java项目中，利用URL进行数据的读取

import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;

import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
import org.apache.hadoop.io.IOUtils;

public class test02 {
	static {
		/*1.首先需要让java程序能够识别hadoop 的 hdfs URL 方案，
		 * 这里采用的是通过FsUrlStreamHandlerFactory实例,调用java.net.URL对象
		 * 的setURLStreamHandlerFactory
		 * */
		URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
	}
	public static void main(String[] args) throws MalformedURLException, IOException {
		InputStream in=null;
		try {
			//配置hdfs主机接口以及文件的路径
			in=new URL("hdfs://192.168.137.133:8020/a.txt").openStream();
			IOUtils.copyBytes(in, System.out, 4096, true);
		}finally {
			IOUtils.closeStream(in);
		}
	}
}

4.控制台的数据

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

URL

读取数据

Hadoop URL读取数据的相关文章

为什么 window.location 无法加载新页面？

这段代码以前可以工作但现在不行了 var url myurl id id phase phase window location url 使用 IE 开发工具栏我已经验证 url 具有有效的 url 并且 window location
将日期字符串转换为“MM/DD/YY”格式

我刚刚看到这个例子我该如何解决这个问题 Hive 元存储包含一个名为 Problem1 的数据库其中包含一个名为 customer 的表 customer 表包含 9000 万条客户记录 90 000 000 每条记录都有一个生日字段
为什么 Django 的 URLField 默认截断为 200 个字符？

我喜欢 Django 并且经常使用它我发现它的大部分默认设置都是正常的但有一个一直困扰着我以至于我在每个项目中都覆盖了它 a 的默认最大长度URLField https github com django django blob st
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
获取行 HBase 的特定列族中的列

我正在编写一个应用程序通过 JSP 显示 HBase 中特定表中的数据我想获取一行的特定列族中的所有列有什么办法可以做到这一点吗 public String getColumnsInColumnFamily Result r Stri
hadoop中reducer的数量

我正在学习hadoop 我发现减速器的数量非常令人困惑 1 reducer的数量与partition的数量相同 2 reducer 的数量是 0 95 或 1 75 乘以节点数每个节点的最大容器数 3 减速机数量设定为mapred re
带有安全 Kafka 抛出的 Spark 结构化流：无权访问组异常

为了在我的项目中使用结构化流我正在 hortonworks 2 6 3 环境上测试 Spark 2 2 0 和 Kafka 0 10 1 与 Kerberos 的集成我正在运行下面的示例代码来检查集成我能够在 Spark 本地模式下的
Hive“添加分区”并发

我们有一个外部 Hive 表用于处理原始日志文件数据这些文件每小时一次并按日期和源主机名分区目前我们正在使用简单的 python 脚本导入文件这些脚本每小时触发几次该脚本根据需要在 HDFS 上创建子文件夹从临时本地存储复制
如何将SQL数据加载到Hortonworks中？

我已在我的电脑中安装了 Hortonworks SandBox 还尝试使用 CSV 文件并以表结构的方式获取它这是可以的 Hive Hadoop nw 我想将当前的 SQL 数据库迁移到沙箱 MS SQL 2008 r2 中我将如何做
适用于 Hadoop 的 DynamoDB 输入格式

我必须使用 Hadoop mapreduce 处理保留在 Amazon Dynamodb 中的一些数据我在互联网上搜索 Dynamo DB 的 Hadoop InputFormat 但找不到它我对 Dynamo DB 不熟悉所以我猜测
将本地文件 URL 转换为文件路径

我有一个指向本地文件的 URL file home pi Desktop music Radio 20Song mp3 我需要以某种方式将其转换为传统的文件路径例如os模块采用 home pi Desktop music Radio So
如何创建 HIVE 表来读取分号分隔值

我想创建一个 HIVE 表该表将以分号分隔的值读取但我的代码不断给出错误有没有人有什么建议 CREATE TABLE test details Time STRING Vital STRING sID STRING PARTITION
HDFS：使用 Java / Scala API 移动多个文件

我需要使用 Java Scala 程序移动 HDFS 中对应于给定正则表达式的多个文件例如我必须移动所有名称为 xml从文件夹a到文件夹b 使用 shell 命令我可以使用以下命令 bin hdfs dfs mv a xml b 我可以
Windows 上的 Apache Pig 在运行“pig -x local”时出现“hadoop-config.cmd”未被识别为内部或外部命令”错误

如果您由于以下错误而无法在 Windows 上运行 Apache Pig hadoop 2 4 0 bin hadoop config cmd is not recognized as an internal or external com
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
使用 urllib2 从 FlightRadar24 获取数据时出现问题

我正在尝试使用下面的脚本从 FlightRadar24 获取数据基于这个答案 https stackoverflow com a 526695 3904031来处理cookies 当我当前在浏览器中输入该 url 时我会得到一个不错的长
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
如何跟踪hadoop中哪个数据块在哪个数据节点？

如果复制一个数据块会复制到哪个数据节点是否有任何工具可以显示复制块存在的位置如果您知道文件名则可以通过 DFS 浏览器查找转到您的 namenode Web 界面说浏览文件系统并导航到您感兴趣的文件在页面底部将列出文件中
2n + 1 法定人数是什么意思？

我在描述 HBase 的 Zookeeper 配置时遇到过这个问题但我对这个术语并不熟悉 N 与我的 HBase 集群中的节点数量有关系吗或者我应该在 Zookeeper 集群中使用的节点数量 2f 1是指你所需要的可靠性可用性水平

随机推荐

【HDFS API编程】图解客户端写文件到HDFS的流程

HDFS API编程图解客户端写文件到HDFS的流程 posted on 2019 04 25 20 04 Liuyt 61 阅读评论编辑收藏转载于 https www cnblogs com Liuyt 61 p 1077062
Linux——常用命令汇总（man,date,cal,bc,重定向,cmp,Diff）

man命令 xff08 查阅联机帮助文档 xff09 例如 man 1 sleep man 3 sleep date命令 xff08 读取系统日期和时间 xff09 cal命令 xff08 打印日历 xff09 bc命令 xff08 计算器
ubuntu 开机启动顺序配置（包括选择ubuntu内核）

sudo gedit etc default grub 编辑grub配置文件 GRUB DEFAULT改为0 为默认以第一个启动若想选择ubuntu内核可以通过 GRUB DEFAULT 61 34 1 gt 2 34 选择第二个内核
C++出现“field has incomplete type“问题的解决

出现错误的原因一般类似下面这种代码 xff1a span class token keyword struct span span class token class name Data span span class token punc
java 容器都有哪些？

容器可以说是Java Core中比较重要的一部分了数组 String java util下的集合容器 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61
树莓派3B+ 镜像烧录以及环境设置

写在前面的话 xff1a 没啥好说的相关软件下载 xff1a xff08 SD卡格式化工具 win32diskimager Raspbian系统镜像 Xshell ssh工具 xff09 xff09 链接 xff1a https pan
串口调试助手

一前言串口操作流程 xff1a 步骤一 xff1a 设置串口参数 xff0c 如 xff1a 波特率 xff0c 数据位 xff0c 奇偶校验 xff0c 停止位 xff0c 数据流控制等步骤二 xff1a 选择串口 xff0c 如w
【５１单片机】INT０及INT１中断计数

前言刚刚本着负责任的心 xff0c 把上次的博客补全 xff08 真的有点长 xff0c 不过都是干货 xff09 xff0c 再回来的时候本次编辑就消失了 xff0c 下次记得保存线上草稿友情链接 xff1a xff11 51单片机实
How To Install and Configure VNC Server on Ubuntu 20.04

From https tecadmin net install vnc server on ubuntu 20 04 text 61 1 20How 20To 20Install 20and 20Configure 20VNC 20Serv
putty+Xming在客户端显示服务器的图形程序界面

Xming是一个在 Microsoft Windows 操作系统上运行 X Window System 的自由软件下载地址 xff1a https sourceforge net projects xming Putty的使用方法之前总结
C++中的头文件(.h)和源文件(.cpp)都应该写什么？

头文件 h xff1a 写定义和声明写类的声明 xff08 包括类里面的成员和方法的声明 xff09 函数原型 define常数等 xff0c 但是一般来说不写具体的实现注意 xff1a 1 在写头文件的时候需要注意 xff0c 在开头
heroku命令整理

access 管理用户对应用的访问 addons 用于开发 xff0c 扩展和操作您的应用程序的工具和服务 apps 管理应用 auth heroku 认证 authorizations OAuth 认证 buildpacks 管理应用程序
解决com.google.code.kaptcha 从maven中央仓库无法下载的解决方案

1 首先下载源码包 xff1a http code google com p kaptcha downloads list 2 将解压后的文件中kaptcha version jar kaptcha 3 2 2 jar copy出来放到其他
ubuntu16.04创建普通用户、ssh连接

0 环境 ubuntu16 04 mobaXterm 1 创建用户创建用户 xff0c 只需要一个命令就可以了 xff1a adduser your username 例子 xff1a adduser yumo passwd your u
【数据清洗】图像数据清洗之---去除相似度高的图像

目的 xff1a 人工做数据清洗较为麻烦 xff0c 而且费事费力没成绩 xff0c 还拉拽整个项目的后腿所以这里根据调研情况 xff0c 分析尝试一下 1 调研分析 1 百度EasyData 参考 xff1a 百度大脑自己的csdn说明
pip 命令，向指定的python环境中安装包

在linux中 xff0c 进入anaconda的虚拟环境之后 xff0c 使用pip并不一定会安装在当前环境下 xff08 和windows不太一样 xff09 xff0c 而是安装在该pip对应的python版本里 xff0c pip对
快速区分主键与外键

主键与外键的区分主键用来唯一标识一条记录 xff0c 不允许有重复 xff0c 不允许为空作用 xff1a 用来保证数据的完整性个数 xff1a only one 外键 xff0c 表的外键是另一个表的主键 xff0c 外键可以有重复
module.exports和exports、export和export default、require和import的详解

一分类 commonJS xff1a 导出 xff08 module exports和exports xff09 导入 xff08 require xff09 ES6 xff1a 导出 xff08 export和export defaul
如何查看静态编译的依赖(所链接的库)

如何查看静态编译的依赖实际上静态库不存在依赖依赖是动态编译下被动态链接的库可以使用ldd查看静态链接的话所有需要的静态库会被添加到文件中库名在连接的过程中会被剥除如果文件包含debug 信息可以通过查看符号的方式对比静态
Hadoop URL读取数据

URL setURLStreamHandlerFactory 每个虚拟机只能调用一次这个方法 xff0c 因此通常在静态中调用这个方法 xff01 这个限制以为着如果程序其他的组件已经声明一个实例 xff0c 则将无法使用这个方法读取 1

Hadoop URL读取数据

Hadoop URL读取数据 的相关文章

随机推荐

热门标签

Hadoop URL读取数据的相关文章