使用 FSDataOutputStream 将不需要的字符从 java REST-API 写入 HadoopDFS

2024-04-11

我们构建了一个 java REST-API 来接收事件数据（例如单击购买按钮）并将该数据写入 HDFS。本质上，我们为发送数据（以 JSON 形式）的每个主机打开流，或者使用现有的流，使用时间戳、事件名称和主机名丰富数据，并将其写入 (FS)DataOutputStream：

1 public synchronized void writeToFile(String filename, String hostname, String content) throws IOException {
2    FSDataOutputStream stream = registry.getStream(filename, hostname);
3    stream.writeBytes(content);
4    stream.hflush();
5  }

首先，我们使用了stream.writeChars(content)在第 3 行中，生成如下文件：.{.".m.e.s.s.a.g.e.".:.".h.e.l.l.o.".}查看 DataOutputStream.writeChars(String s) 的实现，您会看到向右移动 8 位，并为每个字符添加前导 x00，原因我不明白。

然后我尝试了stream.writeUTF(content)在第 3 行中，文件看起来好多了：.W{"message":"hello"}但仍然是几个字节到很多字节。查看代码，writeUTF(String s) 首先发送 s 中的字节数，然后发送字符串本身。所以.W表示事件数据中的字节数，当改变事件数据的长度时证明文件中显示不同的前导字符。

所以我最后的手段是stream.writeBytes(content)。这里一切看起来都很好：{"message":"hello"}直到特殊字符开始发挥作用：{"message":"hallöchen"} became {"message":"hall.chen"}。 writeBytes 在写入之前切掉字符的前 8 位。我想我需要一些 UTF-8 功能才能正确写入这些字符。

所以，现在我有点迷失了。我该如何解决这个问题？

当我读到这篇文章时：为什么 DataOutputStream.writeUTF() 在开头添加额外的 2 个字节？ https://stackoverflow.com/questions/7630242/why-does-dataoutputstream-writeutf-add-additional-2-bytes-at-the-beginning?rq=1我觉得提到的 FSDataOutputStream 方法不适用于此。一个快速（可能是肮脏的）解决方案是这样的：

3 byte[] contentAsBytes = content.getBytes("UTF-8");
4 for (byte singleByte : contentAsBytes) {
5   stream.writeByte(singleByte);
6 }

更干净的方法是不使用 FSDataOutputStream，但我找不到替代方法。任何提示仍然值得赞赏。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 FSDataOutputStream 将不需要的字符从 java REST-API 写入 HadoopDFS 的相关文章

尝试使用 Eclipse 启动 Glassfish 服务器时出现 org.apache.catalina.LifecycleException

我一直忙于使用 angularjs 前端构建一个 REST 应用程序使用 MAVEN jersey quickstart webapp 使用 GLASSFISH Web 服务器在 Eclipse 上开发今天当我开始对项目进行一些开发时
Hibernate OneToMany 关系是 PersistentBag 而不是 List

我正在 javafx 中开发一个应用程序它通过 RMI 与 EAR 连接该 EAR 连接到 SQLServer DB 并使用 hibernate 映射 POJOS 这些 POJOS 包含双向 OneToMany 和 ManyToOne
Java Swing：清除JList而不触发监听器

我的情况如下我有一个 JList 只要在列表中进行选择它就会触发搜索使用 ListSelectionListener 我正在尝试使用以下命令重置列表上的选择list clearSelection 这样做的问题是使用clearSelec
.java 和 .scala 类之间是否可能存在循环依赖？

假设我在 java 文件中定义了类 A 在 scala 文件中定义了类 B A 类使用 B 类 B 类使用 A 类如果我使用 java 编译器则会出现编译错误因为 B 类尚未编译如果我使用scala编译器A类将找不到有没有可以同时
Java/JAXB：将具有相同名称但不同属性值的 XML 元素解组到不同的类成员

我正在尝试根据其属性之一将具有多个 Fields 元素的 XML 解析为不同的类成员这是 XML
有效地查找正则表达式的所有重叠匹配项

这是后续与 java 正则表达式匹配的所有重叠子字符串 https stackoverflow com q 11303309 244526 有没有办法让这段代码更快 public static void allMatches String
Maven + Cobertura：无法找到[您的班级]。你指定了源目录吗？

我有 MyMath 类有两个简单的方法 multi 和 add 和测试类只会测试多种方法 public class MainTest Test public void testMultiply MyMath tester new MyMa
方法不必要地被调用？

我有一个 BaseActivity 它可以通过其他所有活动进行扩展问题是每当用户离开暂停活动时我都会将音乐静音我也不再接听电话问题是 onPause每当用户在活动之间切换时就会被调用这意味着应用程序不必要地静音和停止tele
如何在具有动态列的表中插入值 Jdbc/Mysql

我想在具有动态列的表中添加值我设法创建一个包含动态列的表但我不知道如何插入数据 Create Table sql CREATE TABLE MyDB myTable level INTEGER 255 int columnNumber
独占锁定ConcurrentHashMap

我知道不可能锁定 ConcurrentHashMap 进行独占访问但是我找不到原因是因为构成CHM的 Segment 没有被api公开吗据推测如果是的话客户端代码可以执行交接锁定 Cheers 我知道不可能锁定 Concur
您能让 Tomcat 6 stdout.log 文件表现得像 log4j DailyRollingFileAppender 吗？

我们使用的是 Tomcat 6 的 Windows 安装默认情况下我们应用程序的 log4j 输出将转到 catalina base logs stdout log 文件该日志文件仅在我们重新启动 Tomcat 时滚动并且文件名始终
java JFileChooser 文件大小过滤器

我知道我可以按文件类型进行过滤但是可以按文件大小进行过滤吗例如 JFileChooser 仅显示 3 MB 以内的图片简短的回答应该是你尝试过什么长答案是肯定的 JFileChooser fc new JFileChooser f
Java G1 GC 处理引用对象运行缓慢

我已经在 J ava 上运行了计数器它24小时工作每秒点击通过100次左右白天 GC 处理时间从 20 60 毫秒缓慢上升到 10000 60000 毫秒然后下降到 20 60 毫秒这种模式不时地重复从 GC 日志中我发现 GC
.class 与 .java

class 文件和 java 文件有什么区别我正在尝试让我的小程序工作但目前我只能在 Eclipse 中运行它还不能嵌入 HTML 谢谢编辑那么如何使用 JVM 进行编译呢 class 文件是编译后的 java 文件 java 都
当容器大小更改时，JTable 仅调整选定列的大小

对于面板内的 JTable 如果面板变大我如何将额外的空间仅分配给某些列在我的例子中分配给最后一列尽管提供第 3 4 列和8 将获得额外的空间我想允许用户手动更改所有列的列大小我尝试了 table setAutoResizeM
存储过程将多个表返回到 spring jdbc 模板

我正在使用 JdbcTemplate 从 Spring DAO 类调用存储过程我的问题是存储过程返回多个表有没有办法使用 Spring JdbcTemplate 访问多个表如果我使用jdbcTemplate queryForList
@TestPropertySource 不适用于 Spring 1.2.6 中使用 AnnotationConfigContextLoader 的 JUnit 测试

似乎我在 Spring 4 1 17 中使用 Spring Boot 1 2 6 RELEASE 所做的任何事情都不起作用我只想访问应用程序属性并在必要时通过测试覆盖它们无需使用 hack 手动注入 PropertySource 这不行
Mule/码头设置

我有一个正在运行的 Mule 应用程序我想在其上设置 Jetty 来响应 http 请求以下配置
Android同步onSensorChanged？

这是我的问题的后续 Android线程可运行性能 https stackoverflow com questions 36395440 android thread runnable performance 我在理解应用程序的同步方法时遇到
Java泛型类型

当我有一个界面时 public interface Foo

随机推荐

VBA在指定范围内查找指定单元格值并选择它

我在创建一个宏时遇到问题该宏将在信息工作表的范围内找到活动工作表中的指定值如果在范围内找不到单元格值那么它会给我一个消息框指出未找到值我有以下内容但它不起作用 Sub testrot Dim i As String Dim
匹配元组作为映射的输入

尝试对映射中的元组进行模式匹配 fn main let z vec 1 2 3 4 let sums z iter map a b a b println sums 产生错误 error E0308 mismatched types gt
如何在 R 中处理 BigINT [重复]

这个问题在这里已经有答案了我有一个 BigInt 数字如果我尝试将其存储在 R 中 R gt a lt 9223372036854775807 R gt a 1 9 223372e 18 正如您所注意到的它丢失了最后几位数字的信息我
带有忽略大小写的 JDBC URL 不适用于 H2 数据库连接

我试图在 SQL 模式下使用 h2 数据库我能够创建一个全部大写的模式并在其下创建一些表但是除非我匹配所有大写的架构名称否则我在休眠上运行的应用程序似乎无法工作我认为 h2 可以在 JDBC 连接字符串中使用 IGNROECAS
如何在 WordPress 多站点设置中显示来自其他站点的帖子？

我使用 WordPress 3 0 的多站点功能设置了一个小型站点网络我想创建另一个网站从其他各个网站中提取某些帖子进行显示这个新的中心站点对于用户来说似乎是它自己的独立站点具有域映射但其内容来自其他站点的帖子如何在 Wor
在 ionic v1 中滚动到 div 时使其固定

我试图在滚动到 div 时修复它但问题是我尝试定位的 div 位于 ion content 中并且它不允许我使用简单的 jQuery 或 CSS 解决方案来实现此功能根据我读过的答案离子内容的滚动部分正在扰乱它的工作我很好奇与这个
检查一个时间间隔内的任何日期是否在另一个时间间隔内的任何日期内

我有 2 个日期间隔我想看看是否有任何日期interval A在之内interval B 我理想地寻找 dplyr 解决方案 The data library lubridate interval A lt new Interval Da
如何使用 JAX-RS NewCookie 删除服务器上的 cookie？

我想删除服务器上的cookie 通过设置Expires到过去我怎样才能做到这一点javax ws rs core NewCookie 我正在尝试这个但它不起作用 return Response ok entity hello world
如何使用 .Net（在 Windows Phone 上）阅读公共 Twitter 源

我正在尝试读取用户的公共 Twitter 状态以便可以在我的 Windows Phone 应用程序中显示它我用 Scott Gu 的例子 http weblogs asp net scottgu archive 2010 03 18 b
嵌入式 C/C++ 项目的构建系统

我正在寻找一个高级构建系统工具可以帮助将我的嵌入式 C 项目组织成模块和组件请注意这两个术语非常主观因此我的定义如下模块是 c 和 h 文件的内聚集合但只有一个对其他模块可见的公共 h 文件另一方面组件或层是模块
JSNI 中 $doc.getElementById("id") 和 document.getElementById("id") 之间的区别是什么

我正在 GWT 应用程序内的本机函数中工作并且尝试了这两种方法 document getElementById id 返回 null 但 doc getElementById 返回有效元素这些方法之间有哪些概念上区别提前致谢 GW
pytest - 在 setup_module 中使用 funcargs

我在 conftetst py 中包含了我自己的命令行选项 def pytest addoption parser parser addoption backend default test backend help run testx f
Python 美丽汤论

我有这段代码使用 BeautifulSoup 从页面中获取一些文本 soup BeautifulSoup html body soup find div id body print body 我想将其作为一个可重用的函数它接受一些 ht
UITableView 在动画时剪辑到边界

我有一个 UITableView 其中一些单元格有阴影当我做出平移手势来查看任何单元格的行操作时表视图会剪辑单元格的边界直到手势完成 I have clipsToBounds set to false在我的手机上contentView
SQL Server 2008中的函数类似于mysql中的GREATEST？

我想找到多列的最大值 MySQL 支持GREATEST http dev mysql com doc refman 5 6 en comparison operators html function greatest功能但 SQL Ser
使用 Jackson ObjectMapper 将子类名称序列化为 JSON，而不是超类

在以下将对象序列化为 JSON 的 Jackson Java 代码中我得到了以下结果 animal x x 然而我真正想要得到的是 dog x x 我可以对 AnimalContainer 做些什么以便获得对象的运行时类型狗猫而
将值附加到列表

我有一个不可变的列表对象在Map对象如下 let initialState Immutable fromJS state initialState state state set myList Immutable List 如何将值附加
将分页：限制结果数量

我正在使用 ruby 的 will paginate gem 我正在使用将分页来获取一群人并在字段上进行排序我想要的只是其中的前 100 个本质上都是顶尖人物我似乎无法做到这一点我该怎么办呢谢谢据我所知 will paginat
使用 jquery 添加类后，字体很棒的图标字体作为输入中的占位符

我正在尝试使用字体很棒的图标作为搜索输入字段中的占位符 Jsfiddle 示例 http jsfiddle net gA4rx 831 我使用相应的 html 实体作为占位符然后使用伪类使用正确的字体系列设置占位符的样式 jsfiddle
使用 FSDataOutputStream 将不需要的字符从 java REST-API 写入 HadoopDFS

我们构建了一个 java REST API 来接收事件数据例如单击购买按钮并将该数据写入 HDFS 本质上我们为发送数据以 JSON 形式的每个主机打开流或者使用现有的流使用时间戳事件名称和主机名丰富数据并将其写入 FS

使用 FSDataOutputStream 将不需要的字符从 java REST-API 写入 HadoopDFS

使用 FSDataOutputStream 将不需要的字符从 java REST-API 写入 HadoopDFS 的相关文章

随机推荐

热门标签