如何用java转换巨大的xml文件？

2023-11-23

正如标题所说，我有一个巨大的 xml 文件（GB）

<root>  
<keep>  
   <stuff>  ...  </stuff>  
   <morestuff> ... </morestuff>  
</keep>  
<discard>  
   <stuff>  ...  </stuff>  
   <morestuff> ... </morestuff>
</discard>  
</root>

我想把它改造成一个更小的，只保留一些元素。
我的解析器应该执行以下操作：
1. 解析文件直到相关元素开始。
2. 将整个相关元素（及其子元素）复制到输出文件。转到1。

第 1 步对于 SAX 来说很容易，而对于 DOM 解析器来说则不可能。
第 2 步对于 SAX 来说很烦人，但对于 DOM-Parser 或 XSLT 来说很简单。

所以呢？ - 有没有一种巧妙的方法来结合 SAX 和 DOM-Parser 来完成任务？

StAX似乎是一个显而易见的解决方案：它是一个拉解析器，而不是 SAX 的“推”或 DOM 的“缓冲整个事物”方法。但不能说我用过它。 A“StAX教程”搜索可能会派上用场:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

Parsing

如何用java转换巨大的xml文件？的相关文章

禁用 Eclipse Java 调试器的热代码替换 [重复]

这个问题在这里已经有答案了可能的重复如何在 Eclipse 中禁用热代码替换 https stackoverflow com questions 2594408 how do i disable hot code replace in
如何从 MySQL 数据查询创建 XML 文件？

我想知道一种仅使用 MySQL 查询创建 XML 文件的方法根本不使用任何脚本语言有关于这个主题的书籍教程吗 UPDATE 我想澄清一下我想使用 sql 查询将 XML 数据转发到 php 脚本 Here s 关于从 MySQL S
为什么 java 编译器不报告 Intellij 中多播表达式的未经检查的强制转换警告？

为什么下面的代码没有报告 Intellij IDEA 的未经检查的警告jdk 1 8 0 121自从Supplier
Java：使用 HttpURLConnection 的 HTTP PUT

如何执行 HTTP PUT 我正在使用的类似乎认为它正在执行 PUT 但端点将其视为我执行了 GET 我做错了什么吗 URL url new URL https HttpURLConnection conn HttpURLConnectio
C# 是否有像 Java 那样的字符串分词器？

我正在做简单的字符串输入解析我需要一个字符串标记器我是 C 新手但已经编写过 Java 程序因此 C 应该有一个字符串标记生成器似乎很自然可以它在哪里我该如何使用它你可以使用String Split 方法 http msdn
具有共享依赖项的多模块项目的 Gradle 配置

使用 gradle 制作第一个项目所以我研究了 spring gradle hibernate 项目如何组织 gradle 文件并开始制作自己的项目但是找不到错误为什么我的配置不起作用子项目无法解决依赖关系所以项目树 Root
如何获取 WebElement 的父级[重复]

这个问题在这里已经有答案了我试过了 private WebElement getParent final WebElement webElement return webElement findElement By xpath 但我得到
Git 无法识别重命名和修改的包文件

我有一个名为的java文件package old myfile java 我已经通过 git 提交了这个文件然后我将我的包重命名为new所以我的文件在package new myfile java 我现在想将此文件重命名和内容更改提交
如何将 Jfreechart（饼图）添加到 netbeans 的面板中

我正在使用 netbeans gui 编辑器并且正在尝试添加一个本身位于内部框架中的 Jfreechart 并且这个内部框架我想将其添加到面板中正如您在此图中看到的那样抱歉我无法直接发布图像因为我新手 http www flick
计算日期之间的天数差异

在我的代码中日期之间的差异是错误的因为它应该是 38 天而不是 8 天我该如何修复 package random04diferencadata import java text ParseException import java t
Java 收集返回顶级项目的映射的嵌套流

我有以下模型 class Item String name List
Cloudfoundry：如何组合两个运行时

cloundfoundry 有没有办法结合两个运行时环境我正在将 NodeJS 应用程序部署到 IBM Bluemix 现在我还希望能够执行独立的 jar 文件但应用程序失败 APP 0 bin sh 1 java not found
Android Studio 将音乐文件读取为文本文件，如何恢复它？

gameAlert mp3是我的声音文件运行应用程序时它询问我该文件不与任何文件类型关联请定义关联我选择TextFile错误地现在我的音乐文件被读取为文本文件我如何将其转换回music file protected void o
逃离的正确方法是什么？使用 Oracle 12c MATCH_RECOGNIZE 时 JDBCPreparedStatement 中的字符？

以下查询在 Oracle 12c 中是正确的 SELECT FROM dual MATCH RECOGNIZE MEASURES a dummy AS dummy PATTERN a DEFINE a AS 1 1 但它不能通过 JDBC
尝试使用等于“是”或“否”的字符串变量重新启动 do-while 循环

计算行程距离的非常简单的程序一周前刚刚开始我有这个循环用于解决真或假问题但我希望它适用于简单的是或否我为此分配的字符串是答案 public class Main public static void main String a
为什么java中的for-each循环中需要声明变量

for 每个循环的通常形式是这样的 for Foo bar bars bar doThings 但如果我想保留 bar 直到循环结束我可以not使用 foreach 循环 Foo bar null Syntax error on toke
如何在Java中正确删除数组[重复]

这个问题在这里已经有答案了我刚接触 Java 4 天从我搜索过的教程来看讲师们花费了大量精力来解释如何分配二维数组例如如下所示 Foo fooArray new Foo 2 3 但我还没有找到任何解释如何删除它们的信息从内存的情
JSON 到 hashmap (杰克逊)

我想将 JSON 转换为 HashMapJackson http jackson codehaus org 这是我的 JSON String json Opleidingen name Bijz trajecten zorg en welz
Java：多线程内的 XA 事务传播

我如何使用事务管理器例如Bitronix http docs codehaus org display BTM Home JBoss TS http www jboss org jbosstm or Atomikos http www a
启动Java项目时发生类冲突：ClassMetadataReadingVisitor将接口org.springframework.asm.ClassVisitor作为超类

我正在使用最新的Spring框架版本 3 2 2 RELEASE 开发一个Java Web项目但是现在项目启动时遇到了问题详细错误是 java lang IncompleteClassChangeError 类 org springfr

随机推荐

在VB.NET中用“”分割字符串

假设这是我的字符串 1 2 3 我想用空格分割字符串并每次显示字符串的一部分这将满足您的需要 Dim str As String 1 2 3 Dim strarr As String strarr str Split c For Ea
SQL 连接表值函数与表，其中表字段是函数输入

我有一个名为 fn SplitCommaSep 的表值函数它用逗号分隔文本字段从 a b c 到 3 行 a b c 如何将其连接到表中将表列作为输入为此假设表 MyTable 有 2 列即 Id 和 TextWithComma
如果表的长度不同，如何对多个表中的列值求和？

好吧这应该是一个简单的问题但我正在寻找一种尽可能快的解决方案假设我有 3 个表表的数量会更大 tab1 lt table c 1 1 1 2 2 3 3 3 tab2 lt table c 1 1 4 4 4 tab3 lt tab
WPF 位图性能

我试图了解为什么我的图像不活泼因此我构建了一个示例来测试 WPF 性能我使用计时器来计算显示图像事件处理程序执行的时间并使用秒表来测量图像出现在屏幕上所需的时间底线显示 100 1600 2500 和 3600 个图像时 WP
循环摩卡测试

我正在尝试使用摩卡中的数据提供程序来编写更少的代码 var should require should var assert require assert var request require supertest var mongoose
使用 LocationClient 定期获取更新的最节省电池效率的方法是什么？

我正在考虑设置两个单独的警报每小时收集用户的位置数据一个每 59 分钟发出一次以连接客户端另一个警报用于实际获取位置然后断开客户端连接就电池寿命而言如果获取用户位置将成为应用程序的主要消耗我还应该考虑做什么或者是否有不
如何编写异步LINQ查询？

当我读了一堆LINQ相关的东西后我突然意识到没有文章介绍如何编写异步LINQ查询假设我们使用 LINQ to SQL 下面的语句很清楚但是如果 SQL 数据库响应缓慢那么使用该代码块的线程就会受到阻碍 var result fro
log4j ConversionPattern 时间戳（微秒）

我想在使用 log4j 生成的日志文件的每个条目的时间戳中添加微秒这可能吗我查过官方文档但没有提到毫秒以下的单位现在我有一个如下所示的转换模式 d dd MM yyyy HH mm ss SSS 5p t m n 在日期转换模式中
您建议将哪个数据库与 C# (.NET) 应用程序一起使用？

我正在制定一个小项目计划当我需要决定使用什么本地数据库系统时输入数据将存储在网络服务器上托管 MySQL DB 这个想法是建立一个流程来下载所有必要的数据例如在午夜并处理它们然而会有很多输入和处理阶段所以我需要使用某种本地数
处理器有哪些优化代码的技巧？

我正在寻找诸如代码重新排序之类的东西这些东西甚至可能在多处理器的情况下破坏代码最重要的一个是内存访问重新排序如果没有内存栅栏或序列化指令处理器可以自由地重新排序内存访问某些处理器架构对其可以重新排序的数量有限制 Alpha 因最弱
如何使用 lambda 初始化映射？

我想在单个语句中声明一个完全填充的映射字段可能包含多个嵌套语句如下所示 private static final Map
Ruby 字符串连接问题

这有效 irb main 001 0 gt name Rohit Sharma gt Rohit Sharma 但这并不 irb main 001 0 gt fname Rohit gt Rohit irb main 002 0 gt ln
根据眼睛图像进行注视估计

到目前为止我已经能够准确地检测瞳孔和眼角您可以在此处看到我在回答自己的问题时上传的一些快照执行稳定的眼角检测这是我到目前为止所做的我通过查看 TLCP TRCP 和 BLCP 来校准用户的视线在哪里 CP calibration
将大数据加载到 TensorFlow 2.0 中，而不将其加载到 RAM 上

我已经处理并保存了大量视频和音频文件数据集大约 8 到 9 GB 的数据数据保存为 2 个 numpy 数组每个数组对应一种模态文件的形状为 number of examples maximum time length featur
带有 ViewPager2 的 BottomSheetBehavior 无法通过嵌套的 RecyclerView 滚动向下滚动

我有一个类似的观点BottomSheet行为这个视图有ViewPager2里面每个ViewPager2的页面都是一个垂直的RecyclerView 问题是当当前垂直 RecyclerView ViewPager 的页面无法再垂直滚动时
在 swift4.1 中将 Any 转换为 Float 总是失败

在以前的版本中要从 a 获取浮点值 String Any 字典我可以用let float dict somekey as Float 但是在swift4 1中不起作用似乎是这样的类型dict somekey 已被隐含地推断为Doub
如何从 SqlDataReader 解析 Nullable

DateTime TryParse 方法采用 DateTime 作为参数而不是 DateTime 现在我有以下代码 if DateTime TryParse reader Placed ToString out placed throw
在 Windows Kafka 上删除主题时出现 AccessDeniedException

我刚刚在我的 Windows 机器上安装了 Kafka 来自 Confluence Platform 我启动了 Zookeeper 和 Kafka 并创建主题生产和消费它们的工作然而一旦我删除一个主题 Kafka 就会崩溃如下所示
如何避免 Selenium 中的 StaleElementReferenceException - Python

我陷入了编写 Python Selenium 脚本的困境似乎无法令人满意地解决我收到的这个 StaleElementReferenceException 我已加载页面并单击一个按钮该按钮将打开一个表单允许用户向订单添加新的信用卡此时
如何用java转换巨大的xml文件？

正如标题所说我有一个巨大的 xml 文件 GB

如何用java转换巨大的xml文件？

如何用java转换巨大的xml文件？ 的相关文章

随机推荐

热门标签

如何用java转换巨大的xml文件？的相关文章