使用 XmlSlurper 解析（非常）大的 XML 文件

2024-01-30

我对 Groovy 有点陌生，我正在尝试使用 XmlSlurper 读取一个（相当）大的 XML 文件（超过 1Gb），由于它不构建整个 DOM，因此它应该能够在处理大文件时产生奇迹。在记忆中。

尽管如此，我还是不断收到“OutOfMemoryError：Java堆空间”，这让我认为我显然做错了什么。我尝试增加 Xmx 设置，但我宁愿解决问题，因为之后我可能需要处理更大的文件。

这是我使用的代码行：

def posts = new XmlSlurper().parse(new File("posts.xml"))

有什么问题的提示吗？

提前致谢，

Jérémie.

格罗维的XmlSlurper是一个 SAX 解析器，但将整个模型加载到内存中......

为了避免 OOM 异常，您可能需要增加内存限额（正如您所说，使用-Xmx设置），或者您可以编写您自己的 SAX 解析器 http://docs.codehaus.org/display/GROOVY/Reading+XML+with+Groovy+and+SAX从文档中获取您需要的数据

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

xml

Groovy

xmlslurper

使用 XmlSlurper 解析（非常）大的 XML 文件的相关文章

我怎样才能拦截从 Java 到 Groovy 的调用——或者轻松地模拟它

我本来希望使用 groovy 的 invokeMethod 来做到这一点但事实证明当您从 Java 调用 Groovy 时不会调用 invokeMethod 但否则它会完美地工作我有一个案例我将 Groovy 类提交给 Java
Inno Setup：使用缩进保存 XML 文档

我正在尝试在 Inno Setup 中向 XML 文件添加一个新节点节点添加正确但下一个标记之前的换行符被删除或未添加换行符这是我的添加节点代码 NewNode XMLDoc createElement Test XMLDoc set
多线程读取xml文件

我进行了很多搜索但找不到适合我的问题的解决方案我编写了一个 xml 文件其中包含电视节目的所有剧集信息它大小 38 kb 包含大约 680 个变量的属性和字符串起初我只是在 XMLTextReader 的帮助下阅读它它在我的四
将 < 转换为 < xml 文档

我已读取 XML 文件并转换为 NSXMLDocument 对象但是由于节点的字符串内容中存在我如何将文件作为普通 XML 文件写入其中 lt 将被感谢致敬列宁当的时候 lt 字符出现在文本节点中它将被序列化为 lt 当您
xpath 根据子值选择父级

我希望选择状态为实时的每个活动我在 Drupal 的 XPath XML 解析器中使用它并具有上下文基本查询和 xpath 查询字段上下文这是基本查询所有其他查询都将在此上下文中运行我目前有语境 event status
如何使用 PHP 从文档中删除无效的 XML 字符

我试图生成一个大约 23 到 30 MB 的 XML 文档当我用 Firefox 打开它时我收到 XML Parsing Error not well formed Location file Users User Downloads
为什么 getElementsByTagName 会出现“无效谓词”错误？

我有以下 XML
大型 XML 的 XML 节点到字符串转换

到目前为止我一直在使用DOM源在我的 Android 应用程序中将 XML 文件转换为字符串这是我的代码 public String convertElementToString Node element throws Transform
将所有构造函数参数作为实例属性添加到 PyCharm 中的类中

我正在使用 PyCharm 我开始定义一个类 class A def init self a b c 我希望它看起来像这样 class A def init self a b c self a a self b b self c c 使用
Grails GORM 和枚举

我在 Grails 中使用枚举时遇到问题我尝试在 grails 域对象中使用枚举 code package it xxx tools kanban import java util Date class Task String name
XDocument 似乎不存在于 System.Xml 命名空间中

我遇到了我认为可能是一个非常简单的问题在开发我的第一个 WP7 应用程序时我已经进入了访问我的站点 api 并解析 XML 的阶段但是我在尝试使用 XDocument 时遇到了困难我四处搜索并找到了这个示例代码将 XML 文件从网
GroovyScriptEngine 在加载使用其他类的静态内部类的类时抛出 MultipleCompilationErrorsException

我遇到了 GroovyScriptEngine 的问题它似乎无法使用内部类有人知道 GroovyScriptEngine 是否有一些限制或解决方法我有一个包含这两个文件的目录 MyClass groovy public class M
xQuery LIKE 运算符？

有没有办法以与 SQL 相同的方式使用 XQuery 执行 LIKE 操作我不想构造一些 startswith endswith 和 contains 表达式我想要实现的目标的示例 for x in user where x first
即使使用标记，XSL 也会忽略我的空格

我在 XSL 代码中创建一个标头其中包含多个信息字段即姓名 Bob 出生日期 1900 年 1 月 1 日等我将它们包含在标签中如下所示
使用 java 删除 XML 根的子级

这是我的 xml 文件
将 aspx 文件加载到 xmldocument 中

我希望能够将 aspx 页面加载到 XmlDocument 变量中我怎么做这是我尝试过的它期望 xml 文件而不是 aspx 页面有没有办法将aspx页面即时转换为xml文档并加载它谢谢 string filePath C Web
以编程方式创建 FloatingActionButton（无需 xml）

我很欣赏 Android 的 FloatingActionButton fab 功能并希望在我的项目中的许多不同地方使用它们现在我有这样的东西我有几个 xml 规范除了 id 图标和 onclick 之外所有这些规范都是相同的
解析 XML 标签不匹配时出错
xhtml 文档 - Lang 选项问题

下面显示的两行有什么区别如果我没有meta标签会有什么后果元版本是否会影响屏幕阅读器而顶部版本则不会我对他们到底做什么有点困惑预先感谢您的任何帮助此致 Skip 深入研究辅助功能识别您的语言页面 http diveintoacc
如何生成源文件并用gradle编译

我有一个类似于以下内容的 gradle 构建脚本 apply plugin war task genSources lt lt here I generate some java files making sure that source

随机推荐

双工命名管道在某个写入时挂起

我有一个 C 管道服务器应用程序和一个 C 管道客户端应用程序通过 Windows 命名管道进行通信双工消息模式在单独的读取线程中等待阻塞一切正常通过管道发送和接收数据直到我尝试从客户端写入管道以响应表单 textchange
实际上复制/提取苹果的“iPhone X 的连续角”？

历史性的问题请注意现在就这么简单 https stackoverflow com a 59993994 294884 https stackoverflow com a 59993994 294884 iPhoneX 不寻常的底角是 A
如何解码 matplotlib 颜色图中的颜色映射？

我知道如何将数字映射到这篇文章中的颜色将值映射到 matplotlib 中的颜色 https stackoverflow com questions 28752727 map values to colors in matplotlib
训练时间最短的人脸检测算法[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案想问是否有任何适合视频的人脸检测方案需要最少的训练时间理想情况下是几天而不是像 Viola Jones 那样的几周我读过有关 LB
将值添加到 MassTransit.RabbitMq 中的标头

我正在使用 MassTransit 3 0 0 0 我很难理解如何在请求响应场景中拦截消息并将一些信息添加到我可以在接收器端读取的标头字段我正在看中间件 http masstransit project com MassTransit
Java OCR 库有推荐吗？ [复制]

这个问题在这里已经有答案了我需要检查大量图片看看它们是否有关键字谁能推荐一个好的可靠的 OCR 库我很乐意牺牲速度来换取准确性没有纯 Java OCR 库具有与准确性有关的事情 https stackoverflow com q
Microsoft 桌面搜索 - 包含在 Windows Server 2008 上不返回结果

我正在尝试搜索远程文件共享运行 Windows Server 2008 R2 对于包含一些文本的文件如果我尝试这样做效果很好 SELECT System FileName FROM RemoteServer SystemIndex W
在 TensorFlow 中，有什么方法可以初始化未初始化的变量吗？

TensorFlow 中初始化变量的标准方法是 init tf initialize all variables sess tf Session sess run init 经过一段时间的学习后我创建了一组新的变量但是一旦初始化它们它
window.opener 不对

我正在打开一个弹出窗口并希望在其中执行单击操作从而在打开它的页面中执行一些 jQuery 我在网上找到的所有内容都表明我应该能够使用 window opener 做到这一点例如JQuery 写入开启器窗口 https stackove
jQueryeach() 闭包 - 如何访问外部变量

从 each 中访问 this rules 变量的最佳方法是什么任何关于原因方式的解释也会有帮助 app Style function node this style node this rules var ruleHolder nod
为什么perl配置VC-WIN64A后没有ms\do_ms.bat？

我正在使用 Visual Studio 2015 编译 OpenSSL 我已经安装了 Windows 10 上的 Visual Studio 2015 ActivePerl 5 24 0 2400 MSWin32 x64 300558 na
如何在不使用非 api 类的情况下取消 Java 中的 Files.copy() ？

我正在下载一个文件Files copy method Files copy in Paths get targetZipFile StandardCopyOption REPLACE EXISTING 如果下载很慢我想取消它我在 stac
gcov 在当前目录中创建 .gcov 文件。有什么办法可以改变这个吗？

我在 RHEL 上运行 gcov gcc 4 1 2 当我想为 gcov 文件指定目录时关于如何做到这一点有什么想法吗从您想要创建其文件的目录运行 gcov 你必须使用 o参数告诉它在哪里查找 gcno gcda 文件看gcov 的文
是什么让 SPI 比 I2C 协议更快 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我了解 I2C 和 SPI 通信的基础知识因为两者都是同步协议我想知道是什么让 SPI 比 I2C 更快如果我没记错的话使用 I2
Docker：理解ENTRYPOINT和CMD指令

我想问一些关于ENTRYPOINT and CMD可在 Dockerfile 中使用的说明 Providing that I m mounting local directories as volumes in a container us
如何检查我当前是否在主屏幕上

是否可以检查我的应用程序当前是否处于后台并且主屏幕是否已启动没有 API 可以知道主屏幕是否正在显示但是您可以使用各种 Activity 生命周期回调 onStop 等知道您的应用程序何时发送到后台
为什么未装箱的数组不是可折叠的实例？

在 Haskell 中找出要使用的正确数据容器可能有点棘手对于我认为使用的 2D 网格应用程序UArray会是合适的然而据我所知UArray不是一个实例foldable 不在Data Array IArray nor Data Arr
Flutter SQFlite 一对多关系设置

我正在创建一个应用程序并需要一个数据库该数据库包含位置表和兴趣点表这是一对多的关系一个位置有多个兴趣点现在我尝试用 sqflite 在 flutter 中建立这种关系但失败了我已经尝试添加外键但没有成功这只是代码中最重要的部
RecyclerView ViewHolder 内部 ConstraintLayout 的性能

在过去的两天里我一直在尝试分类为什么我的 RecyclerView 在滚动时速度如此之慢并且我已将其范围缩小到我用于行的 ConstraintLayout 在 Android 上使用 GPU 分析器会显示绿色蓝绿色条一直到屏幕顶部表
使用 XmlSlurper 解析（非常）大的 XML 文件

我对 Groovy 有点陌生我正在尝试使用 XmlSlurper 读取一个相当大的 XML 文件超过 1Gb 由于它不构建整个 DOM 因此它应该能够在处理大文件时产生奇迹在记忆中尽管如此我还是不断收到 OutOfMemory

使用 XmlSlurper 解析（非常）大的 XML 文件

使用 XmlSlurper 解析（非常）大的 XML 文件 的相关文章

随机推荐

热门标签

使用 XmlSlurper 解析（非常）大的 XML 文件的相关文章