正如标题所说,我有一个巨大的 xml 文件(GB)
<root>
<keep>
<stuff> ... </stuff>
<morestuff> ... </morestuff>
</keep>
<discard>
<stuff> ... </stuff>
<morestuff> ... </morestuff>
</discard>
</root>
我想把它改造成一个更小的,只保留一些元素。
我的解析器应该执行以下操作:
1. 解析文件直到相关元素开始。
2. 将整个相关元素(及其子元素)复制到输出文件。转到1。
第 1 步对于 SAX 来说很容易,而对于 DOM 解析器来说则不可能。
第 2 步对于 SAX 来说很烦人,但对于 DOM-Parser 或 XSLT 来说很简单。
所以呢? - 有没有一种巧妙的方法来结合 SAX 和 DOM-Parser 来完成任务?
StAX似乎是一个显而易见的解决方案:它是一个拉解析器,而不是 SAX 的“推”或 DOM 的“缓冲整个事物”方法。但不能说我用过它。 A“StAX教程”搜索可能会派上用场:)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)