在我的 Java 应用程序中,我需要解析包含控制字符的 XML 文档0x2
在 CDATA 内。
我尝试了几种方法但无法通过。我想避免任何类型的编码。
XML1.1有什么办法吗?
我需要解析 CDATA 中包含控制字符 0x2 的 xml
那么那不是 XML。任何地方的原始控制字符 U+0002 都意味着它的格式不正确,因此不是 XML 文档。
仅在 XML 1.1 中,可以包含编码为字符引用的控制字符。因此,您可能尝试通过执行字符串替换来修复它\x02
with 
在解析之前。但是,您不能将字符引用放在 CDATA 部分中,因此这也不会成功。
编辑:如果您绝对确定每个杂散 U+0002 字符都在 CDATA 部分内,则可以在短期内修复它,方法是将每个字符替换为:
]]><![CDATA[
然而,这太糟糕了。首先需要修复生成错误 XML 的任何内容。去踢那个负责创造它的人吧!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)