我需要删除 XML 标记之间的任何内容,尤其是空格和换行符。
例如,从以下位置删除空格和换行符:
节点> \n
to get:
节点>
这并不是为了手动解析 XML,而是在 XML 数据被工具解析之前准备好。更具体地说,我正在使用 Hpricot (Ruby) 来解析 XML,不幸的是我们目前停留在版本 0.6.164 上,所以......我不知道更新的版本,但这经常返回奇怪的节点仅包含空格和换行符的(对象)。因此,我们的想法是先清理 XML,然后再将其转换为 Hpricot 文档。替代解决方案受到赞赏。
测试示例:NoMethodError: undefined method `children' for "\n ":Hpricot::Text
这里有趣的部分不是 NoMethodError,因为这很好,而是 Hpricot::Text 元素只包含一个换行符,仅此而已。
请不要使用正则表达式来解析 XML。这是非常容易出错的。
使用适当的 XML 库,这将使这变得微不足道。几乎所有您需要的编程平台都有可用的 XML 库 - 确实没有理由对 XML 使用正则表达式。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)