XML 文件中的特殊字符 - 使用 DOM API 进行处理

2023-12-25

我有一个 XML 格式的文件（仅包含根开始标签和结束标签以及根的子标签）。子级的文本元素包含与符号 &。在 XML 中，为了使文档有效，不允许使用此符号，当我尝试使用 Java 中的 DOM API 和 XML 解析器处理该文件时，出现解析错误。因此，我将 & 替换为&，并且我成功处理了该文件：我必须提取不同纯文本文件中文本元素的值。

当我打开这些新创建的文本文件时，我希望看到&，但有 & 代替。为什么是这样？我已将文本存储在没有任何扩展名的文本文件中（我的 XML 格式的原始文件也没有 .xml 扩展名），并且无论我如何打开文件，我在新文件的文本中都只有 & ：作为 txt 或作为 xml 文件（这些是我的 XML 编辑器中的一些选项）。到底发生了什么？ Java（？）是否转换&自动？或者有一些默认编码？出色地，&代表 & ，我想有一些“看不见的”自动转换，但我很困惑这种情况何时以及如何发生。以下是我的原始文件和使用 Java 处理原始文件后收到的提取文件的示例：

这是我的 XML 格式的“负面评论”文件：

<review>
<review_text>
I will not wear it as it is too big &amp; looks funny on me. 
</review_text>
</review>

这是我提取的文件“negative_1”：

I will not wear it as it is too big & looks funny on me.

对我来说，重要的是保持原始数据原样（不进行任何转换/替换），所以我认为我必须处理提取的文件“negative_1”转换回来&到＆。正如你所看到的，我似乎不必这样做。但我不明白为什么:(。

先感谢您！

原因很简单：XML 文件确实包含 an "&"特点。

它只是以不同的方式表示（即“转义”），因为真正的"&"如您所见，它本身会破坏 XML 文件。阅读 XML 1.0 规范中的相关部分：“2.4 字符数据和标记” http://www.w3.org/TR/REC-xml/#syntax。虽然只有几行，但已经很好地解释了这个问题。

XML 是数据的表示形式（！）。不要将其视为文本文件。例子：

您想要将字符串“17

<xml>17 < 20</xml>

解决方案：您对特殊/保留字符使用字符转义，只是为了保留文件的有效性：

<xml>17 &lt; 20</xml>

出于所有实际目的，上面的代码片段包含以下数据（这次采用 JSON 表示形式）：

{
  "xml": "17 < 20"
}

这就是为什么你看到真实的"&"在你的后期处理中。它以同样的方式逃脱了，但它是meaning一直保持不变。

上面的例子也解释了为什么"&"必须特殊对待：它本身就是 XML 转义机制的一部分。它标志着转义序列的开始，就像"<"。因此它本身必须被转义（与"&"，就像你所做的那样）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

XML 文件中的特殊字符 - 使用 DOM API 进行处理的相关文章

JQuery mobile -> .append() 删除 CSS？

当将项目添加到我的列表时 jquery mobile 的完整样式消失了不知道如何解决这个问题目前这是有效的当不附加列表项时所有样式都可以 div class ui grid a div class ui block a ul li
将 System.Xml.Linq 与 mono 命令行编译器结合使用

使用 C Mono 中的以下代码 using System Xml Linq 我收到这个错误 error CS0234 The type or namespace name Linq does not exist in the namesp
使用 Linq C# 检查 XML 节点是否具有属性？

如何检查节点是否确实具有特定属性我有一个包含几个节点的 XML 文件如下所示
使用jquery替换脚本src未执行

我想动态替换脚本的源 URL 以加快开发阶段的速度因此没有实际的生产使用这种替换对于 CSS 或图像效果很好但很难让它与 javascript src 一起工作该脚本似乎没有执行尽管是通过 src 加载的这是我所做的 retur
IE9 createElement 和设置innerHTML 在设置操作上放置标签？

不确定我是否遗漏了一些明显的东西因为这是我第一次尝试使用原始 DOM api 而不是通过 jQuery 等做很多事情考虑以下代码我在其中使用 document createElement 手动创建 TBODY 然后设置它的inner
DOMXPath 根据前一个同级值获取同级

假设我有这个
您成功使用过哪个 PHP RPC（XML 或 JSON）库？

您成功使用过哪个 PHP RPC XML 或 JSON 库我做了一些研究但未能找到一个从其他图书馆中脱颖而出的图书馆我发现了以下内容 PHP 的 XML RPC http phpxmlrpc sourceforge net XML R
XSLT if - 属性等于字符串

我正在使用一个xsl if在较大的条件下执行较小的条件xsl template块我想测试当前属性的相等性xsl template匹配的节点以下内容不起作用
如果路线有 Tolls Google Maps API xml 请求，则返回

在标准谷歌地图方向搜索中在编写方向之前会提供咨询说明该路线有收费站如果没有通行费则不会显示任何咨询信息我有一个谷歌地图 API 请求该请求显示地图其中包含从 1 个家庭地址到 1 个工作地址的旅行距离和持续时间我很难找到在哪
解组此 xml 时遇到问题

尝试了解如何在 Go 中解组 XML 通读多个示例和 stackoverflow 问题我想要的是一个包含系统上安装的所有补丁的切片我什至无法解组补丁没有错误只是一个空切片可能做的事情基本上是错误的提前感谢您的任何建议
究竟要消化什么并在 XMLDSIG 上签名以及如何进行？（或者，OSX 本机客户端与服务器上计算的 XMLDSIG 不匹配）

我正在尝试使用封装签名 sha1 摘要和 rss sha1 签名按照 XMLDSIG 规范对 xml 文档进行签名并且服务器不断返回 297 拒绝签名与计算的结果不匹配 297 Rejeicao Assinatura difere
使用 JavaScript 访问框架的文档对象

我正在测试这一页 http www quackit com html templates frames frames example 1 html 而且我不确定我错过了什么 Two frames on the page gt documen
使用 Python Unescape _xHHHH_ XML 转义序列

我正在使用 Python 2 x 不可协商读取 XML 文档由其他人创建这些文档允许许多元素的内容通过使用转义来包含不是有效 XML 字符的字符 xHHHH 公约例如ASCII BEL 又名 U 0007 由 7 个字符序列表示u x
Seekbar 和 InsetDrawable 获取进度

嗨我尝试自定义一个搜索栏这是我的问题 main xml
setContentView 上的另一个资源$NotFoundException

Stack Overflow 上有很多 Resources NotFoundException 问题我已经查看了它们并尝试了各种建议但均无济于事我有一个完美的工作布局来显示一些图形下面有一些按钮我修改了一些按钮并开始出现此错误我
在 Firefox 和 IE 中使用 XSLT 进行 XML 到 XML 转换

我从几种 XML 格式转换为一种标准我的 XSL 如下所示
VS 2012 语法高亮

我有 2 台计算机运行 VS 2012 pro 但它们都没有像 VS2010 那样显示基于 XML 的文件的任何突出显示或着色我安装的唯一快捷版工具是 SQL 2012 所以我不认为这是问题所在其中一台计算机上从未安装过 WebMatr
XPATH / XSLT：选择父节点的属性与另一个节点的属性匹配的节点

我正在尝试使用 XPath 和 XSLT 对以下 XML 进行转换
是否有 IE 渲染完成事件？

在尝试确定页面加载时间为 20 秒的原因时我发现 IE8 中有一些奇怪的行为场景是这样的我进行 ajax 调用它返回并且回调看起来像这样 StoreDetailsContainer html tableHtml var StoreD
SQL Server XQuery 返回错误

我正在 SQL Server 2012 中对 XML 数据类型列执行查询数据示例如下

随机推荐

在数组上调用 .length 与保存大小变量的性能有区别吗？

我正在创建一个模拟程序我希望代码能够得到非常优化现在我有一个数组它在我使用的各种 for 循环中进行了多次循环 for int i 0 i
') 和 $('p') 有什么区别' aria-label='jQuery $('
') 和 $('p') 有什么区别'> jQuery $('
') 和 $('p') 有什么区别

有人可以向我解释一下两者之间的区别吗 p and p 在 jQuery 中例如如果我写 body append p p html hello my friend 然后出现文本你好我的朋友然而当我写 body append p ht
从 C# 中的自定义字段属性获取值

今天早上我开始了我认为使用自定义字段属性的快速练习在尝试了很多事情并搜索了很多示例大多数涉及类而不是字段属性之后我正式陷入困境我的代码如下一个特点是该类是使用类构建器在 FileHelpers 中构建的我的各种部分成功的尝试
如果我重写了 Java 中的 equals 方法，为什么还需要重写 hashcode？

我知道每当equals方法在 Java 中被重写那只是一份合同我试图理解这背后的逻辑我正在阅读 Effective Java约书亚布洛赫 https en wikipedia org wiki Joshua Bloch 我遇到了这段
.NET WebAPI 序列化 k_BackingField 肮脏

当我序列化以下内容时 Serializable public class Error public string Status get set public string Message get set public string Erro
JUnit 测试用例中“失败”的实际用途是什么？

JUnit 测试用例中失败的实际用途是什么我发现它很有用的一些案例标记一个不完整的测试因此它会失败并警告您直到您完成它确保抛出异常 try do stuff fail Exception not thrown catch Ex
在 Postman 中请求 Azure AD B2C 的访问令牌

我怎样才能请求Access Token in Postman https www getpostman com 反对Azure AD B2C https learn microsoft com en us azure active dire
如何从 Angular4 的引导选项卡集中获取选定的选项卡？

我有一组根据输入数据动态创建的选项卡我想做的是能够找出当前选择了哪个选项卡在下面的示例代码中我有一个选项卡控件在所有这些控件的下面我有一个按钮单击该按钮将删除选定的选项卡我试图保持这个相对简单它可能看起来做作但我希望它能说
当'hibernate.dialect'未设置hibernate4 tomcat7时连接不能为空

我遵循了一些教程以便使用 spring hibernate 设置一个在 tomcat 上运行的 Web 应用程序当尝试运行我的应用程序时我收到错误当 hibernate dialect 未设置时连接不能为空我的 hibernate
是否可以在没有 CSR 并使用旧私钥的情况下颁发证书

我对使用 WHM cPanel 进行现有 Comodo 扩展验证证书的 SSL 续订过程中的某些内容感到困惑我相信 Comodo 已向我们颁发了替换证书而无需为他们提交 CSR 我说我相信是因为有 3 个人可以访问该服务器的 WHM
用于从 NuGet Install.ps1/Uninstall.ps1 脚本中处理 Visual Studio 对象模型的 PowerShell 模块

我正在尝试创建一个 NuGet 包其中包含托管程序集和非托管本机 DLL 二进制文件并且还支持多个平台 x86 x64 为了更好地理解如何正确处理这个问题我查看了官方发布的几个具有类似要求的软件包努盖特饲料 http nuget
共享照片库中的图像时出现 iOS 共享扩展问题

下面是我用来在 ShareViewController m 中共享图像的代码 NSExtensionItem item self extensionContext inputItems objectAtIndex i NSItemProvi
如何清理被黑的 WordPress 网站

我在 WordPress 中开发了一个相对简单的网站实际上它位于我的主要主机的子域中因为它仍在建设中我不确定我是否有一个健康的备份但昨天我看到有人受到了损害下面的消息出现在每个页面的上部无法连接到数据库服务器无法找到数据库
使用 Jenkins 中的 Email-ext 插件在邮件正文中显示 HTML 页面

我是 Jenkins 的新手我想知道如何在邮件正文而不是附件中显示成功构建后生成的 HTML 报告而不是 HTML 代码我想知道我应该遵循的确切步骤以及我可能的果冻模板的内容应该是什么更深入地观察plugin https wik
UITableView 删除并重新加载单元格

我正在删除 UITableView 中的一些行如下所示 tableView deleteRowsAtIndexPaths toDelete withRowAnimation UITableViewRowAnimationAutomatic
ASP.NET Core：带有逗号分隔值列表的复杂模型

我们的请求模型随着 API 日益复杂的增长而不断增长我们决定使用复杂类型而不是简单类型作为操作参数一种典型的类型是IEnumerable对于逗号分隔值例如items 1 2 3 5 我们使用中提供的解决方法解决了从字符串转换为 IEn
纯C语言的异常处理库

是否有一些用于异常处理的跨平台 C 库在 C 中实现 try catch 我也在寻找如何在 C 中实现它的文档如何屏蔽中断或类似的内容你可以试试异常4c http code google com p exceptions4c 它是 A
ILDasm、mscorlib 和 System.Runtime 反编译差异取决于目录

我一直在玩 ILDasm 并注意到反编译C Windows Microsoft NET Framework v4 0 30319 System Runtime dll 36KB 只是返回一个清单文件反编译C Program Files
是否有图中社区检测算法的实现？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找社区检测算法的实现例如 Girvan Newman 算法 2002 我访问了该领域的几位研
XML 文件中的特殊字符 - 使用 DOM API 进行处理

我有一个 XML 格式的文件仅包含根开始标签和结束标签以及根的子标签子级的文本元素包含与符号在 XML 中为了使文档有效不允许使用此符号当我尝试使用 Java 中的 DOM API 和 XML 解析器处理该文件时出现解析错误

XML 文件中的特殊字符 - 使用 DOM API 进行处理

XML 文件中的特殊字符 - 使用 DOM API 进行处理 的相关文章

随机推荐

热门标签

XML 文件中的特殊字符 - 使用 DOM API 进行处理的相关文章