Java：转义 XML 文本内容而不是整个文本

2023-12-08

我想发送下面的 XML 请求。文本内容应该被转义，但标签不应该被转义。

我试过了使用下面的转义逻辑。
String str = escapeXml11(req);

然而，我的整个请求都被逃脱了。因此，它不再是有效的 XML。

我原来的字符串：

String req =
"<request>\r\n" 
  + " <Products>\r\n" 
    + " <Product>\r\n" 
      + " <ProductName>H < M</ProductName>\r\n" 
      + " <quantity>1</quantity>\r\n" 
      + " <totalProductCost>17.03</totalProductCost>\r\n" 
    + " </Product>\r\n" 
  + " </Products>\r\n" 
+ "</request>";

逃脱后：

&lt;request&gt;
    &lt;ProductName&gt;H &lt; M&lt;/ProductName&gt;
    &lt;quantity&gt;1&lt;/quantity&gt;
    &lt;totalProductCost&gt;17.03&lt;/totalProductCost&gt;
&lt;/request&gt

预期结果：

<request>
    <ProductName>H &lt; M</ProductName>
    <quantity>1</quantity>
    <totalProductCost>17.03</totalProductCost>
</request>

如何只转义文本内容？

所以这个问题的根源是第三方提供给你的“XML”格式不正确。

<request>
  <Products>
    <Product>
      <ProductName>H < M</ProductName>
      <quantity>1</quantity>
      <totalProductCost>17.03</totalProductCost>
    </Product>
  </Products> 
</request>

要纠正此问题，您需要将"H < M" to "H < M"。对于人类来说很容易做到这一点，如果人类必须做很多这样的事情，则模精度会出现问题。但实现自动化却很困难。

显然，仅仅调用转义方法是行不通的。如果不解析 XML，转义方法无法确定需要转义的内容。（像这样的方法escapeXml11仅当整个字符串需要转义时才有效。）

普通的 XML 解析器会看到"< M"尝试将其视为元素标签的开始。然后它会看到下一个"<"...和错误。为了进一步进行，它必须回溯到"< M"并治疗"<" 仿佛逃脱了.

我知道有一种 HTML / XML 解析器 (JSoup) 可以处理错位的情况"<"人物。但是，如果我理解正确，那么对于您的用例来说，它会以错误的方式处理这个问题。而不是治疗"< M"作为数据，它将把它变成一个开始标签：

<request>
  <Products>
    <Product>
      <ProductName>H <M></ProductName>
      <quantity>1</quantity>
      <totalProductCost>17.03</totalProductCost>
    </Product>
  </Products> 
</request>

这给你留下了两种选择：

您可以尝试通过一些模式匹配来检测并修复问题。例如，如果您知道格式错误的数据位于<ProductName>...</ProductName>元素，然后您可以使用正则表达式来搜索这些元素，检查并（如果需要）更正内容，然后替换它。
您可以使用上下文相关的词法分析器为 XML 编写自定义解析器。当解析器看到一个<ProductName>，它将词法分析器切换到处理“的不同模式”<“ 作为数据unless这是开始</ProductName>.

但在您花时间和金钱编写一堆自定义代码来处理这个无效的 XML 之前：

向创建它的第 3 方投诉。他们不应该像这样排放垃圾。他们的软件或数据收集/清理存在缺陷。他们应该修复它。
确保为您支付软件开发和维护费用的人了解这一点。例如，如果您受雇编写一些处理 XML 的软件，那么这不是 XML。如果客户没有警告您您的软件需要处理格式错误的 XML，那么这就是需求的变化，并且可能（应该）是变化合同的。

另请参阅@Michael Kay 的评论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

specialcharacters

Java：转义 XML 文本内容而不是整个文本的相关文章

从 Bitmap 类创建 .bmp 图像文件

我创建了一个使用套接字的应用程序客户端在其中接收图像并将图像数据存储在 Bitmap 类中谁能告诉我如何创建一个名为我的图像 png or 我的图像 bmp来自此 Bitmap 对象 String base64Code dataInpu
Java 9 中可以使用提前编译吗？

As per JEP 295 http openjdk java net jeps 295 任何 JDK 模块类或用户代码的 AOT 编译都是实验性的 JDK 9 中不支持要使用 AOT 化的 java base 模块用户必须编译该模
我需要显式关闭连接吗？

我持有一个实例MongoClient and DB在我的应用程序中每次我想执行某些操作时我都会调用getCollection 我想知道是否需要显式关闭连接就像connection close 在 JDBC 中强调一下我只有一个Mo
Java 反射：如何检索匿名内部类？

我在另一个类中有一个匿名内部类 SomeClass Both SomeClass class getClasses and SomeClass class getDeclaredClasses 返回空数组我在中找不到一些关于此的提示Cla
在 JavaFX 中拖动未装饰的舞台

我希望将舞台设置为未装饰使其可拖动且可最小化问题是我找不到这样做的方法因为我遇到的示例是通过插入到主方法中的方法来实现的我想通过控制器类中声明的方法来完成此操作就像我如何使用下面的 WindowClose 方法来完成此操作这是
java.lang.UnsupportedOperationException：无法解析索引 13 处的属性：TypedValue{t=0x2/d=0x7f010046 a=-1}

我在 android attrs xml 文件中添加了一个用于不同色调的属性在 styles xml 文件中我为这些属性指定了颜色因此每种样式的它们都不同 Attrs xml
我们必须将 .class 文件放在 Tomcat 目录中的位置

我必须把我的 class文件在 Tomcat 目录中在我的 Java Complete Reference 书中他们告诉将其放入C Program Files Apache Tomcat 4 0 webapps examples WEB
Java中的OR运算(BitSet.class)

如何编写一个程序该程序需要001010101110000100100 011100010001000011000 000000000010000000000100 作为输入位输出将是OR其中 3 个 OR 0 0 0 0 1 1 1
Java 7 中 Object 和 int 的比较

最近我偶然发现了一个问题让我停下来思考对我来说下面的代码应该总是会触发错误但是当我的一位同事问我为什么 Eclipse 没有显示错误时我无法回答任何问题 class A public static void main String
activemq 的优先级

我们目前正在使用 JMS 和 activemq 5 5 1 开发一个应用程序我们想为某些消息定义更高的优先级这将使它们首先被消耗设置生产者和消费者后通过spring 3 1 JMSTemplate 优先级并不能完全发挥作用事实上
使用 Java 通过 HTTP 下载未知长度的文件

我想用java下载一个HTTP查询但是我下载的文件在下载时有一个未确定的长度我认为这将是相当标准的所以我搜索并找到了它的代码片段 http snipplr com view 33805 http snipplr com view 33
wsdl 没有服务元素

我必须使用 WCF Web 服务并获得 WSDL 外部的因此无法控制 WSDL 在 WSDL 定义中我没有找到包含服务端口和地址元素的服务元素 WSDL 中不存在这种情况正常吗这对于 WCF WSDL 来说很常见吗我正在尝试使用轴
链表中的虚拟节点

问什么时候使用它们作业问题列表中的第一个和最后一个节点有时用作列表中的第一个和最后一个节点从未用作列表中的第一个和最后一个节点维基百科说哨兵节点是与链接一起使用的专门指定的节点列表和树作为遍历路径终止符哨兵节点的作用是不
Microsoft JDBC 中的 JTDS 属性相当于什么？

我正在将 JTDS 连接更改为 Microsoft JDBC 并且我看到存在于http jtds sourceforge net faq html http jtds sourceforge net faq htmlMicrosoft JD
如何配置嵌入式 MongoDB 以在 Spring Boot 应用程序中进行集成测试？

我有一个相当简单的 Spring Boot 应用程序它公开一个小型 REST API 并从 MongoDB 实例检索数据对 MongoDB 实例的查询通过基于 Spring Data 的存储库下面的一些关键代码 Main applic
Java 相当于 Python 的 urllib.urlencode（基于 HashMap 的 UrlEncode）

From https stackoverflow com questions 2018026 should i use urllib or urllib2 2018103 2018103 Java 中 Python 的 urllib url
Drools：为什么是无状态会话？

Drools 使用会话来存储运行时数据为此有两种会话无状态和有状态与无状态会话相比有状态会话允许迭代调用并且似乎比无状态会话具有所有优势那么为什么会有无状态会话呢他们服务的目的是什么与有状态会话相比它们的优势是什么谢谢
spring data jpa 过滤 @OneToMany 中的子项

我有一个员工测试实体是父实体并且FunGroup信息子实体这两个实体都是通过employeeId映射我需要一种方法来过滤掉与搜索条件匹配的子实体以便结果仅包含父实体和子实体满足要求员工测试类 Entity name Employe
JSP 和 scriptlet

我知道现在使用 scriptlet 被认为是禁忌没关系我会同意Top Star的话因为我目前只是Java新手到目前为止我听到的是它是为了让设计师的生活更轻松但我想知道这是否与JSP页面的性能有关另一方面如果只是为了让设计
PowerShell-V5 Invoke-Webrequest 添加 2 个标头授权标头和接受接受标头

我正在尝试创建一个脚本该脚本将使用 powershell 和 invoke webrequest 自动升级 NSX 以利用 NSX Manager 的 API 调用我已经完成了脚本但脚本的某些部分我需要检查并匹配响应中的某些数据事实

随机推荐

如何更新表中的行或插入不存在的行？

我有以下计数器表 CREATE TABLE cache key text PRIMARY KEY generation int 我想增加其中一个计数器或者如果相应的行尚不存在则将其设置为零有没有办法在标准 SQL 中没有并发问题的情况
标签内的按钮触发（有时是双触发\双击）

有类似的问题但我没有足够的声誉来发布答案所以我将其作为新问题问题是
dll 的 app.config 中的连接字符串

我创建了一个 C dll 它使用来自的连接字符串应用程序配置文件连接到数据库我在 Web 应用程序 Visual Studio 2013 Windows 7 中使用它该应用程序也连接到数据库并在其中有自己的连接字符串网络配置文件但是
WPF透明边框导致UI停止重绘

作为后续我之前的问题我想知道如何正确使用透明窗如果我将窗口设置为使用透明度 UI 有时会出现停止响应的情况实际发生的情况是 UI 根本没有按其应有的方式更新不出现动画页面似乎无法导航然而如果你观察调试器点击按钮链接等确实有
你能强制将枚举值序列化为整数吗？ [复制]

这个问题在这里已经有答案了可能的重复如何将枚举值序列化为 int Hi all 我想知道是否有一种方法可以强制将枚举值序列化为其整数值而不是其字符串表示形式让您了解一下上下文在严重依赖 Web 服务的 Web 应用程序中我们为所
不能子类化 UIColor 吗？

我正在尝试对 UIColor 进行子类化但我似乎无法弄清楚出了什么问题在我的 PColor h 中 import
为什么“隔空敲击”手势在我的 Unity/MRTK 应用程序中的 HoloLens1 上不起作用？

我有一个 Unity 应用程序我想将其与 Microsoft 混合现实工具包 MRTK 集成当我将 MRTK v2 1 或 v2 2 包添加到 Unity 项目时我可以在 Unity 编辑器中模拟隔空敲击手势并且应用程序会注册该
新信号连接到旧插槽而不是单独的插槽

我正在尝试标记数据跟踪的 x 跨度并使用 tagNames 起始 x 值和结束 x 值填充表我正在使用突出显示对象的字典来跟踪 x 跨度以防以后需要对其进行编辑增加或减少字典将 x 起始值映射到突出显示对象因为 x 起始值应
从 Bigquery 中的时间戳提取日期：一种更好的方法

向 Bigquery 专家提出一个简短的问题以下是使用标准 SQL 从 Bigquery 中的时间戳中提取日期的两种方法 standardSQL 1 DATE TIMESTAMP MILLIS CAST timestamp AS INT6
当我需要引用自身时如何设计结构[重复]

这个问题在这里已经有答案了 My 上一个问题告诉我 Rust 不能在结构中引用自身所以我的问题是当我需要引用自身时如何设计一个结构体我们可以以这个结构体为例 struct SplitByChars lt a gt seperator
当用户按下设备音量键时，搜索栏拇指位置发生变化

我使用搜索栏来控制设备的音量我只需在触摸板上拖动搜索栏的拇指即可更改设备的音量但是当用户按下音量侧面键时我需要相应地设置搜索栏拇指位置我该怎么做请告诉我 Thanks 我通过重写 onkeydown 事件得到了解决方案 Ove
Pygame set_alpha 不适用于尝试的背景淡入淡出

我一直在尝试创建一个简短的代码用于可以淡入和从黑色淡出的项目但由于某种原因只有淡入功能在工作而淡出功能或多或少被跳过通过给他们参数我确认问题出在第二个函数中并且透明度根本没有改变这是我的代码 import pygame sc
未找到带点（IP 地址）的路由，返回 404

I use Lumen 5 4 这就是我的路线设置方式 app gt get ip ip GeoIpController class show The ip 路由参数应该是一个IP地址其中带点然而当路线中有点时似乎就会出现问题它返
CharBuffer 位于内存映射的 ByteBuffer 之上，无需使用大量堆空间

我正在编写一个java代码来在一个大的txt文件 6 8Gb 中搜索电子邮件地址和密码我已经编写了代码它可以处理 200Mb txt 文件并给出输出但是当我输入 500Mb 文件时它显示以下错误 Exception in threa
TensorFlow：“ValueError：没有为任何变量提供梯度”

我正在张量流中实现 DeepMind 的 DQN 算法并在我调用的线路上遇到此错误optimizer minimize self loss ValueError No gradients provided for any variable
PHP 表单 - 提交时停留在同一页面

我有一个位于文件中的 PHP 表单contact html 该表格是从文件处理的processForm php 当用户填写表单并单击提交时 processForm php发送电子邮件并引导用户至 processForm php该页面上有一条
将多个 IIS7 重写规则（重定向）合并为一个

我使用iis7的URL重写模块来完成几件事 301重定向规则从非www到www 301 将规则 info 重定向到 com 已移至我的域的 com 版本 301 从旧页面重定向规则例如 page name asp 改为 page name
Android Facebook 风格幻灯片

新的 Facebook 应用程序及其导航非常酷我只是想看看如何在我的应用程序中模拟它任何人都知道如何实现它单击左上角按钮后页面会滑动并显示以下屏幕 Youtube 视频我自己尝试过这个我能找到的最好方法是使用 FrameLayo
如何在 rubymine 中停止/终止服务器（开发）

这里是新手我在 ruby mine 中创建了一个 Rails 项目来运行公共文件夹中的默认 index html 我按下了 shift F10 键这与终端的 Rails 服务器相同这就是我得到的 home bubble rvm rub
Java：转义 XML 文本内容而不是整个文本

我想发送下面的 XML 请求文本内容应该被转义但标签不应该被转义我试过了使用下面的转义逻辑 String str escapeXml11 req 然而我的整个请求都被逃脱了因此它不再是有效的 XML 我原来的字符串 String

Java：转义 XML 文本内容而不是整个文本

Java：转义 XML 文本内容而不是整个文本 的相关文章

随机推荐

热门标签

Java：转义 XML 文本内容而不是整个文本的相关文章