如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？

2024-05-03

我正在开发一个系统，该系统应该能够读取任何（或至少是任何格式良好的）XML 文件，操作一些节点并将它们写回到同一个文件中。我希望我的代码尽可能通用，但我不希望

对代码中任何位置的架构/文档类型信息的硬编码引用。文档类型信息位于源文档中，我想准确保留该文档类型信息，而不是在我的代码中再次提供它。如果文档没有 DocType，我不会添加。除了我的几个节点之外，我根本不关心这些文件的形式或内容。
自定义 EntityResolvers 或 StreamFilters 来省略或以其他方式操纵源信息（遗憾的是，命名空间信息似乎无法从声明它的文档文件中访问，但我可以使用更丑陋的 XPath 进行管理）
DTD 验证。我没有引用的 DTD，我不想包含它们，并且在不了解它们的情况下完全可以进行节点操作。

目的是使源文件完全不变，除了通过 XPath 检索的更改的节点之外。我想摆脱标准 javax.xml 的东西。

到目前为止我的进展：

    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

    factory.setAttribute("http://xml.org/sax/features/namespaces", true);
    factory.setAttribute("http://xml.org/sax/features/validation", false);
    factory.setAttribute("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
    factory.setAttribute("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);

    factory.setNamespaceAware(true);
    factory.setIgnoringElementContentWhitespace(false);
    factory.setIgnoringComments(false);
    factory.setValidating(false);
    DocumentBuilder builder = factory.newDocumentBuilder();
    Document document = builder.parse(new InputSource(inStream));

这成功地将 XML 源加载到 org.w3c.dom.Document 中，忽略 DTD 验证。我可以进行替换，然后使用

    Source source = new DOMSource(document);
    Result result = new StreamResult(getOutputStream(getPath()));

    // Write the DOM document to the file
    Transformer xformer = TransformerFactory.newInstance().newTransformer();
    xformer.transform(source, result);

把它写回来。这几乎是完美的。但无论我做什么，Doctype 标签都消失了。在调试时，我看到解析后的Document对象中有一个DeferredDoctypeImpl [log4j:configuration: null]对象，但它不知何故错误，为空或被忽略。我测试的文件是这样开始的（但其他文件类型也是如此）：

#37197;置系统“log4j.dtd”>

[...]

我认为有很多（简单？）方法涉及 hack 或将额外的 JAR 引入项目。但我宁愿将它与我已经使用的工具一起使用。

抱歉，现在使用 XMLSerializer 而不是 Transformer 得到了它......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

xml

DTD

doctype

如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？的相关文章

使用 Ant 将非代码资源添加到 jar 文件

我正在将 java 应用程序打包成 jar 文件我正在使用 ant 和 eclipse 我实际上需要在 jar 中直接在根文件夹下包含几个单独的非代码文件 xml 和 txt 文件而不是与代码位于同一位置我正在尝试使用includes
如何在 Antlr4 中为零参数函数编写语法

我的函数具有参数语法如下面的词法分析器和解析器 MyFunctionsLexer g4 lexer grammar MyFunctionsLexer FUNCTION FUNCTION NAME A Za z0 9 DOT COMMA L
GWT - 如何组织项目以拥有多个网页以及它们之间的导航

我是 GET 的新手顺便说一句它给我留下了深刻的印象并且发现它对于像我这样熟悉 C NET 桌面技术并愿意编写 Web 应用程序的人来说非常有吸引力我根据 GWT Eclipse 向导生成的示例启动了自己的项目该项目生成带有面板的
org.hibernate.QueryException：无法解析属性：文件名

我正在使用休眠Criteria从列中获取值filename在我的桌子上contaque recording log 但是当我得到结果时它抛出异常 org hibernate QueryException 无法解析属性文件名 com co
大数据使用什么数据结构

我有一个包含一百万行的 Excel 工作表每行有 100 列每行代表一个具有 100 个属性的类的实例列值是这些属性的值哪种数据结构最适合在这里使用来存储数百万个数据实例 Thanks 这实际上取决于您需要如何访问这些数据以及您想要
如何在代理后面安装 Eclipse Neon

对于 Neon Eclipse 附带了一个安装程序我在安装程序中找不到任何配置菜单我的java版本是 java version java version 1 8 0 72 Java TM SE Runtime Environment b
当客户端关闭连接时，Spring StreamingResponseBody 请求线程未清理

我在控制器中有一个端点它返回一个StreamingResponseBody 用于向客户端发送文件其代码大致如下 RestController RequestMapping value api public class Controlle
来自十六进制代码的 Apache POI XSSFColor

我想将单元格的前景色设置为十六进制代码中的给定颜色例如当我尝试将其设置为红色时 style setFillForegroundColor new XSSFColor Color decode FF0000 getIndexed 无论我在
什么时候可以在 Java 中使用 Thead.stop() ？

Thread stop 的 Java 文档听起来好像如果您调用 Thread stop 世界就会终结已弃用这种方法本质上是不安全的停止线程 Thread stop 导致它解锁所有已锁定的监视器作为未经检查的 ThreadDeath
Jackson XML ArrayList 输出具有两个包装器元素

我在 Jackson 生成的 XML 输出中得到了两个包装器元素我只想拥有一个我有一个 Java bean Entity Table name CITIES JacksonXmlRootElement localName City pu
XML-RPC 和 SOAP 有什么区别？

我从来没有真正理解为什么 Web 服务实施者会选择其中之一 XML RPC 通常出现在较旧的系统中吗任何有助于理解这一点的帮助将不胜感激差异 SOAP 更强大并且更受软件工具供应商 MSFT NET Java 企业版等的青睐 SOA
删除Android所有语言中的字符串

我有一个包含多个翻译的应用程序我想删除一些字符串我怎样才能重构并删除它们一次例如在默认情况下strings xml文件并自动将删除传播到其他翻译的其他 strings xml 文件您可以通过 Android Studio 中的翻译
生成的序列以 1 开头，而不是注释中设置的 1000

我想请求一些有关 Hibernate 创建的数据库序列的帮助我有这个注释下面的代码在我的实体类中以便为合作伙伴表提供单独的序列我希望序列以 1000 开头因为我在部署期间使用 import sql 将测试数据插入数据库并且我希
在另一个模块中使用自定义 gradle 插件模块

我正在开发一个自定义插件我希望能够在稍后阶段将其部署到存储库因此我为其创建了一个独立的模块在对其进行任何正式的 TDD 之前我想手动进行某些探索性测试因此我创建了一个使用给定插件的演示模块到目前为止我发现执行此操作的唯一方法
Java：如何为山区时间创建 TimeZone 对象？

必须不禁用夏令时嗯在这个清单 http en wikipedia org wiki List of tz database time zones在 zoneinfo 时区名称中有很多声称是山地时间找到最适合您想要的那个然后使用它
GWT 2.3 开发模式 - 托管模式 JSP 编译似乎不使用 java 1.5 兼容性

无法编译 JSP 类生成的 servlet 错误 DefaultMessage 上次更新 0 日期中 0 时间 HH mm ss z 语法错误注释仅在源级别为 1 5 时可用在尝试以开发模式在 Web 浏览器中打开我的 gwt 模
Java实现累加器类，提供Collector

A Collector具有三种通用类型 public interface Collector
流中的非终结符 forEach() ？

有时在处理 Java Stream 时我发现自己需要一个非终端 forEach 来触发副作用但不终止处理我怀疑我可以用 map item gt f item 之类的方法来做到这一点其中方法 f 执行副作用并将项目返回到流中但这似乎
org.apache.commons.net.io.CopyStreamException：复制时捕获 IOException

我正在尝试使用以下方法中的代码将在我的服务器中创建的一些文件复制到 FTP 但奇怪的是我随机地低于错误我无法弄清楚发生了什么 Exception org apache commons net io CopyStreamException
Spring表单ModelAttribute字段验证避免400 Bad Request错误

我有一个ArticleFormModel包含正常发送的数据html form由 Spring 使用注入 ModelAttribute注释即 RequestMapping value edit method RequestMethod PO

随机推荐

比较具有不同顶点数的图中的社区

我正在根据通信数据图计算鲁汶社区其中顶点代表大型项目的执行者这些图表代表不同的通信方式例如电子邮件电话我们想尝试从通信数据中识别表演者团队由于表演者对不同的通信方法有不同的偏好因此图的大小不同并且可能有一些独特的顶点而这些
如何在 Mac 上更改 PHP-FPM 端口

我没有使用 php 或 php fpm 但它占用了端口 9000 我需要端口 9000 我想更改端口我把它改成了 etc php fpm conf and etc php fpm d www conf 听 127 0 0 1 9005 仍
轻量级核心数据迁移后，如何为现有实体的新属性设置默认值？

我已经成功完成了核心数据模型的轻量级迁移我的自定义实体 Vehicle 收到了一个新属性 tirePressure 它是 double 类型的可选属性默认值为 0 00 当从商店中获取旧车辆在迁移发生之前创建的车辆时其 tir
不可变子类

我目前正在开发一个多线程框架为了避免副作用我想要求框架操作的所有数据都必须是不可变的那么Java中是否存在一种方法来指定我希望给定类的所有子类或实现给定接口的所有类都是不可变的我建议调查一下变异性检测器 http code goog
使用基类指针创建对象时缺少派生类析构函数

在下面的代码示例中未调用派生类析构函数知道为什么吗我有一个具有虚函数的基类现在我使用基类指针来创建派生类的新对象我的理解是当派生类对象被销毁时首先调用派生类的析构函数然后调用基类但是我只看到基类的析构函数被调用有谁知道我
如何将接口类型传递给过程

如何将接口类型传递给过程参数 type Hello PortType interface ISoapInvokable 243CBD89 8766 F19D 38DF 427D7A02EAEE function GetDeneme s st
如何使用 javascript 从 p:selectOneRadio 获取所选选项

如何获取其中选择的电台p selectOneRadio使用 javascript jquery 自从p selectOneRadio不使用单选标签我不知道如何使用 CSS 选择器获取选中的选项
MySQL：选择 DISTINCT / UNIQUE，但返回所有列？

SELECT DISTINCT field1 field2 field3 FROM table 我正在尝试完成以下 SQL 语句但我希望它返回所有列这可能吗像这样的东西 SELECT DISTINCT field1 FROM tabl
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
Python - ValueError：以 10 为基数的 int() 的文字无效：''

求助当我尝试从字符串中提取整数时我不断收到 ValueError invalidliteral for int with base 10 from string import capwords import sys os import
如何使用 TortoiseHg (Mercurial) 下载代码

我正在尝试下载代码世界上最差的stackoverflow克隆 http code google com p theworldsworststackoverflowclone source checkout 起初我尝试过Tortoise SV
如何在Python可视化代码扩展中预选（设置默认）Python解释器？

The small problem is when I press Ctrl F5 I want the code to be run immediately but I have to Select environment Python
iOS：无法让蓝牙管理器工作

警告我知道私有框架不会在 App Store 中流行我尝试使用 BluetoothManager 框架来让我 1 检查设备上是否启用了蓝牙 2 如果未启用则将其打开我可以按照找到的说明成功加载蓝牙管理器here https stac
将 frontend-maven-plugin 从 Maven 迁移到 gradle

我有一个com github eirslett frontend maven plugin in my maven项目
ng-focus 发射两次而 ng-blur 从不发射

到目前为止我对 Angular 已经有了相当的经验但这似乎是在较低级别上发生的 DOM 事件传播方式的事情由于某种原因在我的申请的一部分中我有ng focus and ng blur一样的input 但是ng focus事件触发两
使用 powershell 从远程服务器获取服务状态

如何获取需要用户名和密码登录的远程计算机的服务状态我正在尝试使用以下代码找到解决方案 serviceStatus get service ComputerName machineName Name service 默认语法为get ser
禁用 jquery-chosen 下拉菜单

我有一个正在使用的选择 div选择jquery插件 http harvesthq github io chosen 设计样式并添加功能最值得注意的是搜索 div 看起来像这样
如何调整jupyterlab笔记本中滚动输出高度的大小？

有没有办法调整 jupyterlab 笔记本中滚动输出高度的大小潜在的解决方案但需要 HTML CSS 知识我从这个问题中找到了这个片段调整 ipython 笔记本输出窗口的大小 https stackoverflow com que
NLTK 中的无监督 HMM 训练

我只是想进行非常简单的无监督 HMM 训练nltk http www nltk org 考虑 import nltk trainer nltk tag hmm HiddenMarkovModelTrainer from nltk corpu
如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？

我正在开发一个系统该系统应该能够读取任何或至少是任何格式良好的 XML 文件操作一些节点并将它们写回到同一个文件中我希望我的代码尽可能通用但我不希望对代码中任何位置的架构文档类型信息的硬编码引用文档类型信息位于源文档中我想

如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？

如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？ 的相关文章

随机推荐

热门标签

如何在编写 XML 文件时忽略 DTD 验证但保留 Doctype？的相关文章