如何从字符串中的 XML 加载 org.w3c.dom.Document？

2023-12-13

我有一个字符串形式的完整 XML 文档，并且想要一个Document目的。谷歌会发现各种各样的垃圾。最简单的解决方案是什么？（在Java 1.5中）

Solution谢谢马特·麦克明，我已经决定了这个实现。它对我来说具有适当的输入灵活性和异常粒度。（很高兴知道错误是否来自格式错误的 XML -SAXException- 或者只是糟糕的 IO -IOException.)

public static org.w3c.dom.Document loadXMLFrom(String xml)
    throws org.xml.sax.SAXException, java.io.IOException {
    return loadXMLFrom(new java.io.ByteArrayInputStream(xml.getBytes()));
}

public static org.w3c.dom.Document loadXMLFrom(java.io.InputStream is) 
    throws org.xml.sax.SAXException, java.io.IOException {
    javax.xml.parsers.DocumentBuilderFactory factory =
        javax.xml.parsers.DocumentBuilderFactory.newInstance();
    factory.setNamespaceAware(true);
    javax.xml.parsers.DocumentBuilder builder = null;
    try {
        builder = factory.newDocumentBuilder();
    }
    catch (javax.xml.parsers.ParserConfigurationException ex) {
    }  
    org.w3c.dom.Document doc = builder.parse(is);
    is.close();
    return doc;
}

哇那儿！

这段代码存在一个潜在的严重问题，因为它忽略了在String（默认为 UTF-8）。你打电话时String.getBytes()平台默认编码用于将 Unicode 字符编码为字节。因此，解析器可能认为它正在获取 UTF-8 数据，而实际上它正在获取 EBCDIC 或其他数据……这不太好！

相反，请使用采用 InputSource 的 parse 方法，该方法可以使用 Reader 构造，如下所示：

import java.io.StringReader;
import org.xml.sax.InputSource;
…
        return builder.parse(new InputSource(new StringReader(xml)));

这看起来似乎没什么大不了的，但对字符编码问题的无知会导致类似于 2000 年后的阴险代码腐烂。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何从字符串中的 XML 加载 org.w3c.dom.Document？的相关文章

将 Hibernate 对象序列化为 JSON 时抛出异常

好吧我正在使用 Hibernate 将一个小型数据库加载到一些表示表的类并与数据库交互一切都很好我真的可以看到所有结果而且我没有任何空字段所有这些都已被使用这里我展示了主类表 import javax persistenc
MongoTemplate upsert - 从 pojo 进行更新的简单方法（哪个用户已编辑）？

这是一个简单的 pojo public class Description private String code private String name private String norwegian private String en
Google App Engine with Java - 运行 javac.exe 编译器时出错

在 Windows XP 上刚刚下载并解压谷歌应用程序引擎java sdk to C Program Files appengine java sdk 我已经安装了jdk C Program Files Java jdk1 6 0 20
使用 Java 在 WebDriver 中按 Ctrl+F5 刷新浏览器

我已经使用 java 刷新了 WebDriver 中的浏览器代码如下 driver navigate refresh 如何使用 Java 在 WebDriver 中按 Ctrl F5 来做到这一点我认为您可以使用 WebDriver 和
解决 Java Checkstyle 错误：名称 'logger' 必须匹配模式 '^[A-Z][A-Z0-9]*(_[A-Z0-9]+)*$'

使用 Eclipse Checkstyle 插件我看到以下错误名称 logger 必须匹配模式 A Z A Z0 9 A Z0 9 我通过更改解决了此错误 private static final Logger logger Logger
在哪里可以获得有关 Java FitNesse 和 Slim 的一些教程？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
定期更新 SWT 会导致 GUI 冻结

Problem 当 GUI 字段定期更新时 SWT 会冻结我想要一个基于 SWT 的 GUI 其中文本字段的值会定期递增最初我从单独的线程访问 textField 导致抛出异常线程 Thread 0 org eclipse swt S
容器中的 JVM 计算处理器错误？

最近我又做了一些研究偶然发现了这一点在向 OpenJDK 团队抱怨之前我想看看是否有其他人观察到这一点或者不同意我的结论因此众所周知 JVM 长期以来忽略了应用于 cgroup 的内存限制众所周知现在从 Java 8 更新某
Java-如何将黑白图像加载到二进制中？

我在 FSE 模式下使用 Java 和 swing 我想将完全黑白图像加载为二进制格式最好是二维数组并将其用于基于掩码的每像素碰撞检测我什至不知道从哪里开始过去一个小时我一直在研究但没有找到任何相关的东西只需将其读入Buffer
从 @JsonProperty 值获取枚举常量

我有一个标有 JsonProperty 的枚举用于使用 Jackson 进行 JSON 序列化反序列化并且希望获取给定字符串 JsonProperty 的枚举值 public enum TimeBucket JsonProperty
Intellij 中的 Google OR-Tools：UnsatisfiedLinkError

我正在建立一个应该使用 Google OR Tools 的 java 框架下面的代码编译成功但在运行时抛出异常 Exception in thread main java lang UnsatisfiedLinkError com go
发生错误。请参阅日志文件 - eclipse juno

每当我启动 Eclipse Juno 时都会出现错误发生错误请查看日志文件 C Program Files eclipse configuration 1362989254411 log 有的网站说卸载jdk重新安装我这样做了但没
我想在java中使用XQuery进行Xml处理

我想用XQuery用于从 java 中的 Xml 获取数据但我没有得到需要为此添加哪个 Jar 我在谷歌上搜索了很多但没有得到任何有用的例子例如我得到以下链接 https docs oracle com database 121 AD
当您在数组列表上调用remove(object o)时，它如何比较对象？

当您在 java 中的数组列表上调用remove object o 时它如何比较对象以找到要删除的正确对象它使用指针吗或者它使用 Comparable 接口来比较对象吗 ArrayList remove 依赖于对象的实现Equal方法
xsd 类型的 JAXB（取消）编组：xsd:base64Binary 和 xsd:hexBinary

JAXB 映射两者xsd base64Binary and xsd hexBinary类型为byte 鉴于我有一个模式一个 DOM 元素来表示这些类型例如
为什么我的代码会产生错误：该语句没有返回结果集[重复]

这个问题在这里已经有答案了我正在从 Microsoft SQL Server Studio 执行以下查询该查询工作正常并显示结果 SELECT INTO temp table FROM md criteria join WHERE us
使用 secp256r1 曲线和 SHA256 算法生成 ECDSA 签名 - BouncyCastle

我正在尝试使用带有 secp256r1 曲线 P256 的 ECDSA 和用于消息哈希的 SHA256 算法生成签名我也在使用 Bouncy Castle 库下面的代码 public class MyTest param args pu
Java：由 HTTP 连接创建的等待连接线程存活时间很长

我有一个服务器端代码用于检查 SOAP 服务是否已启动代码如下 String response while response length 0 try final URL url new URL DummySoapServiceURL
XSL字符串多重替换功能

如何让这个函数进行多重替换经验替换aaa with 111并替换bbb with 222 etc
春季 CORS。在允许的来源中添加模式

查看CORS的弹簧指南以下代码启用所有允许的来源 public class MyWebMVCConfigurer extends WebMvcConfigurerAdapter Override public void addCorsMa

随机推荐

有什么理由使用自动实现的属性而不是手动实现的属性？

我理解属性相对于字段的优势但我觉得使用自动实现的属性而不是手动实现的属性除了使代码看起来更简洁之外并没有真正提供任何优势我感觉使用起来更舒服 private string postalCode public string PostalC
sra（算术右移）与 srl（逻辑右移）

请看一下这两段伪汇编代码 1 li t0 53 sll t1 t0 2 srl t2 t0 2 sra t3 t0 2 print t1 print t2 print t3 2 li t0 53 sll t1 t0 2 srl t2 t0
控制台中的 Bootstrap css 错误

I downloaded the boostrap min css version from here But in the console its showing me a lot of errors Check the image 我正
如何处理“CrossThread MessagingException”？

我有一个简单的代码可以通过标签组件在 GUI 中显示时间序列这段代码位于定时器的tick事件中有时我收到 Microsoft VisualStudio Debugger Runtime CrossThreadMessagingExc
Rails 4 中的救援_来自 ActionController::RoutingError

我有以下错误 ActionController RoutingError No route matches GET images favicon ico 我想显示不存在的链接的错误 404 页面我怎样才能做到这一点 In applicat
Ninject 在 Web 服务中注入服务接口

我的项目中有一个 Web 服务用于将 json 数据返回给 ajax 调用注入我的 ClientService 在常规页面上工作正常但如何让它在 Web 服务中工作 NinjectWebCommon cs private static
Chart.js 替换所有数据

我对 Chart js 有疑问首先我设置一个数据然后当参数更改时我想重新绑定整个图表这项工作有效但它就像旧数据仍然落后于新数据的图表首先 gt chart Line data options 在一个事件中 gt chart L
Python-捕获文本中特定字符串后的下一个单词

我试图只捕获特定字符串后的 1 个单词例如 import re my string I love Apple juice it is delicious print my string split I love 1 1 我得到结果 App
当我们使用数组名称而不是扩展运算符时有什么区别？

如果我使用有什么区别 var numbers 1 2 3 var mainArray numbers length gt 1 numbers 而不是这个 var numbers 1 2 3 var mainArray numbers len
Python 从无限循环线程返回值

因此对于我的程序我需要检查本地网络上的客户端该客户端正在运行 Flask 服务器该 Flask 服务器返回一个可以更改的数字现在为了检索该值我使用 requests 库和 BeautifulSoup 我想在脚本的另一部分使用检索
Grunt 0.4 less 任务：如何不连接目标文件

我想从相应的 less 文件生成 css 部分文件我使用 npm 提供的最新版本电子邮件受保护电子邮件受保护在 Grunt 0 4 版本之前我可以简单地指定模式 htdocs less less作为来源 htdocs css cs
如何在 cPanel 子域上设置 laravel 项目？

我是 cPanel 的新手想知道哪种是在子域上托管 Laravel 项目的最佳方式我已经创建了子域其根目录位于主目录中我的客户在 public html 文件夹中有其他网站我不想弄乱它们我应该如何进行另外如果您能告诉我在持续
如何在 C# 中自动化后关闭 Outlook

我正在创建一个将 Msg Outlook 文件转换为 pdf 的程序我所做的是将 Msg 文件导出到 Html 然后将 Html 输出转换为 pdf 这是我的代码 Microsoft Office Interop Outlook Appl
如何将 super 赋值给变量？

我想做以下事情 public class Sub extends Super public Sub Super underlying if underlying null underlying super this line is ille
将图像插入数据库

我创建了一个表单允许用户将图像上传到服务器中的文件夹如何将图像插入数据库我在名为 blog 的数据库中创建了一个名为 upload 的表并创建了一个名为 image 且值为 MediumBLOB 的行如果上面听起来不合逻辑我如何
如何在seaborn/matplotlib中绘制和注释分组条

我有一个如下所示的数据框我使用条形图来表示每行的订阅者这就是我所做的 data channels sort values subscribers ascending False head 5 chart sns barplot x na
代码覆盖率 GCov 不适用于 XCode 4.2 和 iOS SDK 5

我一直试图让 GCov 在 Lion 上使用 iOS SDK 5 0 与 Xcode 4 2Build 4D199 配合使用但没有成功有人有这样的运气吗我使用 Google Tools For Mac 进行单元测试并在 libpro
让放置在 IDE 中我的控件上的组件成为我的控件的子级

我有一个后代TWinControl 事实上目前只是这样我将它注册为 IDE 中的组件 type TGroupPanel class TWinControl 但是当我将其他组件放在其上时它们会附加到表单而不是我的控件换句话说我希望
将元素拉伸到自动计算网格的末尾，而不仅仅是显式网格

在 CSS 网格中您可以使用grid column 1 1将一个元素拉伸到整个explicit网格但是如果添加新元素并且网格自动具有比明确指定的列更多的列则不会产生相同的效果我可以用什么值来代替 1这将迫使项目一直延伸到网格的末尾
如何从字符串中的 XML 加载 org.w3c.dom.Document？

我有一个字符串形式的完整 XML 文档并且想要一个Document目的谷歌会发现各种各样的垃圾最简单的解决方案是什么在Java 1 5中 Solution谢谢马特麦克明我已经决定了这个实现它对我来说具有适当的输入灵活性和异常粒

如何从字符串中的 XML 加载 org.w3c.dom.Document？

如何从字符串中的 XML 加载 org.w3c.dom.Document？ 的相关文章

随机推荐

热门标签

如何从字符串中的 XML 加载 org.w3c.dom.Document？的相关文章