如何在jsoup解析中保留大小写?

2023-11-30

我正在使用 jsoup 来解析一些 HTML 内容。解析 HTML 内容后,它将驼峰式属性更改为小写,例如<svg viewBox='XXXX'> to <svg viewbox='XXXX'>.

有人可以建议我如何在使用 jsoup 1.8.1 解析 html 内容时保留大小写吗?


我刚刚发布jsoup 1.10.1其中包括对保留标签和/或属性大小写的支持。你可以用以下命令控制它解析设置。默认情况下,HTML 解析器将继续对标签和属性进行小写标准化,而 XML 解析器将保留它们。您可以在创建解析器时指定这些设置。

要使用XML解析器(默认情况下保留大小写):

Document doc = Jsoup.parse(xml, baseUrl, Parser.xmlParser());

要使用HTML解析器并将其设置为保留大小写:

Parser parser = Parser.htmlParser();
parser.settings(new ParseSettings(true, true)); // tag, attribute preserve case
Document doc = parser.parseInput(html, baseUrl);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在jsoup解析中保留大小写? 的相关文章

随机推荐