jTidy 和 TagSoup 文档

2024-01-13

我正在寻找 TagSoup 和 jTidy 库的文档(如果可能的话,官方文档)。

我想使用这个库来操作 html“tagsoup”文件,其中包含 xml 标签,这些标签具有混合在 html(html、xhtml 或 html5)标签之间的不同命名空间。

我已经测试了 HTMLCleaner、NekoHTML 和 Jericho,但除了清除文件的最简单示例之外,我没有找到 jTidy 和 TagSoup 的文档。

我需要有关操作内容、替换标签、提取信息等的文档...

Thanks

笔记: 测试了所有选项后,我使用了StAX / Woodstox :

  • http://wiki.fasterxml.com/WoodstoxHome http://wiki.fasterxml.com/WoodstoxHome

  • https://en.wikipedia.org/wiki/StAX https://en.wikipedia.org/wiki/StAX

  • https://docs.oracle.com/javase/tutorial/jaxp/stax/using.html https://docs.oracle.com/javase/tutorial/jaxp/stax/using.html


tagoup-friends google group 上类似问题的答案可能会有所帮助:

TagSoup 的文档 http://groups.google.com/group/tagsoup-friends/browse_thread/thread/636a80dbd08ce27e

您可能已经看过它们,但 JTidy 的 javadoc 可以在这里找到:http://jtidy.sourceforge.net/apidocs/index.html http://jtidy.sourceforge.net/apidocs/index.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

jTidy 和 TagSoup 文档 的相关文章

随机推荐