我正在寻找 TagSoup 和 jTidy 库的文档(如果可能的话,官方文档)。
我想使用这个库来操作 html“tagsoup”文件,其中包含 xml 标签,这些标签具有混合在 html(html、xhtml 或 html5)标签之间的不同命名空间。
我已经测试了 HTMLCleaner、NekoHTML 和 Jericho,但除了清除文件的最简单示例之外,我没有找到 jTidy 和 TagSoup 的文档。
我需要有关操作内容、替换标签、提取信息等的文档...
Thanks
笔记:
测试了所有选项后,我使用了StAX / Woodstox :
http://wiki.fasterxml.com/WoodstoxHome http://wiki.fasterxml.com/WoodstoxHome
https://en.wikipedia.org/wiki/StAX https://en.wikipedia.org/wiki/StAX
https://docs.oracle.com/javase/tutorial/jaxp/stax/using.html https://docs.oracle.com/javase/tutorial/jaxp/stax/using.html
tagoup-friends google group 上类似问题的答案可能会有所帮助:
TagSoup 的文档 http://groups.google.com/group/tagsoup-friends/browse_thread/thread/636a80dbd08ce27e
您可能已经看过它们,但 JTidy 的 javadoc 可以在这里找到:http://jtidy.sourceforge.net/apidocs/index.html http://jtidy.sourceforge.net/apidocs/index.html
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)