验证文档是否遵循某个 HTML 版本(最好是我可以指定)的最佳方法是什么?我希望能够知道失败发生在哪里,就像在基于 Web 的验证器中一样,但在本机 Python 应用程序中除外。
PyTidyLib http://countergram.github.io/pytidylib/是 HTML Tidy 的一个很好的 Python 绑定。他们的例子:
from tidylib import tidy_document
document, errors = tidy_document('''<p>fõo <img src="bar.jpg">''',
options={'numeric-entities':1})
print document
print errors
而且它与两者兼容遗留 HTML 整洁 http://tidy.sourceforge.net/和新的 tidy-html5 http://www.html-tidy.org/.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)