编写可以验证 HTML(尤其是使用嵌入式 RDFa)的 python 模块的最佳方法是什么?我熟悉 validator.w3.org,并且有兴趣编写一个执行类似功能的自定义验证器,但针对使用 RDFa 作为元素元数据的不同标准。有哪些值得查看的优秀源代码、可以尝试的 Python 库以及需要记住的事项?
Emmett,
我不确定你想实现什么目标。我确实用 Python 编写了一个 RDFa 蒸馏器。您要问的第一个问题是您是否要考虑 XHTML 还是 HTML5。如果是前者,周围有一堆 XML 环境,还有用于 RDFa 使用的 DTD。那可行。对于 HTML5,您可能需要使用Python 中的 HTML5 解析器 http://code.google.com/p/html5lib/但这并不“了解”RDFa,但它可以生成 DOM 树(或其他表示形式),然后您可以使用它来检查 RDFa 属性。但请注意,HTML5 解析器不会执行“验证”,即分析 HTML5 代码以找出各种可能的错误情况;而是执行“验证”。它只是根据 HTML5 规范生成一棵 DOM 树。
我希望这有帮助。
Cheers
Ivan
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)