在 Python 中验证 HTML/RDFa

2024-03-03

编写可以验证 HTML(尤其是使用嵌入式 RDFa)的 python 模块的最佳方法是什么?我熟悉 validator.w3.org,并且有兴趣编写一个执行类似功能的自定义验证器,但针对使用 RDFa 作为元素元数据的不同标准。有哪些值得查看的优秀源代码、可以尝试的 Python 库以及需要记住的事项?


Emmett,

我不确定你想实现什么目标。我确实用 Python 编写了一个 RDFa 蒸馏器。您要问的第一个问题是您是否要考虑 XHTML 还是 HTML5。如果是前者,周围有一堆 XML 环境,还有用于 RDFa 使用的 DTD。那可行。对于 HTML5,您可能需要使用Python 中的 HTML5 解析器 http://code.google.com/p/html5lib/但这并不“了解”RDFa,但它可以生成 DOM 树(或其他表示形式),然后您可以使用它来检查 RDFa 属性。但请注意,HTML5 解析器不会执行“验证”,即分析 HTML5 代码以找出各种可能的错误情况;而是执行“验证”。它只是根据 HTML5 规范生成一棵 DOM 树。

我希望这有帮助。

Cheers

Ivan

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中验证 HTML/RDFa 的相关文章

随机推荐

  • 在sql server中使用case语句更新多列

    我想使用 case 语句更新表 查询是这样的 select case columnname when name1 then begin update table set pay1 pay1 100 pay2 pay2 20 pay3 pa
  • .Net Core 无法使用位图

    我正在使用 Net Core 2 1 开发 Web 服务 我有一个字节数组 其中包含所有像素值 灰度 宽度 高度 我想从这些参数创建一个位图 这是我的代码 来自一个正在运行的 Net Framework 4 项目 public FileRe
  • CollapsingToolbarLayout 未正确调用 requestLayout()

    我有一个折叠的工具栏布局 其中包含图像 折叠时显示工具栏标题 我需要更改工具栏标题字体 因此我在工具栏布局中添加了一个文本视图 现在 每当我折叠工具栏时 都会重复生成以下错误 08 12 13 14 19 604 2263 2263 com
  • 什么时候应该从类方法返回对对象的引用

    从类方法返回引用的最佳实践是什么 是否希望在没有引用的情况下返回基本类型 而希望通过引用返回类对象 您推荐的任何文章 最佳实践文章 我假设你所说的类方法是指成员函数 通过引用返回 的意思是 返回对成员数据的引用 这主要与返回对 local
  • Coq 中的“错误:宇宙不一致”是什么意思?

    我正在努力通过软件基础 http www cis upenn edu bcpierce sf current 目前正在做教堂数字的练习 这是自然数的类型签名 Definition nat forall X Type X gt X gt X
  • Google Finance,如何获取 JSON 数据流?

    我之前试图解释这一点 但显然失败了 因此 如果您打开了谷歌金融图表 例如 http www google com finance q INDEXNASDAQ IXIC http www google com finance q INDEXN
  • 将 HTTP 响应正文解析为 XML

    我使用此代码执行 HTTP 请求并解析 XML 响应 using HttpWebResponse resp req GetResponse as HttpWebResponse if resp StatusCode HttpStatusCo
  • R中基于移动时间窗口连接数据

    我有每小时记录一次的天气数据 以及每 4 小时记录一次的位置数据 X Y 我想知道 X Y 位置的温度是多少 天气数据并不完全相同 因此 我为每个位置编写了这个循环 以扫描天气数据 查找日期 时间中的 最接近 并提取该时间的数据 问题是我编
  • prolog 如何使用 succ 运行递归查询?

    有人可以向我解释一下为什么这个序言查询会这样工作吗 定义是 add 0 Y Y add succ X Y succ Z add X Y Z 鉴于这种 add succ succ succ 0 succ succ 0 R 这是查询的轨迹 Ca
  • 如何根据数据属性内对象的属性选择元素?

    如果我的标记如下所示 div div div div div div 如果我只有键 bar 或 foo 我将如何使用 JQuery 选择特定元素 我可以取出每一行的整个对象并迭代它以查找匹配项 但如果有更有
  • Pdfplumber 无法识别表 python [重复]

    这个问题在这里已经有答案了 我使用 Pdfplumber 提取第 2 页第 3 部分的表格 通常 但它只适用于某些 pdf 其他则不起作用 对于失败的 pdf 文件 似乎 Pdfplumber 读取的是按钮表而不是我想要的表 我怎样才能拿到
  • Windows 如何更改或插入物理扇区到另一个文件中?

    我有 20 个文件 其中数据结构在 NTFS 中与 4k 扇区对齐 我想合并所有文件无需复制任何数据 目标是编写一种通过直接更改 NTFS 虚拟集群和物理集群来工作的插入 API 目标是从 50GB 块中获得大小为 1TB 的文件 而无需复
  • 将值传递给 Sql 中的空值列

    我有一个Sections表 在该表中我有列SectionId CourseId Name Capacity 这里CourseId是一个空值列 它的外键在这里聚焦于Course表 这个CourseId列是一个新添加了一个 我正在尝试向此表添加
  • 关闭 SVG 标签,显式关闭还是自动关闭?

    我正在验证我的代码 并收到以下错误Tag cannot be self closing Use an explicit closing tag 在 IE 中作为我的 svg 路径 因为它是自动关闭的
  • 时髦的 haskell 惰性列表隐式递归

    在 Haskell 中 由于懒惰 您可以构建无限列表 Prelude gt let g 4 g Prelude gt g 0 4 Prelude gt take 10 g 4 4 4 4 4 4 4 4 4 4 现在 当我尝试构建这样的列表
  • python 中的无循环 3D 矩阵乘法

    我希望在 python numpy 中执行以下操作 Matrix A is M x N x R Matrix B is N x 1 x R 矩阵乘法 AB C 其中 C 是 M x 1 x R 矩阵 本质上 A 的每个 M x N 层 其中
  • 了解 Perl 正则表达式修饰符 /m 和 /s [重复]

    这个问题在这里已经有答案了 我一直在阅读带有修饰符 s m 和 g 的 perl 正则表达式 我知道 g 是全局匹配 它将是贪婪搜索 但我对修饰符 s 和 m 感到困惑 谁能用代码示例解释 s 和 m 之间的区别 以展示它们有何不同 我尝试
  • 如何从 MVC 控制器在 debian linux 中打印 pdf

    AsP NET MVC 4 应用程序使用 Mono 在 Debian Squeeze Linux 中运行 控制器使用下面的代码从 html 创建 pdf 文件 如何将 pdf 文件打印到连接到服务器的三星打印机 有一些可执行文件可以用于此目
  • Select2 - formatNoMatches 上的链接

    我在用着Select2 http ivaynberg github com select2 来增强我的
  • 在 Python 中验证 HTML/RDFa

    编写可以验证 HTML 尤其是使用嵌入式 RDFa 的 python 模块的最佳方法是什么 我熟悉 validator w3 org 并且有兴趣编写一个执行类似功能的自定义验证器 但针对使用 RDFa 作为元素元数据的不同标准 有哪些值得查