获取所有维基百科信息框模板和使用它们的所有页面

2023-11-27

给定一个维基百科页面,例如维基百科:堆栈溢出通常会有信息框(主要位于页面顶部的右侧)。截图示例:

Stackoverflow Infobox at Wikipedia

  1. DBPedia 将所有这些属性列为 RDF 三元组。您可以在以下位置查看示例DBPedia:堆栈溢出。在那里你可以看到该房产dbpprop:wikiPageUsesTemplate与价值dbpedia:Template:Infobox_website这很有趣。我想知道哪些维基百科页面使用此模板。我怎样才能做到这一点并列出使用 Infobox_website 模板的所有页面?最好使用 SPARQL 查询,但我愿意接受其他简单的解决方案。

  2. 接下来是所有信息框模板的列表。维基百科:类别信息框模板显示所需的维基百科类别的层次结构 - 看起来像我正在寻找的。但我希望所有这些都以机器可读的格式在一页上。也许 DBPedia 在这里也是正确的?在DBPedia:类别 Infox 模板 and DBPedia:信息框我找到的信息很少。但这些看起来非常有前途。我如何使用 SPARQL 查找所有 Infobox 类型,以便我可以对每个类型重复执行步骤 1?

您可以使用它来测试 SPARQL 查询:http://dbpedia.org/snorql/

Update 1

我似乎已经解决了第一个问题:SPARQL:列出包含 Infobox_website 的所有页面

Update 2

另外,这似乎是对问题 2 的查询:SPARQL:列出所有信息框


好吧,因为我似乎找到了一个解决方案(很可能不是最好的),我想分享它们。

1) 此 SPARQL 查询可用于查找包含特定 Infobox 类型的所有页面:

SELECT * WHERE { ?page dbpedia2:wikiPageUsesTemplate 。 ?页 dbpedia2:名称?名称。 }

SNORQL 链接


2) 此 SPARQL 查询可用于查找所有 Infobox 类型:

选择 DISTINCT ?模板 WHERE { ?页面 dbpedia2:wikiPageUsesTemplate ?模板 。过滤器(正则表达式(?模板, “信息框”))。 } 排序依据?模板

SNORQL 链接

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

获取所有维基百科信息框模板和使用它们的所有页面 的相关文章

  • 要安装多少个 wiki 实例?

    我被要求安装 Mediawiki 来保存公司内部网的文档 此外 我被要求安装several实例 每个贡献组一个 非技术用户获得一个 开发人员获得一个 管理人员获得一个 等等 我们的想法是为每个组提供单独的网络空间 有没有一种方法可以在一个实
  • 如何获取维基百科根类别的终端叶子

    我只想获取维基百科类别的叶子 但不知道如何获取 我可以得到所有的叶子 SELECT subcat WHERE subcat skos broader category Buildings and structures in France b
  • 获取给定标题的 mediawiki 页面的 URL - 以 PHP 编程方式 [关闭]

    这个问题不太可能对任何未来的访客有帮助 它只与一个较小的地理区域 一个特定的时间点或一个非常狭窄的情况相关 通常不适用于全世界的互联网受众 为了帮助使这个问题更广泛地适用 访问帮助中心 help reopen questions 如何获取
  • 防止 pandoc 将 $ 转换为 mediawiki

    我正在使用 pandoc 将 markdown 文件转换为 mediawiki 表 文件内容mtcars md c1 c2 7 P A A 8 AB B 9 P A C 然后我就这样做了 我使用的是 Ubuntu 64 位和 pandoc
  • 如何在java中构建SPARQL查询?

    是否有一个库 能够像以下那样以编程方式构建 SPARQL 查询CriteriaBuilder在 JPA 中或像使用PreparedStatement对于 SQL 类似 对于 SQL 在 Java 中构建 SQL 字符串的最简洁方法 http
  • 在 Mediawiki 中上传时调整图像大小

    理想情况下 我在上传到 mediawiki 的所有图像上调整大小并设置 maxWidth 和 maxHeight 后 看完了文档 https www mediawiki org wiki Manual Image administratio
  • 投影中的变量“x”不存在于 GROUP BY 中

    我想计算城市和括号中的内容 但是 我也想获得另一个变量 但是当我将它添加到 SELECT 时 我得到 org openrdf query MalformedQueryException 投影中的变量 region name 不存在于 GRO
  • 从 Wikipedia API 中提取数据

    我希望能够使用 json 从维基百科中提取标题和描述 所以 维基百科不是我的问题 我是 json 的新手 想知道如何使用它 现在我知道有数百个教程 但我已经工作了几个小时 它只是不显示任何内容 这是我的代码
  • 以编程方式检索所有维基百科语言的列表

    我需要检索某个 wiki 项目的所有现有语言的列表 例如 所有维基导游 https www wikivoyage org or all 维基百科 https www wikipedia org语言 就像他们的登陆页面一样 我更喜欢通过这样做
  • 为 RDBMS(MySQL 数据库)创建 SPARQL 端点的最佳方法

    我正在 想做 一些链接开放数据集的实验 特别是政府推出的实验 我有一个 RDBMS 更具体地说是 MySQL 我设计它时考虑了语义网络的想法 即我将信息存储为对象 谓词和定义对象的类 反过来 所有对象通过主语 gt 谓词 gt 宾语形式的语
  • 获取地点的纬度和经度 dbpedia

    我想获取一个我已经知道其名称的地点的纬度和经度 PREFIX geo
  • 使用 Python 更新媒体 wiki 文章?

    你好 我有一个 cron 作业 它收集有关服务的一些统计信息 我需要 cron 作业以编程方式更新媒体 wiki 页面 附加到页面 我在 cron 中使用 python 那么我最好的选择是什么 是否有 mediawiki python 库的
  • 在Google搜索时如何从第一页获取图像?

    通常使用Google搜索城市后 右侧会出现维基百科页面的一部分 其中包含图像和地图 谁能告诉我如何访问该图像 我应该知道怎么下载 实际上 主图像 与右侧地图图像一起 很少来自维基百科 因此您无法使用维基百科 API 来获取它 如果您想访问实
  • 在 Protege 中使用 SPARQL 推断数据

    我正在尝试推断 RDF 数据 假设我有这些三元组 RDF Turtle 是我使用 Protege 创建的 prefix owl
  • 解析维基百科的出生和死亡日期?

    我正在尝试编写一个 python 程序 可以在维基百科中搜索人们的出生和死亡日期 例如 阿尔伯特 爱因斯坦出生于 1879 年 3 月 14 日 逝世日期 1955 年 4 月 18 日 我开始于使用 Python 获取维基百科文章 htt
  • 如何返回从起始资源到指定路径深度的所有 S->P->O 三元组?

    我的目标是以图形方式表示指定资源的深度两条边内的 S gt P gt O 关系 p Person 1 我希望从查询中返回该路径长度内的所有关系 s p o在我的图形应用程序中进行进一步处理 我尝试了下面的第一个查询 它给了我第一组 s p
  • 根据 URI 前缀从 DBpedia SPARQL 查询中排除结果

    使用时如何排除一组概念DBpedia SPARQL 端点 http dbpedia org sparql 我使用以下基本查询来获取概念列表 SELECT DISTINCT concept WHERE x a concept LIMIT 10
  • SPARQL:如何将 owl:equivalentClass 传输到 rdfs:subClassOf (owl:Restriction) 属性?

    我的问题是关于使用 SPARQL 查询一些 owl 本体 其中owl Restrictions被大量使用 在我的例子中 这是 细胞本体论 http obofoundry org ontology cl html 以下是一些典型条目的示例 以
  • 将 Sandcastle 帮助文件生成器输出(网站)转换为 MediaWiki 格式

    我需要 转换我的 Sandcastle 帮助文件 Web 生成器 SHFB 输出 站点 HTML 转媒体 wiki 格式 找到一种方法来转移 包含 直接将转换后的页面转换为 我们已经建立了 MediaWiki 有任何想法吗 我们的网站中有超
  • 导出维基百科翻译标题的简单方法

    有没有一种简单的方法可以导出维基百科的翻译标题以获得这样的集合 russian title gt english title 我试图从ruwiki 最新 页面 meta current xml bz2 and ruwiki 最新 pages

随机推荐

  • EntityFramework 6.0 CreateDatabaseIfNotExists 首先代码创建数据库

    我究竟做错了什么 当我最初使用 powershell 创建 Code First 时 我已经有了一个用户 DbContext 设置和工作 一切都工作正常 我在应用程序启动时按预期实现了数据库初始化程序 Database SetInitial
  • 部署在 Azure Web App/Azure API 上时缺少 CORS 标头

    我创建了一个 OWIN 托管WebAPI 2 还有一个网络应用程序 AngularJS 使用 API 并充当客户端 我已经添加了必要的代码CORS to the Startup cs 并将其托管在与客户端不同的端口上的本地 IIS 中 并确
  • Jetty 8 + EJB 3.1 + JTA + CDI + JPA 2 堆栈?

    谁能告诉我目前是否可以通过 Jetty 将部分 Java EE 6 Web 配置文件 粘合在一起 我发现了很多关于将独立 EJB 3 容器 JTA 提供程序等与较旧的 Jetty 版本集成的文章 因此我很想知道是否能让它们一起工作 我想在
  • Spring security:java.sql.SQLException:列索引超出范围,3 > 2

    我正在使用 spring 4 我想使用 spring security 3 来控制我的登录表单 所以我在数据库中有以下表格 用户表 CREATE TABLE IF NOT EXISTS users id INT 11 NOT NULL AU
  • qtScript 上 JavaScript 的 setTimeout 等价于什么?

    没什么可补充的 qtScript 上 JavaScript 的 setTimeout 的等价物是什么 以下是如何通过提供独立的 C 方法来扩展脚本语言 无需记录计时器 ID 等 只需创建以下名为 setTimeout 的槽 void Scr
  • 如何创建 AppleScript 应用程序来运行一组终端命令

    我该如何创建一个 AppleScript 命令 当我运行脚本 或在 Finder 中双击它 时 它会运行一组终端命令 这组命令彻底删除了MySQL 不断地把它们写出来已经成为一种痛苦 命令是 sudo rm usr local mysql
  • 在用户模式下读取 kallsyms

    我正在编写有关低级内容的代码 我需要知道内核符号地址才能编写可靠的代码 因此 当我在 Ubuntu kernel 3 0 19 中处于用户模式时 我尝试读取 kallsyms 这就是用户模式下 kallsyms 的输出 00000000 r
  • 如何按 has_many 关系中的对象数量对 Rails AR.find 进行排序

    如何编写 AR 查找查询以使结果按 has many 关联中的记录数排序 class User lt ActiveRecord Base has many photos end 我想做一些像 User find all order gt p
  • HTML 默认链接颜色

    我想用 CSS 将某些元素的颜色设置为默认链接颜色 a href That color a is the same as span style color link that span 有办法做到这一点吗 本网站不会更改默认浏览器的链接颜色
  • 将 one-hot 编码数据帧列转换为一列

    在 pandas 数据框中 one hot 编码向量以列的形式出现 即 Rows A B C D E 0 0 0 0 1 0 1 0 0 1 0 0 2 0 1 0 0 0 3 0 0 0 1 0 4 1 0 0 0 0 4 0 0 0 0
  • 使用回形针调整默认图像大小时遇到​​问题

    我希望能够调整与回形针一起使用的默认个人资料图像的大小 这是我的模型中的代码 has attached file photo styles gt tiny gt 25x25 thumbnail gt 100x100 small gt 150
  • 使用 phpmailer 发送异步电子邮件

    是否可以使用 phpmailer 发送异步电子邮件 普通邮件发送代码片段如下 mail gt Send PHP 等待 Send 返回结果 然后再继续 是否可以让 phpmailer 立即返回结果 而无需等待真正的电子邮件发送例程完成 201
  • PreparedStatement很慢,但是手动查询很快

    我有一个来自框架的准备好的声明 如下所示 SELECT OH ORDER ID MAX OS STATUS DATETIME FROM public ORDER HEADER OH public ORDER STATUS OS WHERE
  • 在 Eclipse 中附加 jar 的源

    我添加了一个Student jar进入我的Build Path在我的日食中这样 右键单击项目 gt BuildPath gt 配置构建 路径 gt 库 gt 添加外部罐子 有一个类名为StudentTest in Student jar文件
  • 从实体框架连接字符串创建 DataContext?

    我试图在我的代码中进行此调用 string conn ConfigurationManager ConnectionStrings MyDBEntities ConnectionString DataContext context new
  • HTML DTD - 有什么意义? [复制]

    这个问题在这里已经有答案了 可能的重复 html 中有哪些不同的文档类型以及它们的含义是什么 由于对 Web 开发的某些方面相当缺乏经验 我总是更关注后端而不是前端 任何人都可以告诉我他们的想法 我是否应该担心网页开头所做的 DOCTYPE
  • 通过网页抓取提取 JavaScript 变量值

    对于一个公司项目 我需要使用 PHP 和 JavaScript 包括 jQuery 创建一个网络抓取应用程序 该应用程序将从客户网站的每个页面中提取特定数据 抓取应用程序需要为每个页面获取两种类型的数据 1 确定是否存在具有特定 ID 的某
  • 如何通过 AWS API Gateway 将多个 Cognito 用户池用于单个端点?

    我最近实现了一个 API 网关作为具有单个代理端点的代理 我使用 Cognito 作为授权机制 只要我只有一个用户池 一切都很好 我想要实现的是能够允许来自不同用户池的用户 但在AWS控制台中我似乎只能选择一种Cognito机制 而该机制只
  • Google Datastore 综合索引问题

    我遇到以下异常 Exception in thread main com google cloud datastore DatastoreException no matching index found recommended index
  • 获取所有维基百科信息框模板和使用它们的所有页面

    给定一个维基百科页面 例如维基百科 堆栈溢出通常会有信息框 主要位于页面顶部的右侧 截图示例 DBPedia 将所有这些属性列为 RDF 三元组 您可以在以下位置查看示例DBPedia 堆栈溢出 在那里你可以看到该房产dbpprop wik