如何使用维基百科的 API 获取维基百科内容?

2024-03-29

我想获取维基百科文章的第一段。

执行此操作的 API 查询是什么?


请参阅本节中的MediaWiki API 文档 http://www.mediawiki.org/wiki/API:Properties#revisions_.2F_rv,具体涉及获取页面内容 https://www.mediawiki.org/wiki/API:Get_the_contents_of_a_page.

use the sandbox https://en.wikipedia.org/wiki/Special:ApiSandbox测试 API 调用。

这些是关键参数。

prop=revisions&rvprop=content&rvsection=0

rvsection = 0指定仅返回前导部分。

请参阅此示例。

要获取 HTML,您可以使用类似的方法action=parse

请注意,您必须删除所有模板或信息框。

edit:如果你想提取纯文本(没有维基链接等),你可以使用文本提取 API https://www.mediawiki.org/wiki/API:Get_the_contents_of_a_page#Method_3:_Use_the_TextExtracts_API。使用那里的可用参数来调整您的输出。

https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exlimit=1&titles=pizza&explaintext=1&exsectionformat=plain
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用维基百科的 API 获取维基百科内容? 的相关文章

  • 不带值的 MediaWiki URL 参数

    The query的一部分URL似乎由键值对组成 并由相关联 我一直习惯使用 jQuery param 函数对我的查询字符串进行 URL 编码 因为我发现它使我的代码更具可读性和可维护性 在过去的几天里 我发现自己在调用 MediaWiki
  • 维基百科 API:如何搜索特定类别中的术语

    我很难弄清楚一项基本任务 如何找到术语 限制在特定类别 我觉得 Wiki API 文档有点令人困惑 我只想接收一个 JSON 文件作为输出 其中包含与该术语相关的所有建议 前任 我搜索矩阵 类别 电影 这样我就可以拥有 黑客帝国 1 黑客帝
  • 如何从 R 访问维基百科?

    R 是否有任何包允许查询维基百科 最有可能使用 Mediawiki API 来获取与此类查询相关的可用文章列表 以及导入选定的文章以进行文本挖掘 有WikipediR R 中的 MediaWiki API 包装器 library devto
  • 从 Wikipedia API 获取名人

    我正在尝试从 Wikipedia API 中获取还活着的人 但我还不知道该怎么做 I found 这个问题这和我的一样 据我所知 唯一的方法是搜索只有birth date参数的人 我实际上该怎么做 例如 如果我想搜索 罗纳尔多 我应该得到所
  • 维基百科 API 是否支持 CORS 还是仅支持 JSONP?

    这个问题涉及到另一个问题 这是一年前问过的 作者询问如何使用 JavaScript 和 Wikipedia API 发出跨域请求 一条评论是 en wikipedia org 似乎不允许 CORS 建议他改用 JSONP 我知道我可以使用
  • 按日期获取维基百科修订 ID 的 API [已关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 目前不接受答案 是否有任何API可以按日期获取维基百科修订ID 而不是检查所有修订历史记录并提取该日期之前的最新修订 谢谢你 The 修订查询 API允许您传递时间
  • 维基百科 API + 跨域请求

    我正在尝试使用 JavaScript 访问维基百科CORS http en wikipedia org wiki Cross origin resource sharing 20 29 据我所知 维基百科应该支持CORS http www
  • 如何在Python中对维基百科类别进行分组?

    对于我的数据集的每个概念 我都存储了相应的维基百科类别 例如 考虑以下 5 个概念及其相应的维基百科类别 高甘油三酯血症 Category Lipid metabolism disorders Category Medical condit
  • 如何使用维基百科的 Web API 检索某人的传记信息?

    我正在努力通过维基百科的 Web API 从该人的维基百科页面检索该人的一些特定生物详细信息 我需要检索一个人的生物信息框 我找到了如何检索内容框 介绍段落等 下面的 URL 用于检索 wiki 网页的第一个介绍段落 https en wi
  • 如何从维基百科中获取纯文本

    我想编写一个仅获取维基百科描述部分的脚本 也就是说 当我说 wiki bla bla bla 它将转到维基百科页面为bla bla bla http en wikipedia org wiki Bla Bla Bla 获取以下内容 并将其返
  • 如何从维基百科 API 获取表中的数据?

    我正在尝试从中获取所有内容维基百科 Unusual articles https en wikipedia org wiki Wikipedia Unusual articles我可以通过调用此端点来获取表内容列表 https en wik
  • 如何从维基百科文章中提取数据?

    我有一个关于为我的 Android 应用程序解析维基百科数据的问题 我有一个脚本 可以通过读取源代码来下载 XMLhttp en wikipedia org w api php action parse prop text format x
  • 如何通过 MediaWiki API 从 Wikipedia 文章中获取信息框? [复制]

    这个问题在这里已经有答案了 维基百科文章可能有信息框模板 通过以下调用 我可以获得包含信息框的文章的第一部分 http en wikipedia org w api php action parse pageid 568801 sectio
  • 如何使用维基百科的 API 获取维基百科内容?

    我想获取维基百科文章的第一段 执行此操作的 API 查询是什么 请参阅本节中的MediaWiki API 文档 http www mediawiki org wiki API Properties revisions 2F rv 具体涉及获
  • 如何按给定日期检索维基百科文章的历史版本?

    有没有办法使用 MediaWiki API 或任何其他工具使用近似日期 不知道 oldid 值 自动检索维基百科文章的先前版本 例如我怎样才能检索2016 年 12 月 20 日发表的文章 作者 2016 年 12 月 2016 年 12
  • 获取 JSON 中未知值后面的字符串

    我使用维基百科的 API 来获取有关页面的信息 API 给了我这样的 JSON query pages 188791 pageid 188791 ns 0 title Vanit u00e9 langlinks lang bg Vanita
  • 使用 jQuery 的 MediaWiki API 没有响应

    我尝试从 Wikipedia 获取一些 JSON 内容 getJSON http en wikipedia org w api php action query prop revisions rvprop content titles ti
  • 转储中的维基百科类别层次结构

    我想使用维基百科的转储为其类别构建一个层次结构 我已经下载了主转储 enwiki latest pages articles 和类别 SQL 转储 enwiki latest category 但我找不到层次结构信息 例如 SQL 类别的转
  • 连接到 Wikipedia API 的 WebRequest

    这可能是一个可悲的简单问题 但我似乎无法格式化帖子网络请求 响应以从维基百科API http en wikipedia org wiki Wikipedia API 如果有人可以帮助我查看我的问题 我已在下面发布了我的代码 string p
  • 从导出的维基百科文章中检索中间语言链接?

    我曾经通过使用一些正则表达式解析导出来从导出的维基百科文章中检索中间语言链接 在第一阶段维基数据项目 https en wikipedia org wiki Wikipedia Wikidata这些链接已移至维基数据上的单独页面 例如文章厄

随机推荐

  • GCP Pub/Sub,如果已经有活动订阅,您可以在新订阅上重播旧消息吗

    在 GCP Pub Sub 中 我有一个主题和一个Subscription1并已开始发布消息 我可以添加另一个订阅吗Subscription2并重播之前发布的旧消息Subscription2被创造了 它会允许吗 卡夫卡允许 在什么时候我会失
  • C++ 模板正式排序规则

    我很难理解 D Vandevoorde 和 N M Josuttis 所著的 C 模板完整指南 一书第 12 章中描述的正式排序规则的工作原理 在本书第 188 页 作者给出了以下场景 用于确定两个可行的函数模板中哪一个更专业 从这两个模板
  • Flutter - 获取 SHA-1 证书 - Android Studio 3.2.1

    我正在尝试检索我的 Flutter 项目的 SHA 1 指纹证书 这通常可以通过进入 Android Studio 右侧的 Gradle 面板并单击signingReport 然而问题是 在 Flutter 中 它根本不显示 Gradle
  • Laravel 可以处理高流量应用程序吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 我正在开发一个 PHP MySQL 社交网络项目 该项目将包含许多模块 部分 包括 用户系统 权限 配置文件 设置等 stackoverflow
  • Tomcat 9 的 Maven 插件

    除了 tomcat7 maven plugin 之外 我没有找到任何 tomcat maven plugin 我可以将其与 apache tomcat 9 0 0 M15 一起使用吗 您可以使用该插件部署到单独运行的 tomcat 9 Th
  • 自定义样式的 AlertDialog 的样式属性

    我正在尝试设计我的 AlertDialog 的样式 并且我已经能够通过样式和 xml 声明更改其中的大部分内容 但仍然存在一些问题 如何将标题栏周围的区域从黑色更改为我的自定义颜色 如何将外部背景更改为透明 阴影落在蓝色的外部部分 如何更改
  • “yes”这个程序有什么重要用途吗?

    当我第一次遇到yes nix 中的程序我想不出它有什么重要用途 这个程序是如何使用的 yes旨在自动化需要在采取行动之前确认的交互式程序 yes rm ri foo 大致相当于 rm rf foo 不同之处在于 f失败时也会继续
  • Rails 4 jQuery 与 javascript 冲突

    我正在尝试在 Rails 4 中制作一个应用程序 我正在挣扎 我正在尝试合并引导主题 但我遇到了供应商 JavaScript 和其余代码的问题 我认为问题可能与我的 application js 中的 jQuery 以及以 符号开头的供应商
  • 按名称实例化 Java lambda 函数

    我想在 Java 8 中创建一个 lambda 函数 获取它的类名 然后从它的类名再次实例化该函数 这就是我尝试的 import java util function Consumer public class SimpleLambda p
  • ajax 与常规表单数据的安全性

    只是想知道安全性的差异
  • Websphere Application Server 6.1(本地化):覆盖控制台消息的区域设置

    我已经安装了西班牙语版本的 RAD 7 5 基于 Eclipse Ganymede 3 4 0 我正在与Websphere 应用程序服务器 6 1 也是西班牙语 我遇到的问题是所有控制台消息都以西班牙语显示 但在我个人看来 翻译相当差 特别
  • 如何处理来自代理的额外 HTTP 标头?

    我们的环境需要使用出站代理来提供异地服务 通常这不是问题 在 Twilio 的这种情况下 返回的额外标头会破坏客户端 传出标头 POST 2010 04 01 Accounts FOO SMS Messages json HTTP 1 1
  • 如何提取双精度数的尾数

    我想将双精度数的尾数存储在变量中 我发布了一个代码来获取 double 的二进制表示形式 点击这里 https stackoverflow com questions 5670221 binary representation of a f
  • 使用 jQuery.getJson 获取 Web API [重复]

    这个问题在这里已经有答案了 我是 ASP NET Web API 的初学者 使用失败jQuery getJson to get ASP NET Web API 这失败了 var url http localhost 56110 api Va
  • 使用 JS / jQuery 启用/禁用 DOM 元素的事件

    我遇到了一个小问题 我花了很多时间来解决这个问题 与它的功能相比 这个问题相当糟糕 我的 DOM 中有标签 并且我已经使用 jQuery 将多个事件绑定到它们 var a a click data function 有时我想禁用其中一些元素
  • WordPress 重定向问题,标头已发送

    我想知道 根据下面的代码 我想把我的 wp redirect 函数放在哪里 因为它当前所在的位置除了 spazzes 和 sais 之外什么也不做 Warning Cannot modify header information heade
  • 处理器的 mpi 数量错误

    抱歉 我肯定犯了一个愚蠢的错误 但没有成功 我正在编译一个简单的 mpi hello world include
  • Google PageSpeed API dotnet .net

    我已经设置了一个基本的 C 应用程序 以便在我使用 Google Apis Pagespeedonline v2 nuget 包指定的网站上运行 PageSpeed 测试 设置非常简单 我有一个变量可以指定 url 然后将其传递到服务中 C
  • 保留 qw 中的空白

    有什么办法可以保留 qw 中的一些空白吗 例如 my a qw 1234 John Smith 123 Main St 将生成一个包含 6 个元素的数组 有什么方法可以 哦 我不知道 逃离空白以保留其中的一些 就像是 my a qw 123
  • 如何使用维基百科的 API 获取维基百科内容?

    我想获取维基百科文章的第一段 执行此操作的 API 查询是什么 请参阅本节中的MediaWiki API 文档 http www mediawiki org wiki API Properties revisions 2F rv 具体涉及获