如何从维基百科获取信息框数据?

2024-01-13

如果我有某个页面的 URL,我如何使用 MediaWiki Web 服务获取右侧的信息框信息?


通过此 Python 库使用 Mediawiki API:https://github.com/siznax/wptools https://github.com/siznax/wptools

Usage:

import wptools
so = wptools.page('Stack Overflow').get_parse()
infobox = so.data['infobox']
print(infobox)

Output:

{'alexa': '{{Increase}} 34 ( {{as of|2019|12|15|lc|=|y}} )',
 'author': '[[Jeff Atwood]] and [[Joel Spolsky]]',
 'caption': 'Screenshot of Stack Overflow in February 2017',
 'commercial': 'Yes',
 'content_license': '[[Creative Commons license|CC-BY-SA]] 4.0',
 'current_status': 'Online',
 'language': 'English, Spanish, Russian, Portuguese, and Japanese',
 'launch_date': '{{start date and age|2008|9|15}}',
 'logo': 'Stack Overflow logo.svg',
 'name': 'Stack Overflow',
 'owner': '[[Stack Exchange]], Inc.',
 'programming_language': '[[C Sharp (programming language)|C#]]',
 'registration': 'Optional',
 'screenshot': 'File:Stack Overflow homepage, Feb 2017.png',
 'type': '[[Knowledge market]]',
 'url': '{{URL|https://stackoverflow.com}}'}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从维基百科获取信息框数据? 的相关文章

  • 如何在Python中分割大型维基百科转储.xml.bz2文件?

    我正在尝试使用 Python 使用 wikimedia 转储文件 xml bz2 构建离线维基词典 我开始于this http users softlab ece ntua gr ttsiod buildWikipediaOffline h
  • 我应该如何处理 wiki 页面内容中的自动链接?

    我所说的自动链接是指将页面内容中内嵌的 wiki 链接生成为页面超链接 如果存在 或创建链接 如果页面不存在 的过程 对于我正在使用的解析器 这是一个两步过程 首先 解析页面内容并从源标记中提取到 wiki 页面的所有链接 然后 在生成最终
  • 如何在侧边栏中添加带有链接的图像 - MediaWiki

    我可以通过这种方式添加 MediaWiki 侧边栏的链接 some url url text 但是 如何在不破坏核心或标准模板的情况下添加图像而不是文本呢 我读过这个 http www mediawiki org wiki Manual t
  • 从 mediawiki api ios 过滤数据

    我使用 action query prop revisions rvprop content keywords format json redirects API 来获取有关 Anil Ambani 的详细信息 作为回应 我得到了以下内容字
  • 如何从维基百科中获取纯文本

    我想编写一个仅获取维基百科描述部分的脚本 也就是说 当我说 wiki bla bla bla 它将转到维基百科页面为bla bla bla http en wikipedia org wiki Bla Bla Bla 获取以下内容 并将其返
  • 从 Python 文档字符串自动生成 GitHub Wiki 文档

    标题说明了一切 我的想法是为我的所有模块 类和函数提供文档字符串 并以某种方式通过 github wiki 很好地导航文档 此外 该文档应与最新代码同步 这意味着它应在推送时更新 重新生成 那可能吗 只需通过管道传输生成的输出docstri
  • 将 ipython 笔记本转换为 mediawiki

    我想将 ipython 笔记本转换为 mediawiki 标记 我有两个想法如何做到这一点 自定义导出nbconvert tool 先导出为LaTeX 然后使用pandoc将其转换为 mediawiki 标记 我在第一个选项中找不到任何内容
  • LDAP:过滤多个UID

    我正在尝试为一个团队设置 mediawiki 并且希望仅对一组用户进行 LDAP 身份验证 我知道我可以提出组 LDAP 身份验证 但是有没有一种快捷方式可以仅过滤一组 uid 进行身份验证 您可以使用的 LDAP 搜索过滤器是 uid a
  • 如何从维基百科 API 获取表中的数据?

    我正在尝试从中获取所有内容维基百科 Unusual articles https en wikipedia org wiki Wikipedia Unusual articles我可以通过调用此端点来获取表内容列表 https en wik
  • 在哪里可以获得 MediaWiki 的模板?

    我注意到很多基于 mediawiki 的网站都使用 Robelbox Ambox 等模板 我在哪里可以获得它们以及如何安装它们 It s a PITA http www urbandictionary com define php term
  • 明天的 Wiki 应包含哪些功能? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 明天的 wiki 应该包含哪些功能 他们如何整合 AJAX 等 Web 2 0 功能 他们目前还缺少哪些其他功能 做什么you想查看您最喜欢的 Wik
  • 从 Wikipedia API 中提取数据

    我希望能够使用 json 从维基百科中提取标题和描述 所以 维基百科不是我的问题 我是 json 的新手 想知道如何使用它 现在我知道有数百个教程 但我已经工作了几个小时 它只是不显示任何内容 这是我的代码
  • 尝试升级到 1.22 时 MediaWiki DB 连接错误

    我在共享主机服务器上安装了 MediaWiki 它的版本是 1 19 1 我正在尝试更新到 1 22 2 文档表明一步更新应该可以解决此问题 我已经在过去的更新中成功完成了几次此操作 并且正在遵循以前的注释 我建立了一个新目录 其中包含1
  • 滚动您自己的明文 Wiki(数据库内的 Wiki)

    有人知道用于创建类似 wiki 的数据存储的 API 最好是 PHP 但我对任何语言都感兴趣 关于滚动您自己的纯文本 wiki 的任何资源怎么样 其他纯文本 wiki 如何处理文本文件的格式 我知道我可以使用 Markdown 或 Text
  • 在 MediaWiki 中,有没有办法可以将 [[Image:]] 样式调整大小应用于外部图像?

    MediaWiki 有一个很好的内置方法来处理图像的显示 例如从http www mediawiki org wiki Help 图像 http www mediawiki org wiki Help Images File MediaWi
  • 在 Azure DevOps 中,是否有一种简单的方法可以将 wiki 从一个存储库复制到另一个存储库?

    我看到有一个 克隆维基 链接 但我不知道是否可以将克隆维基导入到另一个存储库中 我们正在做的是将我们的存储库从我们自己的 Azure 帐户移动到客户的 Azure 帐户 这样 wiki 将丢失 我不想手动复制所有 wiki 页面 是否可以将
  • 使用 RCurl 登录 mediawiki

    我如何使用 RCurl 或 Curl 我可以将其适应 R 包 登录到 mediawiki 我只想解析一个页面 但我需要登录 否则我无法访问它 Mediawiki API 有一个登录函数 它返回 cookie 和令牌 您必须保存并将两者发送回
  • 如何按城市过滤 WikiVoyage API 结果?

    我目前正在尝试使用 wikivoyage API 我当前的 API 调用如下所示 en wikivoyage org w api php action query list search srwhat text srsearch Pari
  • 从导出的维基百科文章中检索中间语言链接?

    我曾经通过使用一些正则表达式解析导出来从导出的维基百科文章中检索中间语言链接 在第一阶段维基数据项目 https en wikipedia org wiki Wikipedia Wikidata这些链接已移至维基数据上的单独页面 例如文章厄
  • 导出维基百科翻译标题的简单方法

    有没有一种简单的方法可以导出维基百科的翻译标题以获得这样的集合 russian title gt english title 我试图从ruwiki 最新 页面 meta current xml bz2 and ruwiki 最新 pages

随机推荐

  • 如何根据 Terraform 中 for_each 中的映射值设置 EC2 资源实例计数

    对于以下 Terraform 代码 我希望最终得到 2 个测试沙箱开发实例和 1 个测试沙箱测试实例 我希望能够从地图值中得出计数instance count 我尝试过使用count但 Terraform 不允许用户这样做for each
  • 如果已经运行,则阻止应用程序启动[重复]

    这个问题在这里已经有答案了 我的应用程序需要在启动时检查并查看它是否已经在运行 这样它就不会再次打开 我有一个系统托盘图标 可以使应用程序可见 False 效果很好 然而 如果应用程序已经在运行 我需要确保用户查看系统托盘中的通知图标 Pr
  • 在 Extjs 中播放视频

    我在我的一个项目中使用 Extjs 和 PHP 无框架 我需要在同一面板 选项卡上播放视频而不打开新的面板 选项卡 我可以通过单击下载按钮或单击面板上显示的视频链接来下载视频 但我需要在同一页面上播放视频而不影响其质量 通常使用 mp4 视
  • File:// 链接在所有浏览器中都不执行任何操作

    我正在生成一个链接 如下所示 a target blank title Test href Test a 该链接位于 iframe 内 当我点击它时 在任何主流浏览器中 nothing发生 Fiddler 没有记录任何流量 将 URL 粘贴
  • C# 中的这种链接称为什么?

    你能告诉我这是什么类型的 C 构造吗 Code Golf 与 Excel 列名称等效的数字 https stackoverflow com questions 2634427 code golf numeric equivalent of
  • phonegap 3.1 BarcodeScanner 未捕获模块 cordova/plugin/BarcodeScanner 未找到

    我是 Phonegap 和 JS 的新手 我用条形码扫描仪尝试了 我通过本教程安装了 Phonegap 和所有内容http teusink blogspot com 2013 07 guide phonegap 3 android wind
  • QDataWidgetMapper 无法与 QLabels 一起使用

    我正在使用 QDataWidgetMapper 将数据映射到 QLineEdit 它工作正常 当我用于将数据映射到 QLabel 时 它不会在标签中显示任何数据 我尝试按以下方式执行此操作 QDataWidgetMapper testMap
  • 如何在提交期间忽略特定的 Subversion 子目录

    在我当前正在从事的项目中 有人决定将二进制文件作为源树的一部分签入 二进制文件位于源本身下方的目录中 project src Here is the location of the source code project src more
  • 在 Kotlin 中根据给定的键列表对映射进行切片

    给定一张地图和一个键列表 val abc mapOf 1 to a 2 to b 3 to c val keys listOf 1 2 如何获取仅包含由指定的键值对的映射keys 就像是 val ab abc slice keys equi
  • 执行随机方法[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我正在尝试制定执行随机方法的逻辑 比方说 我有 10 个方法 我需要运行随机选择的其中一个 main 方法将驻留在我的 Rails 3 2
  • 如何在 IOS 中将可调整大小的 UIView 的一个角圆化?

    我正在使用这段代码来修整我的一个角UIView UIBezierPath maskPath UIBezierPath bezierPathWithRoundedRect self view bounds byRoundingCorners
  • VSCode 内部正则表达式搜索与负向后查找

    在 VSCode 中 尝试搜索print and print 但前提是后面没有 这是我第一次尝试在 VSCode 中进行正则表达式搜索 例子 print Test One MATCH print Test Two MATCH print T
  • JS 自动转换括号中的文本与特定标记(包括匹配)

    页面加载后 我想找到正文中封装在括号中的所有文本 这是一个示例 并将其替换为以下内容
  • git 如何处理将另一个存储库克隆到子目录中?

    我刚刚将一个存储库克隆到另一个存储库的子目录中 而 git 实际上似乎可以非常智能地处理这种情况 我了解子模块 但我认为它们总是必须明确定义 并且我不认为 git 有此功能 发生了什么 这是我的 shell 会话 https gist gi
  • 字典 C# 中的 GetHashCode 和 Equals 实现

    我来到这个网站搜索 Dictionary 中的对象比较 我发现重写 GetHashCode 和 Equals 是在 C 中进行对象比较的必须条件 这是我一直试图使用 FOREACH 迭代方法解决的一段代码 但由于性能问题 我的老板说要在不使
  • 评估嵌套逻辑表达式的算法

    我有一个想要评估的逻辑表达式 该表达式可以嵌套 由 T True 或 F False 和括号组成 括号 表示 逻辑或 彼此相邻的两个项 TF 或彼此相邻的任何其他两个组合 应为 ANDED 逻辑与 例如 表达式 TFT T true 我需要
  • 此事件处理程序代码会导致内存泄漏吗?

    假设我派生了一个 WPF 控件 例如 TextBox 并且我重写了 On 方法之一 例如 OnInitialized 假设我这样做了 this Initialized delegate 如果包含此控件的窗口关闭 如果不执行其他操作 是否会导
  • 聚合物输入变化事件

    我想要的只是能够从聚合物元素 获取输入并在更改时发出警报 而无需创建自定义聚合物元素 问题 on change 不执行任何操作 我怀疑 this value 会做任何事情 伪代码
  • 使用“like”时,Mysql 日期时间索引不起作用

    我在 MySQL 中创建了一个表 CREATE TABLE index test moment DATETIME one more attr VARCHAR 10 ALTER TABLE index test ADD INDEX momen
  • 如何从维基百科获取信息框数据?

    如果我有某个页面的 URL 我如何使用 MediaWiki Web 服务获取右侧的信息框信息 通过此 Python 库使用 Mediawiki API https github com siznax wptools https github