以编程方式检索所有维基百科语言的列表

2024-03-14

我需要检索某个 wiki 项目的所有现有语言的列表。例如,所有维基导游 https://www.wikivoyage.org or all 维基百科 https://www.wikipedia.org语言,就像他们的登陆页面一样。

我更喜欢通过这样做MediaWiki API, 如果它是可能的。

谢谢你的时间。


方法 3:在 Wikimedia wiki 农场和扩展中使用 API:Sitematrix

虽然这将返回矩阵知道的所有维基,但它很容易在客户端过滤code[截至目前,以下之一:wiki(维基百科),wiktionary, wikibooks, wikinews, wikiquote, wikisource, wikiversity, wikivoyage] 并由其closed状态。一个请求只有一些响应主体开销,但由于它很容易缓存并且压缩得很好,所以不是那么有效。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

以编程方式检索所有维基百科语言的列表 的相关文章

  • 无法从维基百科 API 获取数据

    let dataObj const query marvel fetch https en wikipedia org w api php action query titles query prop revisions rvprop co
  • 使用python的urllib2和Beautifulsoup爬取维基百科时删除html标签

    我正在尝试抓取维基百科以获取一些用于文本挖掘的数据 我正在使用 python 的 urllib2 和 Beautifulsoup 我的问题是 有没有一种简单的方法可以从我阅读的文本中删除不必要的标签 例如链接 a 或 span 对于这种情况
  • 维基百科 API 是否支持 CORS 还是仅支持 JSONP?

    这个问题涉及到另一个问题 这是一年前问过的 作者询问如何使用 JavaScript 和 Wikipedia API 发出跨域请求 一条评论是 en wikipedia org 似乎不允许 CORS 建议他改用 JSONP 我知道我可以使用
  • 如何形成 dbPedia iSPARQL 查询(针对维基百科内容)

    假设我需要从维基百科获取有关所有山脉的内容 我的目标是显示初始段落和相应文章中的图像 例如罗莎山 and 文森特金字塔 我开始了解 dbpedia 并通过一些研究发现它直接提供对 wiki 数据库的实时查询 我有两个问题 1 我发现很难如何
  • XPath 获取两个标题之间的标记

    我正在尝试编写一个小应用程序来从维基百科页面中提取内容 当我第一次想到是否可以时 我认为我可以只使用 XPath 来定位包含内容的 div 但在研究了 Wikipedia 如何构建他们的文章后 我很快发现这并不是那么容易 当我获取页面时分离
  • 我如何准备使用整个维基百科进行自然语言处理?

    我在这里有点新 我有一个项目 我必须下载并使用维基百科进行 NLP 我面临的问题如下 我的 RAM 只有 12 GB 但英文 wiki 转储压缩后的大小超过 15 GB 这会限制我对 wiki 的处理吗 我不需要维基百科上的任何图片 在处理
  • 检索任意日期之前/之后最后更新的属性

    我有兴趣检索 WikiData 项目的属性 但前提是该属性是在某个日期之前或之后添加或修改的 所以我有这个SPARQL查询获取 Q24 的所有属性 SELECT itemLabel propLabel statement property
  • 维基百科 API + 跨域请求

    我正在尝试使用 JavaScript 访问维基百科CORS http en wikipedia org wiki Cross origin resource sharing 20 29 据我所知 维基百科应该支持CORS http www
  • 如何获取多语言的维基百科页面?

    我怎样才能获得另一种语言的相同维基百科页面 例如我想获得日语页面 http en wikipedia org wiki Cloud http en wikipedia org wiki Cloud 结果是 http ja wikipedia
  • 如果存在维基百科 api,如何使用? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在尝试查找是否有 Wikipedia API 我认为它与 MediaWIki 相关 如果是这样 我想知道如何告诉维基百科给我一篇关
  • MediaWiki,尝试调查 VisualEditor“联系 Parsoid/RESTBase 服务器时出错 (HTTP 500)”

    很多人由于多种不同的原因而遇到相同的错误 因此 在尝试作曲家更新后 我尝试从浏览器开始调查它并逐步重建正在发生的事情 这对我来说真的很难 我非常感谢 PHP 开发人员的帮助 From Chrome Developer Tools I cou
  • 如何从维基百科 API 获取表中的数据?

    我正在尝试从中获取所有内容维基百科 Unusual articles https en wikipedia org wiki Wikipedia Unusual articles我可以通过调用此端点来获取表内容列表 https en wik
  • 以编程方式检索所有维基百科语言的列表

    我需要检索某个 wiki 项目的所有现有语言的列表 例如 所有维基导游 https www wikivoyage org or all 维基百科 https www wikipedia org语言 就像他们的登陆页面一样 我更喜欢通过这样做
  • 如何通过 MediaWiki API 从 Wikipedia 文章中获取信息框? [复制]

    这个问题在这里已经有答案了 维基百科文章可能有信息框模板 通过以下调用 我可以获得包含信息框的文章的第一部分 http en wikipedia org w api php action parse pageid 568801 sectio
  • 如何从 MediaWiki API 获取主图像?

    您好 我正在使用 Curl 从维基百科获取信息 我只想接收有关主图像的信息 我不想接收文章的所有图像 例如 如果我想获取有关英语语言的所有图像的信息 http en wikipedia org wiki English language h
  • 解析维基百科的出生和死亡日期?

    我正在尝试编写一个 python 程序 可以在维基百科中搜索人们的出生和死亡日期 例如 阿尔伯特 爱因斯坦出生于 1879 年 3 月 14 日 逝世日期 1955 年 4 月 18 日 我开始于使用 Python 获取维基百科文章 htt
  • 转储中的维基百科类别层次结构

    我想使用维基百科的转储为其类别构建一个层次结构 我已经下载了主转储 enwiki latest pages articles 和类别 SQL 转储 enwiki latest category 但我找不到层次结构信息 例如 SQL 类别的转
  • 连接到 Wikipedia API 的 WebRequest

    这可能是一个可悲的简单问题 但我似乎无法格式化帖子网络请求 响应以从维基百科API http en wikipedia org wiki Wikipedia API 如果有人可以帮助我查看我的问题 我已在下面发布了我的代码 string p
  • 使用 Python 抓取维基百科数据

    我正在尝试从以下内容中检索 3 列 NFL 球队 球员姓名 大学球队 维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手 一直在尝试使用 beautifulsoup 来
  • 从导出的维基百科文章中检索中间语言链接?

    我曾经通过使用一些正则表达式解析导出来从导出的维基百科文章中检索中间语言链接 在第一阶段维基数据项目 https en wikipedia org wiki Wikipedia Wikidata这些链接已移至维基数据上的单独页面 例如文章厄

随机推荐