Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
从导出的维基百科文章中检索中间语言链接?
我曾经通过使用一些正则表达式解析导出来从导出的维基百科文章中检索中间语言链接 在第一阶段维基数据项目 https en wikipedia org wiki Wikipedia Wikidata这些链接已移至维基数据上的单独页面 例如文章厄
wikipedia
wikipediaapi
wikidata
wikidataapi
使用 Python 抓取维基百科数据
我正在尝试从以下内容中检索 3 列 NFL 球队 球员姓名 大学球队 维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手 一直在尝试使用 beautifulsoup 来
python
webscraping
beautifulsoup
htmlparsing
wikipedia
从 Wikipedia XML 转储获取静态 HTML 文件
我希望能够从巨大的 即使是压缩的 英语维基百科 XML 转储文件中获取相对最新的静态 HTML 文件enwiki 最新 pages articles xml bz2 http download wikimedia org enwiki la
xmlparsing
screenscraping
webcrawler
mediawiki
wikipedia
MYSQL插入GB大小的巨大SQL文件
我正在尝试创建 Wikipedia DB 副本 大约 50GB 但在处理最大的 SQL 文件时遇到问题 我使用 linux split 实用程序将 GB 大小的文件拆分为 300 MB 的块 例如 split d l 50 enwiki 2
mysql
sql
Linux
wikipedia
databaseperformance
维基百科与 Python
我有这个非常简单的 python 代码来读取 wikipedia api 的 xml import urllib from xml dom import minidom usock urllib urlopen http en wikipe
python
xml
wikipedia
连接到 Wikipedia API 的 WebRequest
这可能是一个可悲的简单问题 但我似乎无法格式化帖子网络请求 响应以从维基百科API http en wikipedia org wiki Wikipedia API 如果有人可以帮助我查看我的问题 我已在下面发布了我的代码 string p
c
mediawiki
webRequest
wikipedia
wikipediaapi
转储中的维基百科类别层次结构
我想使用维基百科的转储为其类别构建一个层次结构 我已经下载了主转储 enwiki latest pages articles 和类别 SQL 转储 enwiki latest category 但我找不到层次结构信息 例如 SQL 类别的转
mediawiki
categories
dump
wikipedia
wikipediaapi
解析维基百科的出生和死亡日期?
我正在尝试编写一个 python 程序 可以在维基百科中搜索人们的出生和死亡日期 例如 阿尔伯特 爱因斯坦出生于 1879 年 3 月 14 日 逝世日期 1955 年 4 月 18 日 我开始于使用 Python 获取维基百科文章 htt
python
mediawiki
wikipedia
wikipediaapi
mediawikiapi
在Google搜索时如何从第一页获取图像?
通常使用Google搜索城市后 右侧会出现维基百科页面的一部分 其中包含图像和地图 谁能告诉我如何访问该图像 我应该知道怎么下载 实际上 主图像 与右侧地图图像一起 很少来自维基百科 因此您无法使用维基百科 API 来获取它 如果您想访问实
Android
image
googlesearch
wikipedia
如何按给定日期检索维基百科文章的历史版本?
有没有办法使用 MediaWiki API 或任何其他工具使用近似日期 不知道 oldid 值 自动检索维基百科文章的先前版本 例如我怎样才能检索2016 年 12 月 20 日发表的文章 作者 2016 年 12 月 2016 年 12
wikipedia
wikipediaapi
mediawikiapi
如何从维基百科文章中提取数据?
我有一个关于为我的 Android 应用程序解析维基百科数据的问题 我有一个脚本 可以通过读取源代码来下载 XMLhttp en wikipedia org w api php action parse prop text format x
Android
xml
Parsing
wikipedia
wikipediaapi
以编程方式检索所有维基百科语言的列表
我需要检索某个 wiki 项目的所有现有语言的列表 例如 所有维基导游 https www wikivoyage org or all 维基百科 https www wikipedia org语言 就像他们的登陆页面一样 我更喜欢通过这样做
wikipedia
wikipediaapi
mediawikiapi
wikimedia
从 Wikipedia API 中提取数据
我希望能够使用 json 从维基百科中提取标题和描述 所以 维基百科不是我的问题 我是 json 的新手 想知道如何使用它 现在我知道有数百个教程 但我已经工作了几个小时 它只是不显示任何内容 这是我的代码
php
json
API
wikipedia
维基百科 api 全文搜索返回带有标题、片段和图像的文章
我一直在寻找一种基于搜索字符串来查询 wikipedia api 的方法 以获取具有以下属性的文章列表 Title 片段 描述 与文章相关的一张或多张图片 我还必须使用 jsonp 进行查询 我尝试过使用 list search 参数 但它
mediawiki
wikipedia
wikipediaapi
mediawikiapi
维基百科文本下载
我正在寻找为我的大学项目下载完整的维基百科文本 我是否必须编写自己的蜘蛛才能下载此内容 或者是否有在线维基百科的公共数据集 为了给你一些我的项目的概述 我想找出我感兴趣的几篇文章中有趣的单词 但是为了找到这些有趣的单词 我计划应用 tf i
Text
wikipedia
webcrawler
informationretrieval
有没有API可以从wiki页面获取图像
我想从维基百科页面获取主图像 我有所有维基百科实体名称 我从中创建维基链接并从该页面获取主图像 我尝试过 https github com richardasaurus wiki api https github com richardas
python
wikipedia
dbpedia
如何构建维基百科类别层次结构?
我正在尝试构建维基百科文章及其类别的树形图 我需要做什么才能做到这一点 从这个网站 http dumps wikimedia org enwiki latest http dumps wikimedia org enwiki latest
wikipedia
如何从维基百科中获取纯文本
我想编写一个仅获取维基百科描述部分的脚本 也就是说 当我说 wiki bla bla bla 它将转到维基百科页面为bla bla bla http en wikipedia org wiki Bla Bla Bla 获取以下内容 并将其返
python
mediawiki
wikipedia
wikipediaapi
mediawikiapi
从 mediawiki api ios 过滤数据
我使用 action query prop revisions rvprop content keywords format json redirects API 来获取有关 Anil Ambani 的详细信息 作为回应 我得到了以下内容字
iphone
ios
Objectivec
mediawiki
wikipedia
单个查询中的 Wikipedia API 和 SPARQL
我需要搜索其中包含一些特定单词的维基百科页面全文 为了改善结果 我想将结果限制为描述实体的页面的实例一个特定的实体 为了搜索全文 我可以使用 Wikipedia API 使用查询动作和搜索生成器 为了过滤给定实体的实例 我可以使用 Wiki
sparql
wikipedia
wikipediaapi
wikidata
1
2
3
»