我想获取维基百科文章的第一段。
执行此操作的 API 查询是什么?
请参阅本节中的MediaWiki API 文档 http://www.mediawiki.org/wiki/API:Properties#revisions_.2F_rv,具体涉及获取页面内容 https://www.mediawiki.org/wiki/API:Get_the_contents_of_a_page.
use the sandbox https://en.wikipedia.org/wiki/Special:ApiSandbox测试 API 调用。
这些是关键参数。
prop=revisions&rvprop=content&rvsection=0
rvsection = 0
指定仅返回前导部分。
请参阅此示例。
要获取 HTML,您可以使用类似的方法action=parse
请注意,您必须删除所有模板或信息框。
edit:如果你想提取纯文本(没有维基链接等),你可以使用文本提取 API https://www.mediawiki.org/wiki/API:Get_the_contents_of_a_page#Method_3:_Use_the_TextExtracts_API。使用那里的可用参数来调整您的输出。
https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exlimit=1&titles=pizza&explaintext=1&exsectionformat=plain
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)