我需要在 Github 上进行大量搜索以获取论文中的统计数据。
例如,我需要在 GitHub 上探索大量 Android 项目,但该网站将搜索结果限制为 1000 个(例如)。还使用Java GitHub API我尝试使用该方法库org.eclipse.egit.github.core.client.GitHubClientGitHubClient.searchRepositories()
但即使如此,结果的数量也是有限的。
有谁知道如何获得所有结果?
Search API 每次查询最多返回 1000 个结果(包括分页),如下所述:
https://developer.github.com/v3/search/#about-the-search-api https://developer.github.com/v3/search/#about-the-search-api
然而,在执行存储库搜索时,您可以使用一个巧妙的技巧来获取 1000 多个结果。您可以按照存储库创建的日期将搜索分成多个部分。例如,您可以首先搜索在 2013 年 10 月第一周创建的存储库,然后是第二周,然后是 9 月,依此类推。
由于您将搜索限制在一个狭窄的范围内,因此您可能会得到少于 1000 个结果,因此能够获得所有结果。如果您发现某个时间段内返回的结果超过 1000 个,则您必须进一步缩小时间段,以便可以收集所有结果。
https://help.github.com/articles/searching-repositories/#search-based-on-when-a-repository-was-created-or-last-updated https://help.github.com/articles/searching-repositories/#search-based-on-when-a-repository-was-created-or-last-updated
您应该能够通过 API 自动执行此操作。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)