如何使用 Jsoup 从 Google 获取#resultStats

2023-12-06

我正在尝试获取 Google 向我们展示的文章数量:

This是谷歌搜索的jeb bush barack obama,它显示了我需要的数字,即10,200,000文章

我如何使用 Jsoup 及其任何组件来获取该数字?

我试过:
Document document = Jsoup.connect(url).get(); Elements description = document.select("div#resultStats"); desc = description.attr("content");

注意:我使用的是 Android Studio,我想将结果保存到矩阵中。

Edit: Here就是我看到的关于HTML源代码的文章数量。


实际上,您可能会获得一些优化的 JavaScript 代码(针对现代浏览器),需要运行这些代码才能查看实际结果统计信息。相反,请更改您的用户代理字符串(对于最旧的浏览器 UA 字符串)和 url,如下面的代码所示:

DEMO

http://try.jsoup.org/~iYErM3BgfjILVJZshDMkAd-XQCk

示例代码

String url = "https://www.google.com/search?q=jeb+bush+barack+obama";

Document document = Jsoup //
                   .connect(url) //
                   .userAgent("Mozilla/5.0 (Windows; U; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)") //
                   .get();

Element divResultStats = document.select("div#resultStats").first();
if (divResultStats==null) {
    throw new RuntimeException("Unable to find results stats.");
}

System.out.println(divResultStats.text());

输出(截至撰写本文时...)

About 10,500,000 results

在 Jsoup 1.8.3 上测试

更多 UA 字符串:http://www.useragentstring.com/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Jsoup 从 Google 获取#resultStats 的相关文章

随机推荐