我目前正在使用必应网络搜索 API v7 https://learn.microsoft.com/en-us/rest/api/cognitiveservices/bing-web-api-v7-reference查询 Bing 的搜索结果。根据 API 文档,参数count
and offset
用于对结果进行分页,结果总数由结果本身的值定义totalEstimatedMatches
.
如下来自文档:
TotalEstimatedMatches:与查询相关的网页的估计数量。使用此数字以及计数和偏移查询参数对结果进行分页。
这似乎在一定程度上有效,之后 API 会继续一遍又一遍地返回完全相同的结果,而不管count
and offset
.
就我的具体情况而言,totalEstimatedMatches
被设置为330,000
。与一个count
of 50
(即每个请求 50 个结果)结果开始重复offset
700 即3,500
结果转化为估计值330,000
.
在使用 bing 前端时,我注意到一旦页数足够高,就会出现类似的行为,例如
-
- 初步搜索,估计
51,000
results
-
- 第一的
1000,应该得到结果 1000 到 1010,但返回与下面的 url 相同的结果
-
-first = 2000,应该得到2000到2010的结果,但返回与上面的url相同的结果
我是否错误地使用了 API,或者这只是某种限制或错误,其中totalEstimatedMatches
还差得远吗?
预计比赛总数提供网络上该查询的匹配总数 - 包括重复的结果和接近相似的内容。
为了优化索引,所有搜索引擎都将结果限制为前 N 个网页。这就是你所看到的。这种行为在所有搜索引擎中都是一致的,因为通常几乎所有用户都会在 2-3 个搜索页面内更改查询/选择网页/放弃。
简而言之,这不是错误/不正确的实现,而是限制您获得更多结果的索引优化。如果您确实需要获得更多结果,可以使用相关搜索并附加独特的网页。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)