Google 新闻 XML API:使用国家/地区/语言参数

2024-03-19

我想订阅来自 Google 新闻的 RSS/XML 提要,该提要捕获以下查询:

来自任何国家、用德语撰写的提及“studie”(德语“学习”)的文章。

我在用着https://news.google.com/rss/search https://news.google.com/rss/search,但对于此示例,更容易在以下位置查看 UI 输出https://news.google.com/search https://news.google.com/search,因此我将在本例中使用后一个 URL 库。

现在,在XML API 参考 https://developers.google.com/custom-search/docs/xml_results_appendices,谷歌提到four影响语言或国家/地区的不同参数:

  • hl(宿主语言):假设最终用户输入的语言。即,英语使用者输入“study”,Google 假设该术语是英语,然后将结果机器翻译回英语。对我来说,导航到将重定向 URLhl=en-US(完整网址是).

  • gl:提升来源国与参数值匹配的搜索结果。我的网络浏览器中的默认设置是gl=US.

  • lr(语言限制):将搜索结果限制为以特定语言编写的文档

  • cr(国家限制):将搜索结果限制为源自特定国家/地区的文档

基于以上所有内容,这意味着 URL 为*:

然而,这一尝试惨遭失败。它显示来自美国的英语结果,并且 302 重定向到:

因此,为此:

  • 如何正确构建 URL 参数以捕获“来自任何国家/地区以德语撰写的提及“studie”(德语“学习”)的文章。”
  • 到底是什么ceid为什么谷歌完全没有记录它?

* I.e.:

>>> import urllib.parse
>>> urllib.parse.parse_qs('q=study&hl=en-US&lr=lang_de')                                                                                                     
{'q': ['study'], 'hl': ['en-US'], 'lr': ['lang_de']}

相关但未解决任何问题:

  • 将 Google 新闻 RSS 限制为特定国家/地区 https://stackoverflow.com/questions/13010323/limit-google-news-rss-to-specific-country
  • RSS Google 新闻语言 https://stackoverflow.com/questions/55512323/rss-google-news-language
  • 使用 Google 新闻 RSS URL 时如何指定检索本地新闻? https://stackoverflow.com/questions/13480710/how-do-you-specify-retrieving-local-news-when-using-a-google-news-rss-url?rq=1

我正在使用以下网址,它对我有用:

https://news.google.com/rss?q=studie&hl=de-DE&gl=DE&ceid=DE:de

您也可以主题搜索,请参考这个答案:Google 新闻 RSS 源的 URL 格式 https://stackoverflow.com/questions/51537063/url-format-for-google-news-rss-feed

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Google 新闻 XML API:使用国家/地区/语言参数 的相关文章

  • 从 URL 获取页面内容?

    我想通过以下代码从 URL 获取页面内容 public static String getContentResult URL url throws IOException InputStream in url openStream Stri
  • useParams 钩子在 React 功能组件中返回未定义

    该应用程序显示所有照片
  • 尝试获取 Google accessToken

    看起来 无论我做什么 谷歌都在竭尽全力阻止我完成这个研究项目 我的项目让我使用 Google 电子表格作为数据库 并使用所述电子表格中的数据执行程序化的 Google 图片搜索 并向最终用户显示一些结果 设置说明 我开始按照此处的说明进行操
  • 获取express.js中间件请求中“#”后的url

    我需要获取服务器中间件上的 url 使用express js 我用req url但是当 url 开头时 some urlreq url 返回 与req path 有没有办法获取url之后 在express js中 No URL 中以 符号永
  • 扩展 RegExp 以获取文件扩展名

    我知道 已经有很多基于 RegExp 的解决方案 但是我找不到适合我需求的解决方案 我有以下函数来获取 URL 的各个部分 但我还需要文件扩展名 var getPathParts function url var m url match w
  • 将 window.location 传递给 Flask url_for

    我正在使用 python 在我的页面上 当匿名用户转到登录页面时 我想将一个变量传递到后端 以便它指示用户来自哪里 发送 URL 因此 当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
  • ModX Revo:更新站点基本 URL?

    在选择域名之前 我为客户开发了一个网站 因此 网站页面的 URL 如下所示 http host mynost net tempname index php id 8 域名现已购买 但如果我单击任何 Wayfinder 链接 它仍然使用上面的
  • 访问 UserDefault 数组 URL 以填充 CollectionView

    这是上一篇文章的后续内容here https stackoverflow com questions 48142238 save and append an array in userdefaults from imagepickercon
  • 使用 Python 3.x 基本获取 URL 的 HTML 正文

    我是Python新手 我对 Python 2 x 中的旧 urllib 和 urllib2 与 Python 3 中的新 urllib 之间的差异有点困惑 除此之外 我不确定数据在发送到 urlopen 之前何时需要编码 我一直在尝试使用
  • google-oauthlib-tool 不询问授权码,并且在 rpi-4B 上没有“--headless”选项

    我正在尝试嵌入谷歌助手SDK https developers google com assistant sdk在我的树莓派上通过以下方式本指南由 Google 提供 https developers google com assistan
  • 分页当前链接未突出显示

    我遇到了一个奇怪的问题 我当前的分页链接未突出显示 我制作的分页网址如下所示 site com list 50 some value 一切工作正常 但当前视图中的分页链接未突出显示 我检查了CSS 没问题 我猜问题出在库上 这是我的代码 我
  • 将查询参数添加到 URL

    我正在尝试自动从网站下载数据 我需要将动态参数传递到每天更改的站点 html 的结构是表格而不是表单 如何传递参数并从 url 获取结果 这是我尝试过的 它需要在 python 2 7 中 import urllib url https d
  • Google API 令牌端点 POST 返回错误请求 400

    我正在尝试用一次性 Google Plus 授权代码换取访问令牌 但我不断收到 400 Bad Request 我正在使用VB NET 这是代码 We should now have a good one time authorizatio
  • 将 url 重定向到带有尾随点的主页

    Google 网站管理员显示一些重复的网址 他们是 www abc com index php option com toys view detail n id 148 ite www abc com index php option co
  • Google PageSpeed Insights API 无法正常工作 [PHP]

    我是 PHP 的初学者 所以也许有人可以帮助解决这个问题 我的网络应用程序显示 Google PageInsights API 错误 这是代码 我尝试将版本更改为 v2 但仍然不起作用 public function getPageSpee
  • 如何使用reportlab添加单词的链接?

    我对链接和报告实验室感到困惑 我想要一个带有单词的文本 其中 包含 可点击的链接 例如 我写这样的文字 This web site is called StackOverflow 我想要这个词StackOverflow可点击并引导至相应页面
  • 在 Google API 中创建新项目时出现未知错误

    当我尝试在以下位置创建项目时出现此错误console developers google com https console developers google com 我的配额中还剩下 8 个项目 我尝试过不同的名称和不同的项目 ID 当
  • 如何从图库中检索图像的 Picasa ID/URL

    我有一个活动 从设备的图库中检索图像并将其上传到服务 现在 出于优化目的 我希望避免上传 Picasa 上的图像 而只存储其 ID 或 URL 以供以后检索 所以我的问题是 如何检索该信息 我的意图代码粘贴在下面并检索图像的 URI Int
  • 从 Laravel 的 URL 中删除 index.php

    我正在 Linux Mint 中使用 Laravel 5 5 12 我正在使用 LAMP 堆栈 我想删除index php来自网址 我的mod rewrite已启用阿帕奇模块 My htaccess文件位于public文件夹 它包含以下代码
  • PHP显示图片从url到主页

    在没有人回答这个问题之后Php Rss feed 在 CDATA gt content encoded 中使用 img https stackoverflow com questions 31771729 php rss feed use

随机推荐