通过公共 HTTP 自动将大文件检索到 Google Cloud Storage

2023-12-11

出于天气处理的目的,我希望在 Google Cloud Storage 中自动检索每日天气预报数据。

这些文件可在公共 HTTP URL (http://dcpc-nwp.meteo.fr/openwis-user-portal/srv/en/main.home),但它们非常大(30 到 300 MB 之间)。文件大小是主要问题。

看了之前的stackoverflow话题,我尝试过两种不成功的方法:

1/ 首次尝试在 Google App Engine 中通过 urlfetch



    from google.appengine.api import urlfetch

    url = "http://dcpc-nwp.meteo.fr/servic..."
    result = urlfetch.fetch(url)

    [...] # Code to save in a Google Cloud Storage bucket
  

但我在 urlfetch 行收到以下错误消息:

DeadlineExceededError:等待来自 URL 的 HTTP 响应时超出截止时间

2/ 通过云存储传输服务进行第二次尝试

根据文档,可以通过 Cloud Storage Transfert Service 直接将 HTTP 数据检索到 Cloud Storage 中:https://cloud.google.com/storage/transfer/reference/rest/v1/TransferSpec#httpdata

但下载前需要知道文件的大小和md5。此选项不适用于我的情况,因为该网站不提供这些信息。

3/ 有什么想法吗?

您是否看到任何解决方案可以自动通过 HTTP 将大文件检索到我的 Cloud Storage 存储桶中?


3/ 使用 Compute Engine 实例的解决方法

由于无法使用 App Engine 或直接使用 Cloud Storage 从外部 HTTP 检索大文件,因此我使用了始终运行的 Compute Engine 实例的解决方法。

该实例定期检查是否有新的天气文件可用,下载这些文件并将其上传到 Cloud Storage 存储分区。

出于可扩展性、维护和成本原因,我更愿意仅使用无服务器服务,但希望:

  • 它在新的 f1-micro Compute Engine 实例上运行良好(不需要额外的软件包,如果运行 24/7,只需 4 美元/月)
  • 如果实例和存储桶位于同一区域,则从 Compute Engine 到 Google Cloud Storage 的网络流量是免费的(0 美元/月)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

通过公共 HTTP 自动将大文件检索到 Google Cloud Storage 的相关文章

随机推荐

  • OHLC 聚合器不适用于 pandas 上的数据框?

    我不确定这是一个错误还是设计使然 也许我遗漏了一些东西 并且 ohlc 聚合器不应该与数据帧一起工作 也许这种行为是设计使然 因为除了索引列和价格列之外的数据框可能会产生奇怪的结果 其他聚合器 mean stdev 等 使用数据帧 无论如何
  • JSoup - 选择所有评论

    我想使用 JSoup 从文档中选择所有评论 我想做这样的事情 for Element e doc select comment System out println e 我已经尝试过这个 for Element e doc getAllEl
  • Python 脚本无法通过 Cron 运行?

    我有一个运行另一个 python 脚本的 python 脚本 其他脚本 正在运行的脚本 需要大约 45 分钟 才能完成 当 执行 脚本从 Ubuntu 的 shell 运行时 一切都运行良好 我向 cron 添加了一个条目来运行 执行 py
  • rvest:给定多个列表,返回空节点的 NA

    我对 R 相当陌生 特别是使用它进行网页抓取 因此非常感谢任何帮助 我目前正在尝试挖掘一个包含多个门票列表的网页 并列出其中一些门票的附加详细信息 例如视野不佳或仅供儿童使用的门票 我想提取此数据 为不包含这些详细信息的票证列表留下空格或
  • 如何保护 Azure Blob 存储 URL 不被任何使用开发人员工具的人检索

    我必须将图像 视频保存在天蓝色的 blob 中 然后在我的网站中使用它们 经过一些研究后 我发现您必须在 href 标记中包含 blob url 才能从 azure 检索图像 视频 然而 任何人都可以打开该网站页面并获取该 blob url
  • 使用 VBA 从 Excel 工作表发送多个附件

    我有现有的代码可以从 Excel 文件中的工作表发送邮件 Sub CreateMail Dim objOutlook As Object Dim objMail As Object Dim rngTo As Range Dim rngSub
  • python filter() 函数,以 None 作为过滤器参数

    Input list filter None abs 123 sdf Output abs 123 sdf 据我了解None means no value 在 python 中 但在上面的情况下 过滤函数如何删除空字符串 我很困惑None在
  • 基本数组比较算法

    我正在尝试遵循此处找到的步骤比较两个数组 并知道何时创建新对象 但我只是不明白它是如何工作的 您最终会得到两个已排序的数组 其中一个传递了员工 ID 放入获取请求中 并包含匹配的托管对象 他们 要处理它们 您可以在这些之后遍历排序列表 脚步
  • 如何在 python 中取消引用 urlencoded unicode 字符串?

    我有一个像 Tan m 这样的 unicode 字符串 它以某种方式编码为 Tan u0131m 我怎样才能把这个编码字符串转换回原来的unicode 显然 urllib unquote 不支持 unicode uXXXX 是一个非标准编码
  • 无法获取授权对话框以使用 Google Apps 脚本显示

    我有一个 Google Apps 脚本 我一直在研究它来管理活动资源 它运行良好 我正在使用 API 并使用我的 Python 代码更新工作表 然后 我添加了通过电子邮件通知用户视频已准备好获得批准的功能 我已经看到授权对话框并允许脚本使用
  • 资产管道未预编译 sass

    我已经更新了我的应用程序以使用 Rails 3 1 资产管道 我认为 我可以编译 css 文件 但不能编译 css scss 我正在运行 sass rails gem 但似乎没有任何效果 我应该检查什么 抱歉 我不知道应该在这里提供哪些信息
  • 将 js 变量传递给 html 文件 GAS - BASIC

    我正在尝试将一个变量 单元格 A1 中的我的名字 从我的 code gs 传递到我的 Index html 并通过电子邮件发送 有人可以告诉我我做错了什么或指出我正确的方向吗 Code gs function doGet return Ht
  • 当模态 UIImagePickerController 被关闭时 UIView 通知?

    当模态视图完成关闭时 有没有办法调用代码 EDIT 抱歉 我没早说清楚 我试图关闭 UIImagePickerController 然后显示 MFMailComposeViewController 并将图像数据附加到电子邮件 当我尝试打电话
  • Android GPS数据获取和过滤,如何改进位置信息

    我开始处理 Android 2 1 HTC Hero 上的 GPS 数据 并查看有关卡尔曼滤波器和适合位置数据的最小二乘法的主题 在使用手机接收和记录 GPS 数据时 我发现如果保持在原位置 偏差很小 但移动时坐标非常准确 问题来了 get
  • 如何使用Android SDK监控GPS适配器的状态?

    我需要让我的应用程序监控 GPS 适配器是否启用或禁用 我并不关心当前是否运行实际的 GPS 功能 我需要 GPS 适配器的状态 我可以通过调用手动执行此操作 String providers Settings Secure getStri
  • 使用 join、group by、having、order by 进行序列化

    如何使用 ORM 编写这个查询 SELECT p id p name COUNT c id counter FROM Posts p LEFT JOIN Comments c ON c post id p id WHERE p rating
  • Polymer - 迭代模板中的对象

    根据聚合物文档 可以使用以下方法迭代对象或数组repeat中的声明
  • R Shiny 使用按钮创建多个随机数并保存

    我想创建一个生成随机数的按钮 并将所有随机数保存在我的服务器上 以便稍后评估该数据 不幸的是 我无法生成包含所有随机数的向量 不知何故 for 循环不起作用 谢谢 library shiny ui lt fluidPage actionBu
  • 如何使用 .htaccess 将文本转换为小写 URL

    我想在 htaccess 文件中设置 301 重定向 因此 URL 如下 http example com Foo http example com Foo Bar http example com Foo Bar Blah 改成 http
  • 通过公共 HTTP 自动将大文件检索到 Google Cloud Storage

    出于天气处理的目的 我希望在 Google Cloud Storage 中自动检索每日天气预报数据 这些文件可在公共 HTTP URL http dcpc nwp meteo fr openwis user portal srv en ma