异步写入 appengine blob 并在所有任务完成时完成它

2023-11-30

我有一个难题。

我正在迭代一组按日期参数化的 URL 并获取它们。例如，下面是一个示例：

somewebservice.com?start=01-01-2012&end=01-10-2012

有时，从 URL 返回的内容会被截断（缺少带有“截断错误”消息的随机结果），因为我定义的范围太大，所以我必须将查询拆分为两个 URL

somewebservice.com?start=01-01-2012&end=01-05-2012

somewebservice.com?start=01-06-2012&end=01-10-2012

我递归地执行此操作，直到结果不再被截断，然后写入允许并发写入的 blob。

每个 URL 获取调用/blob 写入都在单独的任务队列任务中处理。

问题是，我一生都无法设计一个计划来知道所有任务何时完成。我尝试过使用分片计数器，但递归使其变得困难。有人建议我使用 Pipeline API，所以我看了 Slatkin 的演讲 3 遍。它似乎不适用于递归（但我承认我仍然没有完全理解该库）。

无论如何，是否有办法知道一组任务队列任务（以及递归生成的子任务）何时完成，以便我可以完成我的 blob 并对其执行任何操作？

谢谢，约翰

你读过吗管道入门文档？管道可以创建其他管道并等待它们，因此做你想做的事情相当简单：

class RecursivePipeline(pipeline.Pipeline):
  def run(self, param):
    if some_condition: # Too big to process in one
      p1 = yield RecursivePipeline(param1)
      p2 = yield RecursivePipeline(param2)
      yield RecursiveCombiningPipeline(p1, p2)

Where RecursiveCombiningPipeline只是充当两个子管道的值的接收器。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googleappengine

MapReduce

blobstore

taskqueue

异步写入 appengine blob 并在所有任务完成时完成它的相关文章

为什么我的日期选择器看起来这么奇怪？

我正在尝试使用 jquery UI 我下载了所有内容并按照说明进行操作我在 html 中添加了这样的代码
尝试获取 GCS 中存储的图像的 getServingUrl 时出现 OBJECT_NOT_FOUND

我写了一个Servlet 我正在其中读取图像blobstore 来自 GCS 的另一张图像然后在对这两个图像应用合成后我将合成图像存储回 GCS 中我的代码到目前为止运行良好之后当我尝试获取合成图像的服务 url 时我得到了一个
如何进行重定向并保留查询字符串？

我想进行重定向并保留查询字符串就像是self redirect加上发送的查询参数那可能吗 newurl my new route urllib urlencode self request params self redirect ne
MongoDB 存储过程等效项

我有一个包含商店列表的大型 CSV 文件其中一个字段是邮政编码我有一个名为 ZipCodes 的独立 MongoDB 数据库它存储任何给定邮政编码的纬度和经度在 SQL Server 中我将执行一个名为 InsertStore 的
Mapreduce shuffle 阶段出现内存不足错误

我在运行时遇到奇怪的错误类似字数统计映射缩减程序我有一个包含 20 个从站的 hadoop 集群每个从站都有 4 GB RAM 我将 Map 任务配置为 300MB 堆 Reduce 任务槽为 1GB 我每个节点有 2 个映射槽和 1
Cloud SQL 间歇性通信链路失败

我在用着jmeter对使用 Cloud SQL 的 GAME Web 服务进行压力测试我收到间歇性通信链接失败异常我尝试过使用直接连接和连接池并且在这两种情况下都看到了异常随着每秒请求数的增加异常也会增加请注意我们使用的是最高
让 prerender.io 与 Facebook 爬虫（maven、GAE）一起使用？

我有一个 angularjs 应用程序我想在 Facebook 上分享页面这是通过元标签处理的 https developers facebook com docs sharing best practices https develo
从 Android 访问云存储

我一直无法找到任何有关如何从 Android 应用程序使用云存储的具体文档我确实遇到过这个客户端库 https cloud google com storage docs reference libraries然而 Google Clou
如何忽略 NDB/DB 查询中的大小写

这似乎是一个简单的问题但我没有看到任何内容类定义 https developers google com appengine docs python ndb queryclass hl en 如果我有疑问 Video query Vide
使用 Django 在 App Engine 上存储图像

我正在尝试使用 Django 在 Google App Engine 上的 db BlobProperty 字段中上传并保存调整大小的图像我认为处理请求的相关部分如下所示 image images resize request POST
Google App Engine 上按 IP 地址划分流量

我想根据一组已知 IP 地址将流量引导至不同版本的 Google App Engine 代码例如如果传入请求来自给定列表上的 IP 地址则流量将定向至版本 1 如果不是则定向至版本 2 有没有办法从管理控制台或部署配置中执行此操作
MongoDB/PyMongo：如何在 Map 函数中使用点表示法？

我正在尝试计算每个邮政编码中找到的记录数在我的 MongoDB 中嵌入了邮政编码使用点表示法它位于 a res z a 代表地址 res 代表住宅 z 代表邮政编码例如这工作得很好 db NY count a res z 141
本地主机上的 Google App Engine GQL 查询

我正在 Google App Engine Windows 上的 SDK 版本 1 7 0 上开发一个应用程序我需要经常测试该应用程序并且此测试涉及数据存储上的大量 GQL 查询您可以在 App Engine 管理界面的浏览器中在线运
如何限制 Google App Engine Endpoints API 访问仅限我的 Android 应用程序？

我是一名 Android 开发人员为我的应用程序构建了我的第一个 Google App Engine java 后端除了我的应用程序之外我不希望其他任何人访问此 API 我计划使用 App 引擎来验证我的 Android 应用程序中的
如何在谷歌应用程序引擎上录制视频？

如何使用谷歌应用程序引擎从客户端浏览器录制视频该应用程序对于使用 youtube API 非常有用目前我制作的应用程序仅允许视频上传但我需要用户能够在浏览器中录制视频谢谢你 Flash 视频捕获无法工作因为它需要 RTMP 服务
无法解析 ReferenceProperty -- App Engine

我遇到了一个错误无法找出其根本原因错误如下 ReferenceProperty 无法解析 u StatusLog STATUSLOGSID 此错误仅有时发生大约一天一次或两次生成此错误的脚本成功的次数多于失败的次数该错误最奇怪的事
GAE：java.lang.NoClassDefFoundError：com/google/appengine/api/blobstore/BlobstoreServiceFactory

请帮我解决这个问题我正在使用 blob 存储来保存图像它在我的本地环境中运行得非常好但是当我在云中部署相同的代码时它会抛出异常 java lang NoClassDefFoundError com google appengine
为什么 CouchDB 归约函数接收“键”作为参数

使用 CouchDB 减少功能 function keys values rereduce 这被称为这样 reduce key1 id1 key2 id2 key3 id3 value1 value2 value3 false 问题1 将键
502 错误网关错误 - 从上游读取响应标头时上游发送了太大的标头

我在 Google App Engine 中使用 WordPress 当我创建 POST API 时出现错误在从上游读取响应标头时上游发送了太大的标头返回 502 错误网关 nginx 我在 POST API 中发送的数据 JSON
我可以在 Google Cloud End Point 中返回通用名称吗

当我返回一个泛型时端点 api 文件似乎消失了示例代码已粘贴 ApiMethod public RestResponse

随机推荐

客户端路由（使用react-router）和服务器端路由

我一直在思考对Client和Server之间的路由感到困惑假设我在将请求发送回Web浏览器之前使用ReactJS进行服务器端渲染并使用react router作为客户端路由来在页面之间切换而无需像SPA那样刷新我想到的是路线如何
在 WPF 应用程序中使用 WinRT 库。

我在这里关注了这篇文章 http blogs msdn com b eternalcoding archive 2013 10 29 how to use specific winrt api from desktop apps captu
代码点火器错误 403

我是 CodeIgniter 一般框架的完全初学者我尝试了 Laravel 和 CakePHP 但两者安装起来都非常复杂对我来说所以现在我已经下载了 CI 除了这个访问被拒绝错误之外它看起来非常简单该错误是默认的 Firefox
在 UpdateProgress 期间隐藏 UpdatePanel

我正在寻找在等待提交响应返回时隐藏 UpdatePanel 的最简单方法东西就像这里描述的那样使用 Ajax Control Toolkit 和 UpdatePanelAnimationExtender 既过度杀伤又导致一些问题即因
如何在锚标记内编写 ::before / ::after

如何在锚标记内编写 before 如下所示你在这里看到的是一个CSS伪元素 before伪元素可用于在元素内容之前插入一些内容例如以下代码将插入This comes before 在每个段落之前 p before content Th
SceneKit 中的 COLLADA 转换

我们尝试在Xcode中制作模型查看器并使用SceneKit来渲染模型如果我们将 COLLADA dae 文件添加到 Xcode 它会使用以下命令转换模型scntool to c3d格式在互联网上找到的但我们希望在运行时加载模型我们将
epoll 在客户端断开连接时循环

我正在尝试使用以下方式实现套接字服务器epoll 我有 2 个线程执行 2 个任务监听传入的连接在屏幕上写入客户端发送的数据对于我的测试我将客户端和服务器放在同一台计算机上并运行 3 或 4 个客户端服务器工作正常直到我不通过
如何使用 scipy.optimize 中的 curve_fit 以及跨多个数据集的共享拟合参数？

假设我有一个拟合函数f具有多个参数例如a and b 现在我想将多个数据集拟合到这个函数并使用相同的a对于所有这些共享参数同时b每个配件都可以是单独的 Example import numpy as np Fit function d
交换 numpy 矩阵中的零

我有一个像这样的 numpy 矩阵 array 2 1 23 32 34 3 3 0 3 33 0 0 32 0 0 0 dtype int32 现在我想将所有数字向右移动并将零交换到左侧如下所示 array 2 1 23 32 0 34
如何将绑定源过滤器重置为空

Using BindingSource在 LINQ to SQL 上并实现了BindingList在我的项目中我必须使用Textbox过滤 a 中的行DataGridView 所以当我删除文本框内容时 Filter 应该重置为空我的代
如何摆脱 Angular Material 额外的样式和由它“强制”链接的 CSS

我正在使用 JSPM SystemJS 我正在使用 Angular Material 和额外的表库它也导入 Angular Material I also 很想使用 SASS ONLY 版本Angular Material by impo
关于使用Scanner时InputMismatchException的问题

问题输入文件客户的账号账户余额月初交易类型取款存款利息交易金额 Output 帐号期初余额期末余额支付的利息总额存款总额存款数量存款取款总额取款次数 package sentinel import java
如何在 GAE 上的 Django 中使用 django-google-cloud-storage 进行 GCS

如何将 Django 自定义存储后端与 Google Cloud Storage 结合使用尝试使用这个 ckopanos 的 django google cloud storage 根据文档我已将以下内容添加到我的 settings p
更改默认的 git hooks

不确定这在 git 中是否可行我还没有找到它但我可能在搜索中使用了错误的词汇但是能够修改和启用钩子作为所有新存储库的默认值会很有用在我的意思是创建时间因此不必在每次创建新存储库时都进行自定义似乎最简单的方法是编写一个包装器在创
(C) 在屏幕上和文件中打印所有 CP850 字符的程序具有不同的输出

该程序非常简单它帮助我获得了所有 ascii 代码因为我的计算机似乎不遵循互联网中的标准我发现的问题是文件和 cmd 上的输出不同我需要在打印文件并在屏幕上显示的项目中使用框字符但文件输出显然没有它们 define CRT SEC
在 Gradle 构建中配置多个上传存储库

我想将我的工件上传到远程 Nexus 存储库因此我在 Nexus 中配置了快照和发布存储库部署到两个作品现在我想配置我的构建以便我可以决定要部署在哪个存储库中 gradle uploadArchives应该部署到我的快照存储库 gr
轻量级跨平台提示文件的方式

我发现了一种非常内置且简单的方法来提示系统特定的漂亮的打开文件对话框 import Tkinter from tkFileDialog import askopenfilename tk root Tkinter Tk tk root wi
吞吐量和响应时间有何关系

我对 193 个样本进行了 JMeter 测试我可以看到我的平均响应时间为 5915 毫秒吞吐量为 1 19832 我只是想知道它们到底有什么关系所有的答案都在JMeter 术语表已过去的时间 JMeter 测量从发送请求之前到收到
将正则表达式转换/编译为 C 代码

我的系统内存有限 boost regex太大了有哪些选项可以将我的正则表达式直接编译为 C C 以及我应该排除多少 KB 的代码大小目标是尽可能减少内存和代码大小我正在寻找 100kb 以下的代码大小和相同的内存使用量 Boost 正
异步写入 appengine blob 并在所有任务完成时完成它

我有一个难题我正在迭代一组按日期参数化的 URL 并获取它们例如下面是一个示例 somewebservice com start 01 01 2012 end 01 10 2012 有时从 URL 返回的内容会被截断缺少带有截断

异步写入 appengine blob 并在所有任务完成时完成它

异步写入 appengine blob 并在所有任务完成时完成它 的相关文章

随机推荐

热门标签

异步写入 appengine blob 并在所有任务完成时完成它的相关文章