使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

2024-06-21

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中。我想知道是否添加了对 Python 的支持，这就是我无法阅读它们的原因。我看到它存在于Java中。

pipeline_options = PipelineOptions()
pipeline_options.view_as(StandardOptions).streaming = True

pipeline = beam.Pipeline(options=pipeline_options)
messages = (pipeline | beam.io.ReadFromPubSub(subscription=subscription_name).with_output_types(bytes))

def printattr(element):
    print(element.attributes)


lines = messages | 'printattr' >> beam.Map(printattr)

result = pipeline.run()
result.wait_until_finish()

期望能够列出属性-数据：

b'Message number 1109'
-     attributes: {
-       "_comments": "nan",
-       "_direction": "SE",
-       "_fromst": "Harlem",
-       "_last_updt": "2019-03-20 21:11:02.0",
-       "_length": "0.56",
-       "_lif_lat": "41.9809967484",
-       "_lit_lat": "41.9787314076",
-       "_lit_lon": "-87.7964600566",
-       "_strheading": "W",
-       "_tost": "Oak Park",

，但我似乎只能访问存储在数据字段中的信息，而不能访问属性。

查看文档后：https://beam.apache.org/releases/pydoc/2.11.0/apache_beam.io.gcp.pubsub.html https://beam.apache.org/releases/pydoc/2.11.0/apache_beam.io.gcp.pubsub.html，我能够看到传递给 ReadFromPubSub 的附加参数。

需要设置“with_attributes=True”，否则，您只能获取数据字段。

希望这可以帮助其他可能陷入困境或只是感到疲倦的人:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

googlecloudpubsub

apachebeamio

使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持的相关文章

pywinauto 32位用户警告

我正在尝试使用 pywinauto 在每次更新类文件时自动启动和停止 TomCat 但是当我尝试运行它时它会给出以下警告 UserWarning 32 bit application should be automated using
tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot
Django：将博客条目查看次数增加一。这有效率吗？

我的索引视图中有以下代码 latest entry list Entry objects filter is published True order by date published 10 for entry in latest ent
只使用 Django 的某些部分？

我喜欢 Django 但对于一个特定的应用程序我只想使用它的一部分但我对 Django 的内部工作原理还不够熟悉所以也许有人可以指出我必须做什么的正确方向查看具体来说我想使用模型和数据库抽象 The 缓存API http doc
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
PyCharm - 如何挂起所有线程

我们使用 PyCharm 5 0 1 进行多线程调试当它在断点处停止时只有特定线程停止而所有其他线程继续这使得冻结时刻和检查参数值以及其他线程的当前状态变得困难当其中一个线程在断点处停止时是否可以挂起所有线程这在最新的 P
如何测试列表中多个值的成员资格

我想测试两个或多个值是否在列表中具有成员资格但我得到了意外的结果 gt gt gt a b in b a foo bar a True 那么 Python 可以同时测试列表中多个值的成员资格吗这个结果意味着什么 See also How
Python 中的十进制到二进制半精度 IEEE 754

我只能使用以下命令将十进制转换为二进制单精度 IEEE754struct pack模块或者使用相反的方法 float16 或 float32 numpy frombuffer 是否可以使用 Numpy 将十进制转换为二进制半精度浮点数我
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何保持 python 3 脚本 (Bot) 运行

不是母语英语抱歉英语可能很蹩脚我也是编程新手您好我正在尝试使用 QueryServer 连接到 TeamSpeak 服务器来创建机器人经过几天的努力它有效只有 1 个问题而我却被这个问题困扰了如果您需要检查这是我正在使
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中

随机推荐

现代编译器的 C++ 中“memset”功能的状态

Context 不久前我偶然发现了 Alexandrescu 在 2001 年发表的 DDJ 文章 http www ddj com cpp 184403799 http www ddj com cpp 184403799 它是关于比较将
如何在C++中列出Python模块的所有函数名称？

我有一个 C 程序我想导入一个 Python 模块并列出该模块中的所有函数名称我该怎么做我使用以下代码从模块中获取字典 PyDictObject pDict PyDictObject PyModule GetDict pModule
在Java程序中计算zip文件的md5哈希值

我有一个 zip 文件在我的 Java 代码中我想计算 zip 文件的 md5 哈希值有没有我可以用于此目的的 java 库一些例子将非常感激谢谢几周前我通过这篇文章做到了这一点 http www javalobby org ja
如何强制 Y 轴仅使用整数

我正在使用 matplotlib pyplot 模块绘制直方图我想知道如何强制 y 轴标签仅显示整数例如 0 1 2 3 等而不显示小数例如 0 0 5 1 1 5 2 等我正在查看指导说明并怀疑答案就在附近matplotlib
在元素中优先考虑 ngclick 而非 nghref

tl dr 如何强制 Angular 只执行 ngclick 指令 a 元素而不清空删除href 我的网站在某些元素上有一些自定义行为模式打开位置栏更新等但对于 SEO 索引我also需要它成为一个 a 元素与href包含有效链接的
Polymer core-ajax 不会发布 JSON？

我正在使用 core ajax 来检索 JSON 数据将组件翻转为 JSON 格式回传到服务器则完全是另一回事在所有情况下无论传入的 contentType 或 handleAs 参数如何作为输入传入的 JSON 对象似乎都会被转换
对象变空似乎是 Hangfire 中的反序列化问题

Hangfire 似乎无法反序列化我的原始版本Scheduler对象及其所有状态我正在调用其 Execute 方法BackgroundJob Enqueue 如下所示 Scheduler new FileInFileOut FileIn
MySQL 的 TEXT 类型的 Oracle 等效项

Oracle 是否有与 MySQL 等效的列类型TEXT type 如果不是那么通常如何存储较大的文本块 BLOB varchar 32767 如果重要的话它是通过 PHP 访问 Oracle 10 历史背景是非常受欢迎的 Oracle
我可以重写/扩展 Meteor 方法吗？

是否有可能以某种方式重写 Meteor 中的方法或者定义另一个函数使得both会被叫吗在我的常规代码中 Meteor methods foo parameters gt bar parameters 稍后加载的其他地方例如在test
Javascript 选择 onchange='this.form.submit()'

我有一个带有选择和一些文本输入的表单我希望在更改选择时提交表单使用以下方法可以正常工作 onchange this form submit 但是如果表单还包含提交按钮则当选择更改时表单不会提交我猜有某种冲突我在这里有什么选择
Django 接受 AM/PM 作为表单输入

我试图弄清楚如何使用 DateTime 字段在 Django 中接受 am pm 作为时间格式但我遇到了一些麻烦我尝试在 forms py 文件中这样设置 pickup date time from DateTimeField inpu
如何一次导入多个 .csv 文件？

假设我们有一个包含多个 data csv 文件的文件夹每个文件包含相同数量的变量但每个文件来自不同的时间 R 中有没有办法同时导入它们而不必单独导入它们我的问题是我有大约 2000 个数据文件需要导入并且必须使用以下代码单独导入
向客户端发送状态码 500 时页面未呈现

我有一个页面通用处理程序我想在该页面上向客户端返回状态代码 500 以指示出现问题我这样做 Response StatusCode 500 Response StatusDescription Internal Server Erro
运行 Spring 测试时如何修复 H2 插件（版本 1.4.200）的错误：JdbcSQLSyntaxErrorException：未找到列“start_value”

我必须将 Spring Boot starter 从 2 1 4 RELEASE 更新到 2 2 6 RELEASE 但现在集成测试失败我的测试是用 Groovy 进行的我的应用程序是用 Java 编写的它们与之前的 Spring 版
使用函数参数作为 R 中新数据框的名称

这很简单但我已经搜索并未能找到这个小问题的解决方案我想使用函数的参数作为新数据框的名称例如 assign dataset lt function dataname x lt c 1 2 3 y lt c 3 4 5 dataname
React-Native：如何在下载文件时显示进度？

要求我想显示一个渐进指示器显示已完成加载的百分比我已经使用 fetch 进行 api 服务调用是否有可能以任何方式获得下载完成的百分比或者任何第三方库我已经解决了这个问题这是我使用的 npmrn 获取 blob https w
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
如何在 angularjs 中修剪（）字符串？

有角度特定的方法吗如果没有我应该使用内置的jquery 来做到这一点吗如果我应该使用内置的jquery 如何在不使用的情况下访问trim 函数或者这是必要的编辑是的我知道 str trim 对不起我需要这个才能在 IE 8
Postman - 如何计算 JSON 响应中特定对象的出现次数

我是 JSON 和 Postman 的新手我相信我正在尝试做一些非常简单的事情我创建了一个 GET 请求它将获得如下所示的 JSON 响应在下面的例子中我想得到count响应中所有 IsArchived 属性这些属性的数量因响应而
使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

尝试将具有存储在 PubSub 中的属性的消息拉取到 Beam 管道中我想知道是否添加了对 Python 的支持这就是我无法阅读它们的原因我看到它存在于Java中 pipeline options PipelineOptions pi

使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持

使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持 的相关文章

随机推荐

热门标签

使用Beam IO ReadFromPubSub模块时，可以在Python中提取带有属性的消息吗？尚不清楚是否支持的相关文章