运行梁管道时，“PBegin”对象没有属性“windowing”

2023-12-03

我在运行数据流作业时发现“PBegin”对象没有属性“windowing”。我在 pardo 函数中调用 connectclass 类。

我正在尝试从 Beam python SDK 连接 NOSQL 数据库并运行 sql 从表中提取数据。然后使用另一个 pardo 将输出写入单独的文件。

class Connector(beam.DoFn):
    def __init__(self,username,seeds,keyspace,password,datacenter=None):
    self.username = username
    self.password = password
    self.seeds = seeds
    self.keyspace = keyspace
    self.datacenter = datacenter
    super(self.__class__, self).__init__()

    def process(self, element):

    if datacenter:
        load_balancing_policy = DCAwareRoundRobinPolicy(local_dc=self.datacenter)
    auth_provider = PlainTextAuthProvider(username=self.username, password=self.password)
    cluster = Cluster(contact_points=self.seeds,
                      load_balancing_policy=load_balancing_policy,
                      auth_provider=auth_provider)
    session=cluster.connect(self.seeds,self.keyspace,self.username, self.password, self.datacenter)
    rows = session.execute(SQL Query)
    yield rows

刚刚偶然发现了同样的问题。尝试连接到 RDBMS 源，但我想就实现设计而言，NoSQL 和 SQL 数据库之间没有区别。

除了 Jayadeep Jayaraman 的建议之外，恕我直言，这可以通过使用 ParDo 来实现。实际上，使用 ParDo 进行连接是什么梁文档推荐如果这样做的限制对于您的用例来说是可以接受的：

对于有界（批量）源，当前有两种创建 Beam 源的选项：

使用 ParDo 和 GroupByKey。

使用 Source 接口并扩展 BoundedSource 抽象子类。

ParDo 是推荐的选项，因为实现 Source 可能很棘手。请参阅何时使用>源接口，获取您可能想要使用源>>的一些用例列表（例如动态工作重新平衡）。

您没有展示您如何使用您的 DoFn。对我来说，记住 DoFn 作用于现有 PCollection 的元素是有帮助的。它本身无法从头开始创建 DoFn。所以为了解决你提到的问题，您可能希望从内存创建一个 PCollection，其中包含用于从源检索数据的查询的一个元素。然后应用从源读取的 ParDo 到此 PCollection。

顺便说一句：我为每个分区设计了一个元素，我想从 Pcollection 中的 RDBMS 中读取数据 - 这样就可以从 SQL 数据库中并行读取数据。

解决方案可能如下所示：

p | beam.Create(["Your Query / source object qualifier goes here"]) 
  | "Read from Database" >> beam.ParDo(YourConnector())

我也提一下使用 DoFn 的 start_bundle 和 finish_bundle 方法来设置/断开连接可能是个好主意.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

运行梁管道时，“PBegin”对象没有属性“windowing” 的相关文章

requests.iter_content() 认为文件已完成，但事实并非如此

这个问题与我见过的其他问题不同requests iter content 在那里面requests似乎认为它已成功到达我正在迭代的文件末尾实际上该文件已被截断且不完整我尝试处理的文件是一个 17gb gzip 需要丰富并存储在数据库中
Linux 上的 Python 3.6 tkinter 窗口图标错误

我正在从 Python GUI 编程手册学习 Python GUI 某项任务要求我通过将以下代码添加到我的配方中来更改窗口图标 Change the main windows icon win iconbitmap r C Python3
为什么即使没有要打印的数据，打印命令也会换行

只是打字print在 python 中只给出换行符打字print3 x 中没有括号也会给出换行符为什么 Because 文档 https docs python org 3 library functions html print sa
无法在 python 中导入名称 GoogleMaps

我使用下面的代码来获取地址的纬度和经度 from googlemaps import GoogleMaps gmaps GoogleMaps api key address Constitution Ave NW 10th St NW Wa
AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
Tweepy 流式传输错误

我正在尝试使用 tweepy 和 textblob 分析推文的情绪我执行了 pip install tweepy 并且安装成功但出现以下错误错误信息文件 C Users joshey Desktop sent py 第 2 行位于
设置 Pyenv 的路径

我正在尝试在我的服务器中设置 Pyenv 的加载路径 bashrc file 我正在关注这个tutorial https realpython com intro to pyenv 它要求我们在哪里设置pyenv到加载路径然而在我的 b
使用 InlineKeyboardButton python telegram bot 发送命令

在Python电报机器人中是否有可能InlineKeyboardButton发送类似命令 cancel当它被按下时例如当用户按下取消按钮时他们将自动发送 cancel 命令然后由机器人处理从这里的例子来看 https githu
Python 3.6 ZeroMQ (PyZMQ) asyncio pub sub Hello World

我刚刚开始使用 ZeroMQ 我正在尝试让 Hello World 在 Python 3 6 中与 PyZMQ 和 asyncio 一起使用我试图将模块的功能与发布订阅代码分离因此有以下类设置 Edit 1 最小化示例 Edit 2
如何在 Python 中根据日期列绘制分类变量

我有这样的数据 Date Fruit 2017 01 01 Orange 2017 01 01 Apple 2017 01 08 Orange 2017 01 09 Orange 2017 01 09 Apple 我想在一个图中按日期绘制橙
如何在python 3.6.5中通过变量创建子元素

我的代码是 import xml etree ElementTree as ET from lxml import etree var1
为什么我的 Pygame 窗口在为对象设置动画时会闪烁？

所以我的 pygame 窗口不会停止闪烁我知道只要one项目在snake snakearray 不会闪烁 class for the array class snake snakearray ScreenConfigs width 2 S
python 中的 exec 关键字有什么作用？

code compile a 1 2
使用 Tabula 通过 Python 读取 pdf 时出现 Java 错误

我已经安装了 tabula 库用于使用 python 将 pdf 读取到 pandas 数据框中但是当我运行代码时 import tabula df tabula read pdf sample1 pdf pages 1 我得到了例外
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
将 Python 3.5 项目转换为 Jython - UnicodeDecodeError: 'unicodeescape' 编解码器无法解码位置 4-10 中的字节：非法 Unicode 字符

我的最终目的是将正在运行的 Python 项目转换为 Jython 解释器因为将添加一些 java API Details 最新的 Jython 是 2 7 我的项目可以使用 Python 3 5 运行所以我采取了以下方法第一件事是利
带有空格的 Firestore 文档字段名称在 Python 中与 .where() 一起使用时会返回错误

使用 Firebase 的 Cloud Firestore 在 Python 3 7 中编写一个非常简单的程序在程序中我使用 where 下拉集合的一部分然后使用 for 循环对其进行迭代当任何带有空格的字段名称被传递到 where
如何在单元测试中模拟 subprocess.call

我使用的是 python 3 3 我必须测试一个使用的方法call来自 subprocess py I tried subprocess call MagicMock with patch subprocess call as TU cal

随机推荐

如何在Python中模糊匹配数组列中的项目？

我有一系列来自 NCAA 的球队名称以及与其相关的统计数据学校名称通常会被缩短或完全省略但名称的所有变体通常都有一个共同元素例如阿拉巴马州赤潮与赤潮这些名称全部包含在一个数组中没有特定的顺序我希望能够通过模糊匹配来获取团队名称
在“for”循环中读取带有空格、制表符和多个输入文件的完整行

我看过以下文章 for 环形它会在出现空格制表符或换行符等空白时进行分割为了解决这个问题我有以下额外的命令 IFS n 但是当我尝试根据以下细节解决上述场景时我有两个文件输入1 txt and 输入 txt 在我当前的目录中 b
在 ruamel.yaml 迭代期间获取评论

当我迭代 YAML 对象时如何获取注释 yaml YAML with open path r as f yaml data yaml load f for obj in yaml data how to get the comments h
Wordpress 的 nginx 配置位于同一服务器的 Rails 应用程序的子目录中

当我尝试访问 example com blog 时我不断收到文件未找到错误并且在 var log nginx error log FastCGI sent in stderr Primary script unknown while
返回一个随机偶数

我有以下几种方法 rnd 方法返回两个边界之间的单个随机整数 Create next batch of 55 random numbers void advance random int j1 double new random for j
文件上传控制和 GWT 外观

我正在编写我的第一个 GWT 项目我有一个带有标签文件上传控件和上传按钮的表单但它们在各种网络浏览器中看起来很糟糕并且差异很大另外文件上传控件中的按钮与 GWT 按钮控件的样式不同另一个问题是在 Chrome 中文件选择按钮
Android Widget 在更新期间显示奇怪的图像

我这里有一个奇怪的我有一台配备 Nextel 的 Motorola i1 运行 Android 1 5 我有一个安卓小部件当我开始运行更新此小部件的服务时我看到来自另一个小部件的图像启动 DC Contact 它在我的小部件的位置显
使用 Newton-Raphson 方法在 C 中求平方根

在下面的代码中我想将终止条件替换为如果猜测平方与x的比率接近1 则while循环应该终止我尝试了各种表达式但没有一个能够正确运行代码有什么建议吗 include
R：带有 geom_map 的 ggplot2 返回“x 和单位必须具有长度 > 0”错误，尽管值已转换为因子

我正在开发一个原始的闪亮应用程序它将映射来自苏格兰开放数据项目我制定了 SPARQL 查询用于生成类似于下面提供的摘录的数据框 dz label overall quantiles S010001 8 S010002 9 我有强化的形
从 XCode 调用本地 HTML 文件时出现问题

这是我的 WebView 代码 webView loadRequest NSURLRequest requestWithURL NSURL fileURLWithPath NSBundle mainBundle pathForResourc
Android SpeechRecognizer 只能在应用程序的主线程中使用

我正在尝试将一些 Android 语音 API 集成到我的基于 AndEngine 的游戏中我将代码放在 BaseGame 活动中但是在运行时出现此错误 05 06 23 51 28 955 错误 AndroidRuntime 553
4D 到 3D 透视投影

我正在尝试计算 3D 世界中 4D 点的位置我从 2D 开始尝试将其扩展到 3D 然后再扩展到 4D 首先我发现计算直线上二维点的投影位置很容易 Whoops there should be in the first equation
如何在 Dart 中替换 unicode 转义字符

我需要清理具有转义字符的字符串但无法这样做这是我的测试代码 test Replace unicode escape character String originalText Jeremiah 52 1 u201334 String r
为初学者保护 PHP 表单？资源？

我成功构建了第一个 html PHP 表单该表单使用 POST 全局变量在多个页面之间传递变量然后使用 mail 函数将结果通过电子邮件发送给我我确信这种形式非常不安全因为它现在很容易受到各种攻击我想知道如何修补这些漏洞但我几乎
Java错误路径中没有lwjgl64？

我正在尝试制作一个游戏它在 eclipse 中运行良好但是当我将其导出并作为 jar 文件运行时出现此错误 Exception in thread main java lang UnsatisfiedLinkError no lwjg
这里建议API返回PARSING_ERROR

从昨天开始我们用于获取地点建议的 Here API 系统地返回 PARSING ERROR 状态页面在这里https status here com status说一切都很好那可能是什么问题呢我们的代码几周以来一直在运行 if fro
无法使用字符串在 PowerShell 中设置别名

我尝试通过运行在 PowerShell 中设置别名Set Alias Name artisan Value php aritsan 虽然命令运行成功但是当我调用别名时出现以下错误 artisan The term php aritsan
使用 iPhone 和 iPad 的 Safari 中的传单地图问题

我在 iPhone 和 iPad 中使用 Safari 浏览传单地图时遇到一些奇怪的问题我正在使用 AJAX GET 请求来获取地图上的标记并在获取时绑定弹出内容在弹出窗口中我有一个按钮当用户单击它以查看详细信息时该按钮会打开引导
如何使用 VoiceOver 逐段阅读 UITextView？

我正在为盲人编写一个应用程序并想在其主页上放置一些说明该指令是多段静态文本我把它放在 UITextView 中我希望盲人用户能够使用 VoiceOver 逐段阅读说明但是当用户将 VoiceOver 焦点移到 UITextVie
运行梁管道时，“PBegin”对象没有属性“windowing”

我在运行数据流作业时发现 PBegin 对象没有属性 windowing 我在 pardo 函数中调用 connectclass 类我正在尝试从 Beam python SDK 连接 NOSQL 数据库并运行 sql 从表中提取数据然后

运行梁管道时，“PBegin”对象没有属性“windowing”

运行梁管道时，“PBegin”对象没有属性“windowing” 的相关文章

随机推荐

热门标签