Google DataFlow/Python：save_main_session 和 main 中的自定义模块导入错误

2023-12-26

有人可以澄清使用时的预期行为吗save_main_session和导入的自定义模块__main__。我的 DataFlow 管道导入 2 个非标准模块 - 一个通过requirements.txt另一个通过setup_file。除非我将导入移至使用它们的函数中，否则我会不断收到导入/酸洗错误。示例错误如下。从文档中，我假设设置save_main_session将有助于解决这个问题，但事实并非如此（请参见下面的错误）。所以我想知道我是否错过了什么或者这种行为是设计使然的。当放入函数中时，相同的导入工作正常。

Error:



  File "/usr/lib/python2.7/pickle.py", line 1130, in find_class
    __import__(module)
ImportError: No module named jmespath

https://cloud.google.com/dataflow/faq#how-do-i-handle-nameerrors https://cloud.google.com/dataflow/faq#how-do-i-handle-nameerrors https://beam.apache.org/documentation/sdks/python-pipeline-dependencies/ https://beam.apache.org/documentation/sdks/python-pipeline-dependencies/

何时使用--save_main_session:

你可以设置--save_main_session管道选项True。这将导致全局命名空间的状态被腌制并加载到 Cloud Dataflow Worker 上

最适合我的设置是dataflow_launcher.py坐在项目根目录下setup.py。它唯一做的就是导入管道文件并启动它。使用setup.py处理你所有的依赖关系。这是迄今为止我找到的最好的例子。

https://github.com/apache/beam/tree/master/sdks/python/apache_beam/examples/complete/juliaset https://github.com/apache/beam/tree/master/sdks/python/apache_beam/examples/complete/juliaset

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Google DataFlow/Python：save_main_session 和 main 中的自定义模块导入错误的相关文章

使用请求验证 SSL 证书

我正在尝试验证 SSL 但它不起作用我在浏览器上访问了我想要访问的机密网站在 Chrome 上我单击了储物柜 gt 证书 gt 详细信息 gt 复制到文件 gt base64 gt cert cer 我的代码是 test reques
没有任何元数据的 zip 文件

我想找到一种简单的方法来压缩一堆文件而无需任何文件元数据例如时间戳这zip命令似乎总是保留元数据我没有找到禁用元数据的方法我希望解决方案是一个命令或最多一个 python 脚本谢谢正如一些帖子已经指出的那样 zip 标头中的大
在 Python 中使用 Selenium 处理“接受 Cookie”弹出窗口

我一直在尝试用硒抓取这个房地产网站的一些信息但是当我访问该网站时我需要接受 cookie 才能继续这仅在机器人访问网站时发生而不是在我手动执行时发生当我尝试通过 xpath 或 id 查找相应的元素时正如我在手动检查页面时找到
从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

有时我想生成一个子进程其优化标志与启动父进程时使用的优化标志相同我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息经过一番深
行未从树视图复制

该行未在树视图中复制我在按行并复制并粘贴到未粘贴的任何地方后制作了弹出复制 The code popup tk Menu tree opportunity tearoff 0 def row copy item tree opportun
如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
将 Pandas 列中的列表拆分为单独的列

这是我在 pandas 数据框中的特征列 Feature Cricket 82379 Kabaddi 255 Reality 4751 Cricket 15640 Wildlife 730 LiveTV 13 Football 4129
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
如何有效地从 loadmat 函数生成的嵌套 numpy 数组中提取值？

python中是否有更有效的方法从嵌套的python列表中提取数据例如A array array 12000000 dtype object 我一直在使用A 0 0 0 0 当你有很多像 A 这样的数据时这似乎不是一个有效的方法我也用
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self

随机推荐

如何检查ACTION_SEND意图是否已启动？

我的应用程序使用标准的简单文本共享在我的测试中我想检查我的活动是否启动了共享意图是否可以我在用ActivityInstrumentationTestCase2 test 活动 final Intent sendIntent new
Python中使用factorize()后如何获取原始值？

我是一个初学者尝试使用 Python 中的随机森林训练和测试数据集创建预测模型 train ALLOW BLOCK 可以取 4 个期望值所有字符串中的 1 个 test ALLOW BLOCK 是需要预测的 y pd factori
“：”和“|”之间的区别在 R 线性建模中

在R中构建线性模型时以下两种说法有什么区别 lm y x z lm y x z The lm功能文档 http stat ethz ch R manual R devel library stats html lm html记录了运算符
将数据写入 CSV 时如何排除标题

我正在从一个写入我的数据public class到 CSV 文件由于我想附加数据因此我想排除标头的导入只导入类中的数据我下面的代码导入标头和数据希望得到帮助谢谢 Record cs 我的班级 public class Recor
如果 Python 字典理解覆盖某个键，则会引发错误

有没有办法让字典理解在覆盖某个键时引发异常例如我希望以下错误因为键有两个值 a gt gt gt k v for k v in a1 a2 b3 a 2 b 3 我意识到这可以通过for环形有没有办法在保持理解语法的同时做到这一点
为什么整数除法代码给出错误的答案？ [复制]

这个问题在这里已经有答案了我在 Java 中有一个非常简单的划分它是产品数量每小时产量但是每当我进行这种划分时我都会遇到奇怪的错误 float res quantity standard 我已经用几个值尝试了上述除法但总是出错
如何将函子分配给函数指针？

一般来说我可以将函数对象分配给函数指针吗我想做这样的事情 include
将项目从 Delphi 3 移至 Delphi 2010

我被要求重新打开一个我在 1998 99 年用 Delphi 3 编写的项目此后该项目一直稳定运行我在一台老化的 Windows 98 机器上有 Delphi 3 代码库它的存在只是为了让这个项目保持活力显然我想在进行任何重大修改
如何在 PostgreSQL 中获取数组的最后一个元素？

The 关于数组的 PostgreSQL 文档 http www postgresql org docs 9 2 static arrays html提供了一个使用示例 1 访问数组的最后一个元素然而虽然SELECT arr 2 3 产生
Notepad++ 查找文件名

在Notepad 中我有时需要打开存在于不同文件夹中的文件这需要时间才能转到文件夹并通过Light Explorer搜索文件 Notepad 有什么功能或插件可以让我直接打开文件吗假设如果我需要打开一个名为 notepad php
检查元素是否包含#shadow-root

是否可以查看 Shadow DOM 元素是否存在我不太关心操纵它甚至不是真正针对它我理解封装的原因但我希望能够根据 Shadow DOM 元素是否存在来设置常规 DOM 中其他元素的样式有点像 if element id shad
Win32/MFC 从客户端矩形获取窗口矩形

我知道有一个函数可以接受客户端矩形并将其转换为窗口矩形我只是找不到记住它有谁知道它是什么它会做类似的事情 const CRect client 0 0 200 200 const CRect window ClientRectTo
插件“FEDERATED”已禁用

我尝试使用 easyPHP 启动 MySQL 响应是日志文件的警报窗口主要错误是通过网上研究我发现解决方案是将联合选项添加到my ini文件我这样做了但它仍然不起作用以下是日志文件的摘录以了解更多信息 2013 05 03 1
获取点击元素的ID

div div div div 尝试此方法来获取单击的元素的 ID 并发出警报我确信这是我所缺少的一些非常基本的东西有人可以帮忙吗这实际上非常基本停止使用内联事件处理程序
每次尝试以特定顺序循环 3 个线程

我的问题是如何让一个线程运行然后再运行一次然后再次运行然后它会重复本身我有一个主文件 private static ThreadManager threadManager public static void main String
通用选择不适用于位类型

基于这个答案 https stackoverflow com a 18469483 1993545 我尝试为我的桌子创建一个选择 ALTER PROCEDURE Einrichtung Select Parameters with defa
如何在 Jetpack Compose 中向图标添加阴影/边框/高度

我想在 Jetpack compose 中为我的图标添加阴影以便图像和文本具有大致相似的阴影 Text text HAS SHADOW style MaterialTheme typography body2 copy shadow
打印汉字的ESC/POS命令

打印机型号爱普生TM T88V ESC POS命令指南见P 115 http download delfi com SupportDL Epson Manuals TM T88IV Programming 20manual 20APG
是否需要将原始类型键入枚举？

我正在浏览NSString查看头文件看看 Apple 如何编写枚举并发现了这段代码 enum NSStringEncodingConversionAllowLossy 1 NSStringEncodingConversionExtern
Google DataFlow/Python：save_main_session 和 __main__ 中的自定义模块导入错误

有人可以澄清使用时的预期行为吗save main session和导入的自定义模块 main 我的 DataFlow 管道导入 2 个非标准模块一个通过requirements txt另一个通过setup file 除非我将导入移至使用它

Google DataFlow/Python：save_main_session 和 __main__ 中的自定义模块导入错误

Google DataFlow/Python：save_main_session 和 __main__ 中的自定义模块导入错误 的相关文章

随机推荐

热门标签

Google DataFlow/Python：save_main_session 和 main 中的自定义模块导入错误

Google DataFlow/Python：save_main_session 和 main 中的自定义模块导入错误的相关文章