Python 多处理进程无声地崩溃

2024-02-04

我正在使用Python 2.7.3。我使用子类化了一些代码multiprocessing.Process对象。如果我的子类 Process 对象中的代码没有错误，则一切运行正常。但是，如果我的子类 Process 对象中的代码存在错误，它们显然会默默地崩溃（没有堆栈跟踪打印到父 shell），并且 CPU 使用率将降至零。父代码永远不会崩溃，给人的印象是执行只是挂起。同时，很难追踪代码中的错误在哪里，因为没有给出错误在哪里的指示。

我在 stackoverflow 上找不到处理相同问题的任何其他问题。

我猜子类化的 Process 对象似乎会无声地崩溃，因为它们无法将错误消息打印到父级的 shell，但我想知道我可以对此做些什么，以便我至少可以更有效地调试（并且其他我的代码的用户也可以在遇到问题时告诉我）。

EDIT:我的实际代码太复杂了，但是一个带有错误的子类化 Process 对象的简单示例将如下所示：

from multiprocessing import Process, Queue

class Worker(Process):

    def __init__(self, inputQueue, outputQueue):

        super(Worker, self).__init__()

        self.inputQueue = inputQueue
        self.outputQueue = outputQueue

    def run(self):

        for i in iter(self.inputQueue.get, 'STOP'):

            # (code that does stuff)

            1 / 0 # Dumb error

            # (more code that does stuff)

            self.outputQueue.put(result)

您真正想要的是某种将异常传递给父进程的方法，对吧？然后你就可以随心所欲地处理它们了。

如果你使用concurrent.futures.ProcessPoolExecutor http://docs.python.org/dev/library/concurrent.futures.html，这是自动的。如果你使用multiprocessing.Pool http://docs.python.org/dev/library/multiprocessing.html#using-a-pool-of-workers，这是微不足道的。如果您使用显式Process and Queue，你必须做一些工作，但这不是that much.

例如：

def run(self):
    try:
        for i in iter(self.inputQueue.get, 'STOP'):
            # (code that does stuff)
            1 / 0 # Dumb error
            # (more code that does stuff)
            self.outputQueue.put(result)
    except Exception as e:
        self.outputQueue.put(e)

然后，你的调用代码就可以读取Exception像其他任何事情一样从队列中消失。而不是这个：

yield outq.pop()

do this:

result = outq.pop()
if isinstance(result, Exception):
    raise result
yield result

（我不知道你的实际父进程队列读取代码是做什么的，因为你的最小样本只是忽略了队列。但希望这可以解释这个想法，即使你的真实代码实际上并不是这样工作的。）

这假设您想要中止任何未处理的异常，使其达到run。如果你想传回异常并继续下一步i in iter，只需移动try进入for，而不是围绕它。

这还假设Exceptions 不是有效值。如果这是一个问题，最简单的解决方案就是推动(result, exception) tuples:

def run(self):
    try:
        for i in iter(self.inputQueue.get, 'STOP'):
            # (code that does stuff)
            1 / 0 # Dumb error
            # (more code that does stuff)
            self.outputQueue.put((result, None))
    except Exception as e:
        self.outputQueue.put((None, e))

然后，您的弹出代码将执行以下操作：

result, exception = outq.pop()
if exception:
    raise exception
yield result

您可能会注意到，这类似于 node.js 回调样式，您可以在其中传递(err, result)每个回调。是的，这很烦人，而且你会弄乱这种风格的代码。但除了包装器之外，您实际上并没有在任何地方使用它；所有从队列中获取值或在内部调用的“应用程序级”代码run只看到正常的回报/收益率和引发的异常。

您甚至可能想考虑建立一个Future至规格concurrent.futures（或按原样使用该类），即使您正在手动排队和执行工作。这并不难，而且它为您提供了一个非常好的 API，特别是对于调试而言。

最后，值得注意的是，大多数围绕工作线程和队列构建的代码都可以通过执行器/池设计变得更加简单，即使您绝对确定每个队列只需要一个工作线程。只需废弃所有样板，然后转动循环即可Worker.run方法到函数中（这只是returns or raises 正常，而不是附加到队列）。在调用方，再次废弃所有样板文件，然后submit or map工作功能及其参数。

您的整个示例可以简化为：

def job(i):
    # (code that does stuff)
    1 / 0 # Dumb error
    # (more code that does stuff)
    return result

with concurrent.futures.ProcessPoolExecutor(max_workers=1) as executor:
    results = executor.map(job, range(10))

并且它会自动正确处理异常。

正如您在评论中提到的，异常的回溯不会回溯到子进程；而是回溯到子进程。它只限于手册raise result调用（或者，如果您使用的是池或执行器，则调用池或执行器的内部）。

原因是multiprocessing.Queue是建立在pickle，并且腌制异常不会腌制它们的回溯。原因是你无法腌制回溯。原因是回溯充满了对本地执行上下文的引用，因此让它们在另一个进程中工作将非常困难。

那么……你能对此做些什么呢？不要去寻找完全通用的解决方案。相反，想想你真正需要什么。 90% 的情况下，您想要的是“记录异常，带回溯，然后继续”或“打印异常，带回溯，以stderr and exit(1)就像默认的未处理异常处理程序一样。对于其中任何一个，您根本不需要传递异常；只需在子端格式化它并传递一个字符串即可。如果您do需要更奇特的东西，准确地计算出您需要的东西，并传递足够的信息来手动将它们组合在一起。如果您不知道如何格式化回溯和异常，请参阅traceback http://docs.python.org/2/library/traceback.html模块。这很简单。这意味着您根本不需要进入泡菜机器。（并不是说很难copyreg一个 pickler 或编写一个持有者类__reduce__方法或任何东西，但如果你不需要，为什么要学习所有这些？）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 多处理进程无声地崩溃的相关文章

Pandas - 按每个可能的键组合聚合

我有一个 DataFrame Pandas 我想通过 A B C 和 D 列的组合尽可能按数据进行分组假设它具有以下形式 A B C D E F G 0 Y X Y Z 1 2 7 1 Y X Y Z 3 4 8 2 X Y U V 1
指定的可执行文件不是该操作系统平台的有效应用程序。

我不断收到错误消息System ComponentModel Win32Exception The specified executable is not a valid application for this OS platform 当
uwsgi + Django REST框架：空闲时间后很少有缓慢的请求

我正在运行 Django REST 框架白天每分钟的请求率相当低我注意到一个我无法解释或重现的问题每天在夜间或清晨当我的 RPM 接近于零时我会收到 1 10 个超慢的请求我的平均响应时间100 到 200 毫秒之间但是这个
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
Windows 中的信号处理

在Windows中我试图创建一个等待SIGINT信号的python进程当它收到SIGINT时我希望它只打印一条消息并等待SIGINT的另一次出现所以我使用了信号处理程序这是我的 signal receiver py 代码 impo
CodingBat sum67：为什么这个解决方案是错误的？

我正在解决以下codingbat问题返回数组中数字的总和但忽略以 6 开头并延伸到下一个 7 的数字部分每个 6 后面至少有一个 7 如果没有数字则返回 0 sum67 1 2 2 5 sum67 1 2 2 6 99 99 7 5
如何从字典列表中查找键的值？

如何从字典列表中获取给定键的值 mylist powerpoint color blue client name Sport Parents Regrouped sort order ascending chart layout 1 cha
将这个使用 lambda 解包的元组从 Python 2 移植到 Python 3 的最 Pythonic 方法

我有以下 Python 2 代码它在 lambda 中解压元组该 lambda 包含在 for 循环内 for lab lab pred length in zip labels labels pred sequence lengths
为什么 PySpark 中的 agg() 一次只能汇总 DataFrame 的一列？ [复制]

这个问题在这里已经有答案了对于下面的数据框 df spark createDataFrame data Alice 4 300 Bob 7 677 schema name High 当我尝试找到最小值和最大值时我只得到输出中的最小值 d
为 pandas 数据框中的两列创建邻接矩阵

我有一个以下形式的数据框 index Name A Name B 0 Adam Ben 1 Chris David 2 Adam Chris 3 Ben Chris 我想获得邻接矩阵Name A and Name B ie Adam Ben
如何在python中合并具有相同键的嵌套字典

我有一个这样的数据结构 SNAPSHOT SnapshotVersion 304 SNAPSHOT SnapshotCreationDate 2015 06 21 17 33 41 CafeData CafeVersion 2807 Caf
Google App Engine 开发服务器中的 PyCrypto“ImportError：无法导入名称 blockalgo”

我有一个使用 PyCrypto 使用 AES 加密字符串的函数当我在单元测试中调用该函数时一切正常在生产环境中它也运行得很好但是在GAE开发服务器上调用该函数时会抛出错误 ImportError 无法导入名称blockalgo
来自异常导入 PendingDeprecationWarning ModuleNotFoundError：没有名为“异常”的模块

我正在尝试使用Python 创建一个word 文档我在终端中 pip install python docx 我的代码如下所示 from docx import Document document Document document sa
使用每日频率格式化 x 轴

我正在尝试获取每日数据图我有 3 个月的数据每天都很难指出如何格式化 x 轴以便我可以获得每个日期可以使用以下命令更改主要刻度的频率set major locator mdates DayLocator interval 5 如下
无法运行bjam编译boost python教程

我正在尝试跟随本教程 http www boost org doc libs 1 55 0 libs python doc tutorial doc html python hello html关于为 Windows 的 python 包装
Python docker 容器在完成运行应用程序后立即关闭，即使指定保留在 -d -t 中

我有一个 dockerfile FROM python 3 WORKDIR app ADD venv venv ADD data file1 csv gz data file1 csv gz ADD data file2 csv gz da
Django ConnectionAbortedError：[WinError 10053]已建立的连接被主机中的软件中止

我将 django 与 postgresql 一起使用每当我尝试保存或删除任何内容时都会发生此错误 Traceback most recent call last File c program files x86 python35 32
如何更改 PyGame 中声音或音乐的音量？

如何更改 PyGame 中的音量例如通过设置更改音量我制作了 UI 元素只需要知道如何更改音量即可我知道我说不清楚但你可以理解我请帮忙更改音量取决于您是否正在播放pygame mixer Sound https www pyg
如何在 Windows 上为“flask run”设置环境变量？

我刚刚开始学习 Flask 我一直停留在设置 Flask 环境变量上我不知道如何设置环境变量每当我使用flask run命令我遇到以下错误错误消息无法找到 Flask 应用程序您没有提供 FLASK APP 环境变量并且在当前
如何在Python中从stdin中逐行读取

每个人都知道如何在 C 中计算 STDIN 中的字符但是当我尝试在 python3 中执行此操作时我发现这是一个难题计数器 py import sys chrCounter 0 for line in sys stdin readl

随机推荐

前向声明类成员的前向声明

是否可以前向声明一个在另一个前向声明的类中声明的类基本上我有这样的东西 A h class A struct B 现在我想声明另一个这样的类 Q h class A struct A B class Q A B Foo 不这是不可能的
在 WordPress 中获取类别 ID 数组？

cats get categories array order gt ASC orderby gt id hierarchical gt 0 hide empty gt 0 taxonomy gt edu year 我想生成一个变量其中包
当作为 *.a 静态库链接时，为什么“WinMain”无法解析？

给定一个简单的程序 include
如何将 PHPUnit 与 CodeIgniter 结合使用？

我读过并阅读过有关 PHPUnit SimpleTest 和其他单元测试框架的文章他们听起来都很棒我终于让 PHPUnit 与 Codeigniter 一起工作了感谢https bitbucket org kenjis my ciun
默认模板参数在部分特化上下文中的作用

我不清楚部分专业化背景下默认模板参数的交互以选择哪个是更好的匹配模板这个问题源于此中发布的代码answer https stackoverflow com questions 52565407 use of enable if to m
Jenkins Slave 问题 - 无效的流标头：099EACED

Jenkins 2 7 4 安装在 RedHat 服务器中并且通过选择通过在主服务器上执行命令来启动代理选项来配置 Linux 从站我们创建了一个 Shell 脚本它在 Jenkins 版本 2 7 4 中运行良好现在我们将 J
“这个”阴影是个好主意吗？

隐藏类变量的情况在 Java 中很常见 Eclipse 将愉快地生成以下代码 public class TestClass private int value private String test public TestClass int
将数据库设置从 application.ini 中取出并放入环境中

在基于 Zend 的应用程序的传统编码中数据库设置存储在 application ini 中这会存储每个应用程序的设置 StackOverflow 上是否有人探索过将数据库设置从 application ini 移动到环境中的可能性例
Picasso 库无法在 Android 上从 SD 卡加载图像

我从图像库的路径中获取一个文件并尝试将其加载到图像视图如下所示文件路径为 storage sdcard0 DCIM Camera 1436267579864 jpg 我也尝试传递 Uri 我也有 SD 卡的读取权限它最终在onErr
如何通过IP获取时区[重复]

这个问题在这里已经有答案了我有一个注册通过它我可以获得注册用户的IP地址我想通过用户的 IP 地址获取用户的时区就像在 jquery 中我们可以得到这样的结果jquery 中的时区 http pellepim bitbucket o
如何获取 .NET 中的资源监视器值？

我需要获取 Windows 7 资源监视器中的一些值特别是每个进程的内存使用情况 CPU 和带宽我研究了 PerformanceCounter 类但没有找到深入到进程级别的方法资源监视器正是我正在寻找的东西在你问之前我知道这是重
raise StopIteration 和生成器中的 return 语句有什么区别？

我很好奇使用之间的区别raise StopIteration and a return生成器中的语句例如这两个函数有什么区别吗 def my generator0 n for i in range n yield i if i gt 5
安装 pydev 时出错[重复]

这个问题在这里已经有答案了我安装了 eclipse 3 7 并且想从 help gt install new software 从 pydev org updates 安装 pydev 但我不断收到错误 An error occurred
Python描述符与属性[重复]

这个问题在这里已经有答案了我对何时使用属性和描述符感到困惑我读到属性是一个专门的描述符有人可以发布这是如何工作的吗您应该阅读有关描述符实际是什么的文档 Cliff s Notes 版本描述符是一种低级机制可让您挂钩正在访问的对象
Rails 5 资产未在生产中加载

我最近更新了 Rails 应用程序中的一些软件包但现在我的资产无法提供服务相反我收到以下错误 Failed to load resource the server responded with a status of 404 Not
制作 VB-dll 并将其加载到 C++ 应用程序中

我有一个问题已经困扰了整整一周但我自己无法解决我一直在谷歌搜索并在各种论坛中搜索我发现了很多这可能有用尝试过但没有没有成功如果有人有任何线索请帮助我我从外部源获得了许多用 VB 编写的类和函数我需要能够在 C 应用程
从文件中读取特殊字符 - Java

我正在从具有以下属性的文本文件中读取数据编码 ANSI文件类型电脑现在该文件包含许多特殊字符例如度数符号等我正在使用以下代码读取该文件 File file new File C X Y SpecialCharacter txt
OpenCV VideoCapture 从视频中删除 Alpha 通道

我有带有 Alpha 通道的视频我尝试将其放置在另一个视频上如下所示 public static void overlayImage Mat background Mat foreground Mat output Point loca
Javascript Date 对象返回 1969 年 12 月 31 日

If you are using a date in the form of milliseconds does it need to be converted to a string in order for the Date objec
Python 多处理进程无声地崩溃

我正在使用Python 2 7 3 我使用子类化了一些代码multiprocessing Process对象如果我的子类 Process 对象中的代码没有错误则一切运行正常但是如果我的子类 Process 对象中的代码存在错误它们

Python 多处理进程无声地崩溃

Python 多处理进程无声地崩溃 的相关文章

随机推荐

热门标签

Python 多处理进程无声地崩溃的相关文章