Multiprocessing.Queue 当足够大时会挂起进程

2024-02-04

今天，我偶然发现了一些令人沮丧的行为multiprocessing.Queues.

这是我的代码：

import multiprocessing


def make_queue(size):
    ret = multiprocessing.Queue()
    for i in range(size):
        ret.put(i)
    return ret


test_queue = make_queue(3575)
print(test_queue.qsize())

当我运行此代码时，进程正常退出，退出代码为 0。

但是，当我将队列大小增加到 3576 或以上时，它会挂起。当我通过 Ctrl-C 向它发送 SIGINT 时，它会在此处引发错误：

Exception ignored in atexit callback: <function _exit_function at 0x7f91104f9360>
Traceback (most recent call last):
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/multiprocessing/util.py", line 360, in _exit_function
    _run_finalizers()
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/multiprocessing/util.py", line 300, in _run_finalizers
    finalizer()
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/multiprocessing/util.py", line 224, in __call__
    res = self._callback(*self._args, **self._kwargs)
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/multiprocessing/queues.py", line 199, in _finalize_join
    thread.join()
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/threading.py", line 1096, in join
    self._wait_for_tstate_lock()
  File "/home/captaintrojan/.conda/envs/example_env/lib/python3.10/threading.py", line 1116, in _wait_for_tstate_lock
    if lock.acquire(block, timeout):
KeyboardInterrupt:

谁能解释一下这种行为吗？事实上，我已经对尺寸进行了实验，从大约 40 个不同尺寸的样本中，任何低于或等于 3575 的尺寸都可以正常工作，任何高于 3575 的尺寸都会挂起该过程。我认为这可能与队列大小（以字节为单位）有关，因为如果我插入i*i或一些随机字符串代替i，阈值发生变化。请注意，除非multiprocessing.Queue在后台做了一些可疑的事情，除了主进程之外，我没有创建任何其他进程。另外，添加test_queue.close()对结果没有影响。

我了解您链接的 SO 帖子中发生的情况。这对我来说很有意义。队列的大小有限

不完全是，队列只是管道的高级实现，允许同时多个读取器和写入器。这些底层管道的大小有限，在实现队列时被抽象出来。

但是，我仍然不明白为什么会这样，为什么有人会设计队列以这种方式运行？这是没有意义的，特别是如果只涉及一个进程的话

它更多的是一种设计结果比它是一个设计choice，稍后我将详细讨论这一点。至于为什么即使您通过单个进程传输数据，队列也会以这种方式运行，这是因为队列根本无法知道哪个进程将消耗项目。如果您只想从单个进程中放置和检索项目，那么您不应该使用multiprocessing.Queue无论如何，因为它是专门为进程间通信创建的（考虑使用threading.Queue反而）。

另外，正如您所说，如果队列足够小，仍然存在进程不会挂起/睡眠的异常情况。也许数据存储在一个简单的缓冲区中，直到它变得太大？

缓冲区是通过一个collections.deque默认情况下，它们具有无限大小（仅受计算机拥有的物理内存的限制）。当后台“供给器”线程尝试将数据从缓冲区刷新到管道时（在此之后数据实际上被放入“队列”中），就会出现问题。当管道变满时，所有将数据放入管道中的调用（通过方法send https://docs.python.org/3/library/multiprocessing.html#multiprocessing.connection.Connection.send和同等的send_bytes https://docs.python.org/3/library/multiprocessing.html#multiprocessing.connection.Connection.send_bytes）将挂起，直到管道的另一端删除一些数据（当您调用时，这会在内部发生queue.get()）。当这种死锁发生时，供给线程无法再响应主线程设置为 true 的退出条件（它通过在缓冲区末尾放置一个哨兵来通知线程在队列为垃圾时退出）集）。

这很重要，因为即使供给线程是守护线程，默认情况下主线程也会尝试加入它，以便队列可以正常关闭。并且由于供给线程在尝试清空缓冲区时被卡住，因此在有人清空缓冲区之前它永远不会加入queue.get()足够的时间可以清空缓冲区。

这也解释了为什么您的案例会发生异常。基本上，如果放入队列的项目大小小于或等于管道允许的最大大小，则供给线程可以立即清空缓冲区，而无需等待其他人执行queue.get()和死锁（所以即使你不这样做，进程也不会挂起queue.get()如果您放入队列的数据量很小）。这本质上就是answer https://stackoverflow.com/questions/31665328/python-3-multiprocessing-queue-deadlock-when-calling-join-before-the-queue-is-em/31665635#31665635我链接到试图解释。

如果这一切仍然太抽象，那么您可以使用类似版本的代码来复制馈线线程如何被阻塞以及机器上管道的最大尺寸是多少。希望这有助于澄清一些事情：

import multiprocessing


def make_pipe(size):
    """
    Function to check the maximum data a pipe can store. Try inputting a high value for arg size.
    """

    w, r, = multiprocessing.Pipe()
    for i in range(1, size):
        print(i)
        w.send(i)  # If the argument size is high enough, this will eventually deadlock and the process will hang
    return w, r


w, r = make_pipe(10000)
print('done')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Multiprocessing.Queue 当足够大时会挂起进程的相关文章

如何在Python中选择要写入(.csv)的列

import csv f csv reader open lmt csv r open input file for reading Date Open Hihh mLow Close Volume zip f s plit it into
如何实现 __eq__ 进行集合包含测试？

我遇到了一个问题我将一个实例添加到一个集合中然后进行测试以查看该对象是否存在于该集合中我已经覆盖了 eq 但在包含测试期间不会调用它我必须覆盖吗 hash 反而如果是这样我将如何实施 hash 鉴于我需要对元组列表和字典进行哈
Python 子进程（ffmpeg）仅在我按 Ctrl-C 程序时启动？

我正在尝试使用 Cygwin 和 Python 2 7 并行运行一些 ffmpeg 命令这大概是我所拥有的 import subprocess processes set commands ffmpeg i input mp4 outpu
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
如何让python优雅地失败？

我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败例如我正在编写一个处理大项目列表的程序并且某些项目可能不符合我定义的格式如果 python 检测到错误它目前只会输出一条丑陋的错误消息并停止整个过程但是
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装

随机推荐

Xamarin.Forms - 如何使页面上的元素绝对居中？

我有一个使用 StackLayout 来显示内容用户名密码登录按钮的登录页面用户单击登录按钮后我希望在页面的绝对中心现有 StackLayout 内容的顶部设置一个加载块由于某些恼人的原因这并不简单这似乎是一件简单
在 PHP 中保护 SQL 查询的最佳方法

如果我使用 PHP 在 MySQL 数据库上运行查询如下所示 query SELECT FROM tablename 防止 SQL 注入等问题的最佳方法是什么我听说过一些转义方法但是它不会在查询中留下斜杠吗您在问题中显示的查询不使用
绕过Android隐藏的API限制

从 Android Pie 开始对某些隐藏类方法和字段的访问受到限制 https developer android com distribute best practices develop restrictions non sdk
如何在Python表格中组合/连接表格？

我一直在玩Pythontabulate找到模块后here https stackoverflow com questions 62876323 python create a box rectangle table outside of a
如何使用 R 中的 grid.arrange 在并排排列的图周围绘制框/边框

我使用 ggplot 创建了两个图如下所示 library ggplot2 library gridExtra g1 lt ggplot iris aes Sepal Width Sepal Length geom point g2 lt
servlet 的 Servlet.service() [泽西岛 REST 服务] java.lang.NullPointerException

谁能帮我解决这个问题这是我第一次创建restful api web xml
如何将异常参数传递给 python unittest 模拟副作用？

如何传递需要参数作为模拟副作用的异常我正在尝试测试 boto exception EC2ResponsError 的assertRaises 但得到 TypeError init 在 mock call 中至少需要 3 个参数给定 1
如何使用 jquery 检查有效性来验证表单

我正在尝试调试一个片段以便我可以理解它如何在本机 javascript 验证 checkValidity 中工作问题是这样的首先我创建一个值数组和一个与单击事件连接的表单 jQuery input name submit reque
覆盖默认的 php 函数？（评估）

我们可以使用以下代码简单地覆盖默认的 php 函数 namespace blarg function time echo test time 但是否可以覆盖 eval 函数 namespace blarg function eval ec
在 Google API 中检测应用程序的撤销权限

我正在使用 PHP Google 客户端库我成功从 user google 获取了令牌并刷新令牌以与 API 一起使用一旦用户在 Google 页面上的 Google 设置中撤销我的网站的权限我就会收到以下错误 Error calli
来自多个 hclust 对象的共识树或“引导比例”

我有一个由一个变量的轻微变化产生的 hclust 对象列表用于计算距离矩阵现在我想从这个列表中建立一个共识树有通用包可以做到这一点吗我正在破解我的出路 maanova 的一些代码似乎可以工作但它很丑陋而且它需要大量的黑客工作因
在alpine中安装python3包时出错

我目前正在构建 alpine 3 7 的图像我遇到了两个包的问题摆特别是python dateutils包裹 service identity 具体来说attrs包裹我收到的错误是找不到满足 setuptools 要求的版本来自
将 RFC 名称映射到 OpenSSL

传递字符串不起作用我想使用密码EVP get cipherbyname 我有以下 RFC 名称 TLS DHE RSA WITH AES 128 GCM SHA256 哪个应该映射到这个 OpenSSL 名称 DHE RSA AES128
SASS - 跨多个文件扩展类

我有一个项目使用Compass with SASS SCSS 它是一个单页应用程序我有一个主 scss 文件其中包含我的所有variables mixins and function声明 Master scss foo bar func
CloudKit - 当用户在离线状态下添加、修改或删除对象时该怎么办？

我遇到的问题是当用户执行删除操作例如离线时时该怎么办我正在考虑使用添加队列修改队列和删除队列并使用NSCoding and NSKeyedArchiver 也许我会使用集合或字典然后我会在后台或每次应用程序启动时迭代它们并在
在使用 ASP.NET MVC 和 ORM 解决方案时，我们是否需要使用存储库模式？

我有点好奇其他开发人员在使用 Entity Framework 或 NHibernate 在 ASP NET MVC 中进行编程时应用存储库模式的经验在我看来这种模式已经在 ORM 本身中实现了 DbContext and DbSet
Java：正则表达式替换

我有这个字符串 foo bar 567 baz 现在我想在每个数字之前添加字符串num 所以结果必须是 foo bar num 567 baz 这也必须起作用 foo 73761 barbazboom 87 result foo num 7
为什么 Spark-Shell 失败并出现 NullPointerException？

我尝试执行spark shell在 Windows 10 上但每次运行时我都会收到此错误我使用了最新版本和spark 1 5 0 bin hadoop2 4版本 15 09 22 18 46 24 WARN Connection Bon
js 双向数据绑定最有用的技术

凭借丰富的 Web 服务和 jQuery 等客户端模板功能创建使用大量 Web 服务的混搭或网站并将数据发布回这些服务变得非常流行对于具有这种架构的大小合适的页面例如仪表板维护客户端状态有哪些有用的技术换句话说进行双向数据绑定的
Multiprocessing.Queue 当足够大时会挂起进程

今天我偶然发现了一些令人沮丧的行为multiprocessing Queues 这是我的代码 import multiprocessing def make queue size ret multiprocessing Queue for

Multiprocessing.Queue 当足够大时会挂起进程

Multiprocessing.Queue 当足够大时会挂起进程 的相关文章

随机推荐

热门标签

Multiprocessing.Queue 当足够大时会挂起进程的相关文章