Python 的多处理和内存

2023-12-29

我在用multiprocessing.imap_unordered对值列表执行计算：

def process_parallel(fnc, some_list):
    pool = multiprocessing.Pool()
    for result in pool.imap_unordered(fnc, some_list):
        for x in result:
            yield x
    pool.terminate()

每次致电fnc根据设计，返回一个巨大的对象作为结果。我可以在 RAM 中存储此类对象的 N 个实例，其中 N ~ cpu_count，但不能更多（不是数百）。

现在，使用这个功能占用了太多的内存。内存完全消耗在主进程中，而不是消耗在工作进程中。

如何imap_unordered存储完成的结果？我的意思是工作人员已经返回但尚未传递给用户的结果。我认为它很聪明，只根据需要“懒惰地”计算它们，但显然不是。

看起来因为我无法消费结果process_parallel足够快，池不断地对这些巨大的对象进行排队fnc某处，内部，然后爆炸。有办法避免这种情况吗？以某种方式限制其内部队列？

我使用的是Python2.7。干杯。

通过查看相应的源文件可以看到（python2.7/multiprocessing/pool.py），IMapUnorderedIterator 使用collections.deque用于存储结果的实例。如果出现新项目，则会在迭代中添加和删除它。

正如您所建议的，如果在主线程仍在处理该对象时另一个巨大对象进入，这些对象也将存储在内存中。

你可能会尝试的是这样的：

it = pool.imap_unordered(fnc, some_list)
for result in it:
    it._cond.acquire()
    for x in result:
        yield x
    it._cond.release()

如果任务结果接收器线程尝试将下一个对象放入双端队列，那么在处理项目时，这应该会导致任务结果接收器线程被阻塞。因此内存中的大对象不应超过两个。如果这适用于你的情况，我不知道；）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

multiprocessing

Python 的多处理和内存的相关文章

为什么需要在 Python 方法中显式使用“self”参数？ [复制]

这个问题在这里已经有答案了当在 Python 中的类上定义方法时它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中例如 C 您可以使用
为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
django 模板 - 如何动态访问变量？

假设我有一个具有以下上下文的 django 模板 data1 this is data1 data2 this is data2 data name data2 现在我知道了data name 假设它是 data2 是否可以用它来访问变量d
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
Django 2、python 3.4 无法解码 urlsafe_base64_decode(uidb64)

我正在尝试通过电子邮件激活用户电子邮件有效编码有效我使用了 django1 11 中的方法该方法运行成功在 Django 1 11 中以下内容成功解码为 28 其中 uidb64 b Mjg force text urlsafe
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

我可以使用
标签进行分页吗？

看到标签的用法很常见
华为或vivo手机如何修复“应用程序感染病毒”

我用我写的代码做了一个apk 当我使用华为或vivo手机下载apk时浏览器显示提示该应用程序感染了病毒如何修复它在华为设备中测试我的应用程序时我遇到了类似的警告我直接点击继续安装华为似乎会将所有非应用商店的内容视为病毒现在我
asp.Net MVC 2 应用程序上没有样式/图像

问候我的 ASP MVC 应用程序有一个小问题在我的本地开发服务器上一切正常但当我尝试将应用程序发布到 IIS 7 0 服务器时它只显示没有任何样式标记图像的纯页面我将所有这些内容放在 Content 子文件夹中但是当我尝
循环文件记录

我想知道是否有 C 的记录器库可以进行循环文件日志记录我目前正在研究 log4C 但找不到足够的文档来说明它会进行循环日志记录如果有人这样做过请告诉我 Thanks 这是一个例子这是一个删减版本在我们的系统中我们使用 vargs
使用自定义可解码解码 Firestore 结构时获取 DocumentID

我有以下结构 struct Vehicle Codable Identifiable DocumentID var id String var name String 只要我使用默认的 Swift 解码器我就可以毫无问题地加载 Fires
使用类路径参数运行 jar

我可能错过了一些愚蠢的东西但仍然如此我创建了一个具有以下内部结构的 jar 文件 folder1 folder2 META INF 资源其中folder1和folder2包含 class文件而resources包含txt和png文件
来自主 Gui 模块外部的 PyQt5 中断关闭事件

我使用 Qt Designer 构建 GUI 并使用 pyuic5 将它们转换为 py 文件我的最终目标是当变量 1 时中断用户关闭程序并向他们显示您确定要关闭吗类型对话框如果所述变量 0 则正常关闭程序我见过很多关于如何执行此操
C# 访问字段语法

如果我只有要访问的变量的名称我将如何访问对象的变量值在 C 中假设我有一个变量名称列表表示为数组中的字符串例如我如何循环访问它们我可以在 Actionscript 中执行类似以下操作 var arrayOfVariableNa
如何从我的 makefile 中调用特定目标？

a echo 1 b echo 2 c if d somefolder then how do I invoke target b here fi 我如何调用目标b内部目标c 根据我的情况有点像antcall 如果你熟悉 ant 的话说
如何在 MiUi pre - Marshmallow 中请求权限？

int permissionCheck ContextCompat checkSelfPermission mActivity Manifest permission RECEIVE SMS ActivityCompat requestPe
如何确定应用程序中使用了哪些 JAR

现有应用程序的类路径中有大量 JAR 文件为了确定起见最初必须有人添加所有 JAR 有些 JAR 显然没有被使用我们已经删除了其中一些不需要的 JAR 没有造成任何问题如何确定哪些 JAR 正在使用哪些 JAR 不需要除了试错法
Django 性能测试套件将报告指标（数据库查询等）

我有一个复杂的 Django Web 应用程序其中投入了很多人年的工作有时可能需要优化我可以使用例如 django 的测试客户端编写几个常见的操作流程的脚本是否有一些程序给定这样的 python 脚本然后将运行并报告各种
C++ 投掷类成员

我有以下 C 代码 template
查找数组中的重复元素？

我看到一个面试题是这样的数组中有一个数字重复找到它简单的解决方案如下 for int i 0 i
REST API 的试运行策略

我正在寻找 REST API 的试运行操作的一些最佳实践假设我有一个端点将资金从账户 A 转账到账户 B 我可以像这样发起转账 POST transactions amount 1000 how much to transfer so
jQuery 数据绑定 - 现在流行的插件是什么？

我需要某种类型的 JS MVC DataBinding 解决方案与实施 GMAIL Web 应用程序类似消息索引和消息显示在消息显示的位置如果您修改消息它会自动在消息索引中更新我应该学习什么插件才能在不使用大量 jQuery 的
Tensorflow 中的入队和增量变量

如何使张量流图将递增的数字推送到队列我这样做只是为了学习目的所以我希望您保持它与我正在做的事情相似并纠正我做错的事情这是我的代码 import tensorflow as tf create queue queue tf Rand
通过 attr_accessor 对模型对象进行排序

当我必须对对象列表进行排序时我认为 attr accessor 具有与另一个相同的行为但似乎有所不同 dataRecords MyData where day Time now yesterday strftime Y m d to i
仅禁用自动生成的表单上的特定“绿色加号”图标

如何在自动生成的表单中禁用特定 manytomany 或 foreignkey 字段上的绿色图标使用CSS如下 add another display none 禁用所有我不想要的一个例子是工作日模型存储从星期一到星期日的天数指向该
Python 的多处理和内存

我在用multiprocessing imap unordered对值列表执行计算 def process parallel fnc some list pool multiprocessing Pool for result in poo

Python 的多处理和内存

Python 的多处理和内存 的相关文章

随机推荐

热门标签

Python 的多处理和内存的相关文章