多处理 - 使用管理器命名空间来节省内存

2024-03-05

我有几个进程，每个进程都完成需要单个大 numpy 数组的任务，这只是被读取（线程正在搜索适当的值）。

如果每个进程都加载数据，我会收到内存错误。

因此，我试图通过使用管理器在进程之间共享相同的数组来最小化内存使用量。

但是我仍然收到内存错误。我可以加载数组一旦进入主流程，但是当我尝试将其变成属性我收到管理器命名空间的内存错误。我假设管理器的行为就像指针一样，并允许单独的进程（通常只能访问自己的内存）也可以访问此共享内存。然而，错误提到了酸洗：

Traceback (most recent call last):
  File <PATH>, line 63, in <module>
    ns.pp = something
  File "C:\Program Files (x86)\Python35-32\lib\multiprocessing\managers.py", line 1021, in __setattr__
    return callmethod('__setattr__', (key, value))
  File "C:\Program Files (x86)\Python35-32\lib\multiprocessing\managers.py", line 716, in _callmethod
    conn.send((self._id, methodname, args, kwds))
  File "C:\Program Files (x86)\Python35-32\lib\multiprocessing\connection.py", line 206, in send
    self._send_bytes(ForkingPickler.dumps(obj))
  File "C:\Program Files (x86)\Python35-32\lib\multiprocessing\reduction.py", line 50, in dumps
    cls(buf, protocol).dump(obj)
MemoryError

我假设 numpy 数组在分配给管理器时实际上被复制，但我可能是错的。

更让人恼火的是，我在一台 32GB 内存的机器上，观察内存使用情况，它在崩溃之前只增加了一点，最多可能增加 5%-10%。

有人可以解释一下吗为什么使数组成为命名空间的属性会占用更多内存？ and 为什么我的程序不会使用一些可用的空闲内存？（我已经读过名称空间 https://docs.python.org/3.6/tutorial/classes.html#python-scopes-and-namespaces and manager https://docs.python.org/3.6/library/multiprocessing.html#multiprocessing.managers文档以及这些managers https://stackoverflow.com/questions/22487296/multiprocessing-in-python-sharing-large-object-e-g-pandas-dataframe-between and 名称空间 https://stackoverflow.com/questions/3913217/what-are-python-namespaces-all-aboutSO 上的线程。

我正在运行 Windows Server 2012 R2 和 Python 3.5.2 32 位。

这是一些演示我的问题的代码（您将需要使用替代文件large.txt，该文件大约有 75MB 的制表符分隔字符串）：

import multiprocessing
import numpy as np

if __name__ == '__main__':

    # load Price Paid Data and assign to manager
    mgr = multiprocessing.Manager()
    ns = mgr.Namespace()

    ns.data = np.genfromtxt('large.txt')
    # Alternative proving this work for smaller objects
    # ns.data = 'Test PP data'

管理者类型是为了灵活性而不是效率而构建的。他们创建一个保存值的服务器进程，并且可以将代理对象返回到需要它们的每个进程。服务器和代理通过 tls 进行通信，以允许服务器和代理位于不同的计算机上，但这必然意味着复制任何对象有问题。我没有一路追查源头，所以额外的副本可能在使用后被垃圾收集，但至少最初必须有一个副本。

如果你想要共享物理内存，我建议使用共享 ctypes 对象 https://docs.python.org/3.6/library/multiprocessing.html#shared-ctypes-objects。这些实际上确实指向内存中的公共位置，因此速度更快且资源消耗少。它们不支持完整的 python 对象所做的所有相同的事情，但它们可以通过创建来扩展structs https://docs.python.org/3.6/library/ctypes.html#ctypes.Structure来组织您的数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多处理 - 使用管理器命名空间来节省内存的相关文章

NumPy linalg.eig

我有这个烦人的问题但我还没有弄清楚我有一个矩阵我想找到特征向量所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
Python Django-如何从输入文件标签读取文件？

我不想将文件保存在我的服务器上我只想在下一页中读取并打印该文件现在我有这个 index html
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

如何通过 InMemoryTestHarness 成功驱动 MassTransitStateMachine？

跟进如何编写 MassTransitStateMachine 单元测试 https stackoverflow com questions 49763600 how to write masstransitstatemachine uni
Firestore 查询是否可以使用其中一个字段或 whereFields 字段？

我想要一个像这样的查询 db collection Bookings whereField servicer isEqualTo userID customer isEqualTo userID 它不会有两次不同的读取而只会有一次并且它
如何检查 UITextField 何时发生变化？

我试图检查文本字段何时发生变化也相当于用于 textView 的函数 textViewDidChange到目前为止我已经这样做了 func textFieldDidBeginEditing textField UITextField if
在 React Native 中生成发布 apk

我通过本机反应创建了一个简单的应用程序现在完成部署后我想制作发布 apk 以便根据它的官方网站 https facebook github io react native docs signed apk android我已经创建了密钥
Cypress.io 测试中未发生拖放

我试图拖动一个元素然后将其放入放置区域但测试并未在 Cypress io 中执行拖放操作如果有人可以就这里的潜在问题提出建议那将非常有帮助没有抛出错误但是这里仍然没有发生拖放 describe Verify the drag a
Ruby on Rails 4 javascript 未执行

我有一个习惯js文件输入app assets javascripts 这是js文件 app assets javascripts contacts js document ready function I ve already tried
如何将所有日志从hibernate和spring重定向到log4j2？

我使用下一个技术堆栈构建我的 superWebApp persistence provider Hibernate 4 x webMvc and beans container Spring 4 x web containter Tomca
@ResourceMapping 接受来自 Ajax 请求的 JSON

我正在搜索如何解释 Spring Portlet MVC 中 ResourceMapping 中的 JSON 参数当我添加 RequestBody时我收到消息不支持 RequestBody 真的卡在这个上了我有这个查看侧面
为什么在回调中调用 ViewModel 时会发生重组？

我完全混淆了撰写概念我有一个代码 Composable fun HomeScreen viewModel HomeViewModel getViewModel Scaffold val isTimeEnable by viewModel
MERN Stack - Express 和 React 在同一端口上？

我正在开发一个使用 MERN MongoDB Express React Node 堆栈的项目在将数据从 React 组件内的表单发布到 Node js 中定义的 API 端点时遇到问题当我提交表单时浏览器仅显示无法发布错误我非
Hibernate 说该表不存在，但它确实存在

我遇到 Hibernate 抛出以下错误的问题 com mysql jdbc exceptions jdbc4 MySQLSyntaxErrorException Table Library book doesn t exist 我的依赖设
如何将 iOS 应用程序限制为仅适用于 4 英寸屏幕设备？

Xcode 中是否有一个设置可以让我声明我的应用程序仅支持 4 英寸屏幕设备 iPhone 5 和最新的 iPod Touch Nope 由于 iOS 7 支持 3 5 英寸屏幕的设备因此您不能使用 only support iOS x
PyTorch 无法检测 CUDA

我在 PyTorch 上运行 CNN torch cuda is available 函数返回 false 并且未检测到 GPU 不过我可以使用 GPU 运行 Keras 模型这是我的系统信息操作系统 Ubuntu 18 04 3 P
为什么双向 ManyToOne 会导致 Hibernate 中的循环依赖？

我的项目中有实体基于Spring Boot Hibernate Entity Table name user account public class UserAccount Id GeneratedValue strategy Gene
Angularjs 在控制器之间共享方法

我有一个应用程序它在一个页面主页上显示新闻提要在另一个页面上仅显示用户的提要用户个人资料页面两个页面的外观和行为方式相同内容的变化是由于调用了不同的URL 在AngularJS中如何解决这个问题我有一个家庭控制器它具有用于
为什么使用 redux 来实现不可变状态

我正在学习 redux 并且正在努力理解为什么状态必须是不可变的您能否为我提供一个示例最好是代码其中打破不可变合约会导致不那么明显的副作用 Redux 最初是为了演示时间旅行调试的理念而发明的能够在分派操作的历史记录中来回查看
Eclipse：如何刷新整个工作区？ F5 不行

我有一个包含一堆 java 项目的工作区如果我去File gt Refresh 它并没有真正刷新任何内容可能是当前选择的项目如何让 eclipse 刷新all的项目 It will indeed only refresh the cu
Java8的Collection.parallelStream如何工作？

Collection类带有一个新方法 parallelStream 在 Java SDK 8 中显然这种新方法提供了一种并行消费集合的机制但是我想知道Java是如何实现这种并行性的其根本机制是什么它只是多线程执行吗或者 for
为什么 WCF 有时会在生成的代理类型末尾添加“Field”？

基本上我有一个带有成员 X 和 Y 的服务器端类型 Foo 每当我使用 Visual Studio 的添加服务器引用时我都会看到 WSDL 和生成的代理都将单词 Field 附加到所有成员并更改第一个字母的大小写 IE 中 X 和
多处理 - 使用管理器命名空间来节省内存

我有几个进程每个进程都完成需要单个大 numpy 数组的任务这只是被读取线程正在搜索适当的值如果每个进程都加载数据我会收到内存错误因此我试图通过使用管理器在进程之间共享相同的数组来最小化内存使用量但是我仍然收到内存错误我可

多处理 - 使用管理器命名空间来节省内存

多处理 - 使用管理器命名空间来节省内存 的相关文章

随机推荐

热门标签

多处理 - 使用管理器命名空间来节省内存的相关文章