使用命名空间和共享内存字典时关闭管理器错误“AttributeError：'ForkAwareLocal'对象没有属性'连接'”

2023-11-30

我在尝试着：

在进程之间共享数据帧
根据对该数据帧执行的计算（但不更改）更新共享字典

我正在使用一个multiprocessing.Manager()创建一个dict在共享内存中（用于存储结果）和Namespace存储/共享我想要读取的数据框。

import multiprocessing

import pandas as pd
import numpy as np


def add_empty_dfs_to_shared_dict(shared_dict, key):
    shared_dict[key] = pd.DataFrame()


def edit_df_in_shared_dict(shared_dict, namespace, ind):
    row_to_insert = namespace.df.loc[ind]
    df = shared_dict[ind]
    df[ind] = row_to_insert
    shared_dict[ind] = df


if __name__ == '__main__':
    manager = multiprocessing.Manager()
    shared_dict = manager.dict()
    namespace = manager.Namespace()

    n = 100
    dataframe_to_be_shared = pd.DataFrame({
        'player_id': list(range(n)),
        'data': np.random.random(n),
    }).set_index('player_id')

    namespace.df = dataframe_to_be_shared

    for i in range(n):
        add_empty_dfs_to_shared_dict(shared_dict, i)

    jobs = []
    for i in range(n):
        p = multiprocessing.Process(
            target=edit_df_in_shared_dict,
            args=(shared_dict, namespace, i)
        )
        jobs.append(p)
        p.start()

    for p in jobs:
        p.join()

    print(shared_dict[1])

运行上面的代码时，它会写入shared_dict当我的打印语句使用一些数据执行时正确。我还收到有关经理的错误：

Process Process-88:
Traceback (most recent call last):
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/managers.py", line 788, in _callmethod
    conn = self._tls.connection
AttributeError: 'ForkAwareLocal' object has no attribute 'connection'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/process.py", line 297, in _bootstrap
    self.run()
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/process.py", line 99, in run
    self._target(*self._args, **self._kwargs)
  File "/Users/henrysorsky/Library/Preferences/PyCharm2019.2/scratches/scratch_13.py", line 34, in edit_df_in_shared_dict
    row_to_insert = namespace.df.loc[ind]
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/managers.py", line 1099, in __getattr__
    return callmethod('__getattribute__', (key,))
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/managers.py", line 792, in _callmethod
    self._connect()
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/managers.py", line 779, in _connect
    conn = self._Client(self._token.address, authkey=self._authkey)
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/connection.py", line 492, in Client
    c = SocketClient(address)
  File "/Users/henrysorsky/.pyenv/versions/3.7.3/lib/python3.7/multiprocessing/connection.py", line 619, in SocketClient
    s.connect(address)
ConnectionRefusedError: [Errno 61] Connection refused

我知道这是来自经理的，似乎是因为它没有正确关闭。我在网上唯一能找到的类似问题：

python服务器中进程之间共享列表

建议加入所有子进程，我已经在这样做了。

因此，经过一整晚的睡眠后，我意识到实际上是共享内存中数据帧的读取导致了问题，并且在第 20 个子进程左右，其中一些子进程无法读取。我添加了一次运行的最大进程数，这解决了这个问题。

对于任何想知道的人，我使用的代码是：

import multiprocessing

import pandas as pd
import numpy as np

def add_empty_dfs_to_shared_dict(shared_dict, key):
    shared_dict[key] = pd.DataFrame()


def edit_df_in_shared_dict(shared_dict, namespace, ind):
    row_to_insert = namespace.df.loc[ind]
    df = shared_dict[ind]
    df[ind] = row_to_insert
    shared_dict[ind] = df


if __name__ == '__main__':
    # region define inputs

    max_jobs_running = 4
    n = 100

    # endregion

    manager = multiprocessing.Manager()
    shared_dict = manager.dict()
    namespace = manager.Namespace()

    dataframe_to_be_shared = pd.DataFrame({
        'player_id': list(range(n)),
        'data': np.random.random(n),
    }).set_index('player_id')

    namespace.df = dataframe_to_be_shared

    for i in range(n):
        add_empty_dfs_to_shared_dict(shared_dict, i)

    jobs = []
    jobs_running = 0
    for i in range(n):
        p = multiprocessing.Process(
            target=edit_df_in_shared_dict,
            args=(shared_dict, namespace, i)
        )
        jobs.append(p)
        p.start()

        jobs_running += 1

        if jobs_running >= max_jobs_running:
            while jobs_running >= max_jobs_running:
                jobs_running = 0
                for p in jobs:
                    jobs_running += p.is_alive()

    for p in jobs:
        p.join()

    for key, value in shared_dict.items():
        print(f"key: {key}")
        print(f"value: {value}")
        print("-" * 50)

这可能会更好地由Queue and Pool设置而不是我的黑客修复。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

multiprocessing

使用命名空间和共享内存字典时关闭管理器错误“AttributeError：'ForkAwareLocal'对象没有属性'连接'” 的相关文章

如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何在 Ubuntu 16.04 上的 Python 3 / Matplotlib 2 中安装底图？

I tried pip3 install basemap but Basemap https sourceforge net projects matplotlib files matplotlib toolkits 好像不在 PyPI 上
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

访问 Tomcat 服务器上的 Web 应用程序资源时出现 NoSuchMethodError

在网上搜索后这是一个我无法找到答案的问题我的 Web 应用程序已部署到 tomcat 服务器我知道这一切都在工作因为 index jsp 显示文本但是当我尝试访问我制作的资源时应该打印出 hello world tomcat 服
重现带有双表头的复杂表格

锁定时间78 days 有对该问题内容的争议此时正在解决目前不接受新的答案或互动我想创建下表 Where Alzheimer s Disease Assessment Scale Cognitive ADAS CogT0 Rey Ost
如何在使用 Select 语句时转义 mysql 中的 value 关键字

我在使用 Select 语句时遇到问题其中列名称为值并且我想根据值列检索值SELECT and LIKE运营商 Code SELECT compo clecompo FROM compo compo ON compo clecom
什么时候需要使用类型注释？

在读的时候数据类型从 Rust Book 中我注意到有时变量是用类型注释定义的有时则不是我什么时候应该使用类型注释 let tup i32 f64 u8 500 6 4 1 let tup 500 6 4 1 let months Ja
如何使用 flex json 序列化对象列表？

我有一个如下所示的对象列表 List
动态链接标签无法打开网站

我最近开始使用动态组件它工作得很好直到我开始使用动态链接标签所以这是我的问题我想通过标签链接打开一个网站但每次我尝试这样做时它都会破坏程序并给出错误 System ComponentModel Win32Exception pr
JavaBean“useBean类属性classes.UserData的值无效”[重复]

这个问题在这里已经有答案了我有两个 JSP 和一个 JavaBean 无法正常工作我使用的是Tomcat 6 0 第一个 JSP 是 GetName jsp 位于 C Tomcat webapps app1 GetName jsp
从 python 启动 nano 作为子进程，捕获输入

我试图从Python内部启动一个文本编辑器 nano 让用户输入文本然后在写出后捕获文本 Control O 我没有与subprocess之前没有模块也没有管道所以我不知道下一步要尝试什么到目前为止我有这个代码 a subproce
PDFBOX 具有粗体和普通文本的同一流

好吧我一直在使用 PDFBox 但我仍然完全不理解它但我已经阅读了文档使用字体和其他一些地方但我找到了如何从 PDF 中获取文本它是风格但我正在创造它而不是阅读它我正在尝试做点什么 Like 这在同一行上有粗体和普通文本
检查 C 中文件是否存在的最佳方法是什么？

有没有比简单地尝试打开文件更好的方法 int exists const char fname FILE file if file fopen fname r fclose file return 1 return 0 查找access 函数
映射多对多关系

我在让实体框架处理数据模式中的多对多关系时遇到一些问题这是我的模型 public class User public int UserId get set public int Username get set public IEnume
我如何找到哪个域从我的服务器请求 iframe 并将域保存在数据库上

我有一组不同的网站请求iframe由于各种原因从我的服务器上删除了 html 文件是否可以追踪onload哪个域请求iframe然后将其保存到数据库中如果该域已存在则不要将其添加到数据库中请求 iframe 内容的不是域而是用户的
sqlite 日期排序

我正在将文件解析到 sqlite 数据库中其中包含 YYYY MM DD 格式的日期我想将条目存储到 sqlite 中以便我可以按日期对条目进行排序字符串不切割它在 sqlite 中存储和排序日期的正常协议是什么应该将日期转换为
舍入错误？

在我的课程中我被告知连续值在内存中近似表示因此使用浮点数进行计算会涉及舍入误差这些是位模式中的微小差异因此测试e f是不安全的如果e and f是花车参考Java 这是真的我使用了比较语句doubles and floats
我可以在 Pool.imap 调用的函数中使用多处理队列吗？

我正在使用 python 2 7 并尝试在自己的进程中运行一些 CPU 繁重的任务我希望能够将消息发送回父进程以使其了解进程的当前状态多处理队列似乎对此很完美但我不知道如何让它工作所以这是我的基本工作示例不使用队列 impor
为什么有界类型参数会出现“java.lang.ClassCastException：[Ljava.lang.Object；无法转换为”错误，而形式类型参数则不会？

由于 java 没有通用数组因此我使用将对象数组转换为类型参数的常规技巧当我有一个像这样的正式类型参数时这工作得很好
cumsum() 从最后一个条目开始向后移动

我想计算从最后一个值开始向后移动的数字向量的累积和标准cumsum R 中的函数通常从第一个值开始并向前移动如简单的示例所示 cumsum 1 5 1 3 6 10 15 但我想要一个像这样的结果 15 14 12 9 5 有没有R函数
mysql 中每组的行数

我想根据这种情况生成查询结果可以根据crew id和类型创建行号 id crew id amount type 1 4 1000 AUB 2 4 1500 AUB 3 5 8000 CA 4 4 1000 CA 5 5 1000 AUB
空传播替换空检查先验条件语句

看到一个类似的问题我想知道以下表达式是否 if attribute null attribute Description input 与以下零传播变体的行为几乎相同 if attribute Description input 到目前
使用命名空间和共享内存字典时关闭管理器错误“AttributeError：'ForkAwareLocal'对象没有属性'连接'”

我在尝试着在进程之间共享数据帧根据对该数据帧执行的计算但不更改更新共享字典我正在使用一个multiprocessing Manager 创建一个dict在共享内存中用于存储结果和Namespace存储共享我想要读取的数据框

使用命名空间和共享内存字典时关闭管理器错误“AttributeError：'ForkAwareLocal'对象没有属性'连接'”

使用命名空间和共享内存字典时关闭管理器错误“AttributeError：'ForkAwareLocal'对象没有属性'连接'” 的相关文章

随机推荐

热门标签