跨多个进程使用双端队列对象

2024-02-18

我试图减少读取大约 100,000 个条目的数据库的处理时间，但我需要它们以特定的方式格式化，为了尝试做到这一点，我尝试使用 pythonmultiprocessing.map函数工作完美，只是我似乎无法获得任何形式的队列引用来跨它们工作。

我一直在使用来自在 python 中填充队列并管理多处理 https://stackoverflow.com/questions/17241663/filling-a-queue-and-managing-multiprocessing-in-python指导我跨多个进程使用队列，以及在线程中使用全局变量 https://stackoverflow.com/questions/19790570/using-a-global-variable-with-a-thread指导我跨线程使用全局变量。我已经让软件可以工作了，但是当我在运行该过程后检查列表/队列/字典/映射长度时，它总是返回零

我写了一个简单的例子来说明我的意思：您必须将脚本作为文件运行，map's initialize函数在解释器中不起作用。

from multiprocessing import Pool
from collections import deque

global_q = deque()

def my_init(q):
    global global_q
    global_q = q
    q.append("Hello world")


def map_fn(i):
    global global_q
    global_q.append(i)


if __name__ == "__main__":
    with Pool(3, my_init, (global_q,)) as pool:
        pool.map(map_fn, range(3))
    for p in range(len(global_q)):
        print(global_q.pop())

理论上，当我使用以下方法将队列对象引用从主线程传递到工作线程时pool函数，然后使用给定函数初始化该线程的全局变量，然后当我从map函数之后，该对象引用应该仍然指向原始队列对象引用（长话短说，所有东西都应该在同一个队列中结束，因为它们都指向内存中的相同位置）。

所以，我期望：

Hello World
Hello World
Hello World
1
2
3

当然，1, 2, 3的顺序是任意的，但是您将在输出中看到的是''.

为什么当我将对象引用传递给pool函数，什么也没发生？

这是一个如何通过扩展在进程之间共享某些内容的示例multiprocessing.managers.BaseManager支持类deques.

有一个定制经理人 https://docs.python.org/3/library/multiprocessing.html#customized-managers文档中有关创建它们的部分。

import collections
from multiprocessing import Pool
from multiprocessing.managers import BaseManager


class DequeManager(BaseManager):
    pass

class DequeProxy(object):
    def __init__(self, *args):
        self.deque = collections.deque(*args)
    def __len__(self):
        return self.deque.__len__()
    def appendleft(self, x):
        self.deque.appendleft(x)
    def append(self, x):
        self.deque.append(x)
    def pop(self):
        return self.deque.pop()
    def popleft(self):
        return self.deque.popleft()

# Currently only exposes a subset of deque's methods.
DequeManager.register('DequeProxy', DequeProxy,
                      exposed=['__len__', 'append', 'appendleft',
                               'pop', 'popleft'])


process_shared_deque = None  # Global only within each process.

def my_init(q):
    """ Initialize module-level global. """
    global process_shared_deque
    process_shared_deque = q
    q.append("Hello world")


def map_fn(i):
    process_shared_deque.append(i)  # deque's don't have a "put()" method.


if __name__ == "__main__":
    manager = DequeManager()
    manager.start()
    shared_deque = manager.DequeProxy()

    with Pool(3, my_init, (shared_deque,)) as pool:
        pool.map(map_fn, range(3))

    for p in range(len(shared_deque)):  # Show left-to-right contents.
        print(shared_deque.popleft())

Output:

Hello world
0
1
2
Hello world
Hello world

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

跨多个进程使用双端队列对象的相关文章

Firefox 中的文件下载对话框

我正在使用firefox进行selenium python编程自动开始下载并保存文件我已经完成了所有操作但无法下载csv文件我的python版本是2 6 6 我的selenium版本是最新版本我也尝试使用以下链接即 fp web
c++11 正则表达式比 python 慢

嗨我想了解为什么以下代码使用正则表达式进行分割字符串分割 include
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
熊猫加入具有不同索引级别/日期时间的数据帧？

嗨我有两个 DataFrame 如下所示 dineType menuName unique columns date y m d
Python 正则表达式从文本中提取域

我有以下正则表达式 r a zA Z0 9 a zA Z0 9 61 a zA Z0 9 a zA Z 2 6 当我将其应用于文本字符串时比方说这是 www website1 com 这是 website2 com 我得到 www we
绘制对数轴

我想使用 matplotlib 绘制一张带有一个对数轴的图我一直在阅读文档但无法弄清楚语法我知道这可能很简单 scale linear 在情节争论中但我似乎无法正确理解示例程序 import pylab import matplo
为什么 pandas.DataFrame.update 会更改更新后的数据帧的数据类型？

出于显而易见的原因我想在更新后将列的数据类型保留为 int 有什么想法为什么这不能按预期工作吗 import pandas as pd df1 pd DataFrame a 1 b 2 c foo a 3 b 4 c baz df2 pd
如何使用格式保存 Tkinter 文本小部件的内容

我在 python 中使用 Tkinter 在文本窗口中显示输出我发现使用 get 功能我可以从此窗口检索文本内容但我有用不同背景颜色标记的文本部分是否可以将内容与这些颜色一起复制到文件例如 html 或 doc 中没有对你想要的
在Python中整齐地绘制PMF

有没有一个库可以帮助我在 python 中整齐地绘制样本的概率质量函数如下所示通过matplotlib pyplot的stem模块 matplotlib pyplot stem args kwargs from matplotlib p
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
使用 python boto3 管理 Route53 中具有多个 IP 的 A 记录

我的route53中有一条A记录后面有多个IP 例子 A record dummy xyz com 点IPs 1 1 1 1 2 2 2 2 和 3 3 3 3路由策略 Simple 我使用下面的代码来更新单个 IP 的记录 Change
LogRecord 没有预期的字段

在使用 logging 模块的Python中文档承诺LogRecord实例将具有许多属性这些属性在文档中明确列出然而情况似乎并不总是如此当我不使用日志记录模块的 basicConfig 方法时下面的程序显示属性 asctime
__author__ 的起源是什么？

使用私有元数据变量的约定在哪里 author 一个模块内部从何而来 This http mail python org pipermail python dev 2001 March 013328 htmlPython 邮件列表线程似乎暗示
在python中检测按下了哪些键

我需要知道现在按下的是哪个键我不想捕获一些特定的按键来触发事件或类似的事情我想知道现在按下了哪些键并显示它们的列表我还需要捕获特殊键如 F1 F12 shift alt home windows 等基本上是键盘上的所有键我如何在
如果任何单元测试失败，如何使 Python 的覆盖率工具失败？

我想使用 shell 脚本来确保我的单元测试通过and我的代码有足够的测试覆盖率我只想运行我的测试代码once 我希望我可以通过coverage https coverage readthedocs io 工具和单次运行的工具如果一项或
Python：Factory Boy 生成对象创建时指定长度的列表

我正在尝试使用 Factoryboy 在创建时指定长度的对象中创建一个列表我可以创建列表但由于提供的长度大小的惰性性质每次尝试创建具有指定长度的列表都会导致问题这是我到目前为止所拥有的 class FooFactory facto
Django - 渲染到字符串无法加载 CSS

我正在尝试使用 Django 1 8 render to string 通过管理命令将 html 转换为 pdf 而不是使用 View request 以下代码可以将模板转换为 pdf 但它无法将 CSS 加载到模板中 def html t
Python struct.pack() 'struct.error: bad char in struct format' 尝试保存字节顺序时

我正在尝试打包一个字符串和字符串的长度 fmt
如何通过解析导入来组合并获取单个 Python 文件

我正在尝试获取单个 Python 文件作为输出我有一个 Python 脚本其中有多个此类导入 from that import sub 导入来自所有本地模块而不是来自系统或 Python 库有什么方法可以解决这些问题并获得一个完整的

随机推荐

在 Visual Studio 2013 中显示带有偏移量的控件

最近我将源代码从 Visual Studio 2010 迁移到 Visual Studio 2013 在 Visual Studio 2013 中构建后控件将显示有偏移单击下面的链接查看图像链接到图像 https i stack i
我无法安装包 spatstat.data。是否可以下载 zip 文件并复制并粘贴到 R 文件夹库中？

新的错误消息 https i stack imgur com gy84q png我更新了spatstat包它分为各个包除了 spatstat data 之外所有这些都已更新我努力了install packages spatstat
Objective-C 和 MATLAB/Octave 文件扩展名之间的重叠

Objective C 或 MATLAB Octave 是否有源文件扩展名 m 我问这个问题是因为我将 Hello World 程序放在一个文件夹中而我不能有两个hello m files 我看到的唯一方法是为每个程序创建子目录并将文件放
在 Kotlin 协程中等待 LiveData 结果

我有一个带有异步方法返回的存储库类User包裹成一个LiveData interface Repository fun getUser LiveData
针对应用程序组件工厂的清单合并失败

我是初学者第一次使用 MapActivity 我的项目生成了一些标题为清单合并失败的错误并建议在 android 清单文件中添加一行 Manifest merger failed Attribute application appC
后递增运算符在求值之后才会递增变量[重复]

这个问题在这里已经有答案了我正在寻找增量运算符不增加我设置innerHTML值的地方的数值的原因如下所示 div div var a 14 document getElementById php innerHTML a the resu
角度材质步进器下一步显示创建而不是 1

我正在研究步进器我想禁用下一步直到所有填充都被填充所以我在 html文件
使用 awk 计算第 95 个百分位

我是 awk 脚本编写的新手希望获得一些帮助来计算包含以下数据的文件的第 95 个百分位值 0 0001357 0 000112 0 000062 0 000054 0 000127 0 000114 0 000136 I tried c
apache_beam.transforms.util.Reshuffle() 不适用于 GCP 数据流

我已通过以下方式升级到最新的 apache beam gcp 包pip install upgrade apache beam gcp 然而我注意到改组 https github com apache beam blob master s
C++ std::unordered_map 中使用的默认哈希函数是什么？

我在用 unordered map
JAXB 在 Tomcat 9 和 Java 9/10 上不可用

TLDR 在 Java 9 10 上 Tomcat 中的 Web 应用程序无法访问 JAXB 即使其参考实现存在于类路径中 Edit 不这不是重复的如何解决 Java 9 中的 java lang NoClassDefFoundError
Android 2.3 SDK可以交叉编译到早期版本吗？

我有一个 Android 应用程序自操作系统 v1 以来就已上市从那以后我就再也没有碰过它因此忘记了 Android 开发的一切使用新的 Android 2 3 SDK 我可以编译我的应用程序以便以前操作系统版本的用户也可以使用它
Xcode 5 崩溃——Xcode 意外退出

当我在项目导航器中选择任何文件或尝试编辑它时 App Store 中的 Xcode 5 崩溃我已经删除了应用程序的所有插件和派生数据但它不断崩溃有谁知道如何解决这个问题以及为什么会发生这种情况以下是错误的第一部分 Exception
使用 ncurses 在 Linux 中构建 HelloWorld C++ 程序

我成功跑了sudo apt get install libncurses5 dev 然后在我的 Eclipse 窗口中尝试构建以下内容HelloWord cpp程序 include
查找数字数组中最大差异的算法

我有一个包含几百万个数字的数组 double const data new double 3600000 我需要遍历数组并找到范围数组中的最大值减去最小值然而有一个问题我只想找到最小值和最大值在 1 000 个样本之内的范围所以我
抽屉式导航无法关闭

我的应用程序中的导航抽屉没有关闭我正在使用活动而不是片段当我单击中的任何项目时listview 它会按应有的方式打开其他活动但当我回去时抽屉仍然打开我尝试过使用DrawerLayout closeDrawers 但它不起作用如何
如何缩短 C# 中的路径并保持其有效

我工作的地方目录的名字很长而且目录树也很长而且我遇到了外部应用程序中文件夹路径名太长的问题我无法更改此外部应用程序但我可以给它缩短的路径名我知道微软操作系统可以缩短路径名例如转换C TooLongName TooLongSub
通过 Id 和 Name 获取下一个和上一个 sql 行，EF？

假设我们在 SQL Server 表中有以下数据按名称排序 Id Name LName 5 Abbas Dayyan 3 Mohammad KD 4 Nima Ahmad 1 Omid Zangene 2 Pedram Ahmadi 我们
使用声纳 checkstyle 插件尊重 @SuppressWarnings

是否有可能使用 Checkstyle 插件配置 SonarQube 5 1 以遵守 SuppressWarnings deprecation 注解我不想关闭避免使用已弃用的方法规则我只想 SonarQube 尊重 SuppressW
跨多个进程使用双端队列对象

我试图减少读取大约 100 000 个条目的数据库的处理时间但我需要它们以特定的方式格式化为了尝试做到这一点我尝试使用 pythonmultiprocessing map函数工作完美只是我似乎无法获得任何形式的队列引用来跨它们工作

跨多个进程使用双端队列对象

跨多个进程使用双端队列对象 的相关文章

随机推荐

热门标签

跨多个进程使用双端队列对象的相关文章