多处理另一个函数的函数

2023-12-19

我正在对模拟的时间序列进行分析。基本上，它为每个时间步骤执行相同的任务。由于时间步数非常多，并且每个时间步的分析都是独立的，因此我想创建一个可以多处理另一个函数的函数。后者将有参数，并返回结果。

使用共享字典和 lib并发.futures，我设法编写了以下内容：

import concurrent.futures as Cfut
def multiprocess_loop_grouped(function, param_list, group_size, Nworkers, *args):
    # function : function that is running in parallel
    # param_list : list of items
    # group_size : size of the groups
    # Nworkers : number of group/items running in the same time
    # **param_fixed : passing parameters

    manager = mlp.Manager()
    dic = manager.dict()
    executor = Cfut.ProcessPoolExecutor(Nworkers)

    futures = [executor.submit(function, param, dic, *args)
           for param in grouper(param_list, group_size)]

    Cfut.wait(futures)
    return [dic[i] for i in sorted(dic.keys())]

通常，我可以这样使用它：

def read_file(files, dictionnary):
    for file in files:
        i = int(file[4:9])
        #print(str(i))
        if 'bz2' in file:
            os.system('bunzip2 ' + file)
            file = file[:-4]
        dictionnary[i] = np.loadtxt(file)
        os.system('bzip2 ' + file)

Map = np.array(multiprocess_loop_grouped(read_file, list_alti, Group_size, N_thread))

或者像这样：

def autocorr(x):
    result = np.correlate(x, x, mode='full')
    return result[result.size//2:]

def find_lambda_finger(indexes, dic, Deviation):
    for i in indexes :
        #print(str(i))
        # Beach = Deviation[i,:] - np.mean(Deviation[i,:])
        dic[i] = Anls.find_first_max(autocorr(Deviation[i,:]), valmax = True)

args = [Deviation]
Temp = Rescal.multiprocess_loop_grouped(find_lambda_finger, range(Nalti), Group_size, N_thread, *args)

基本上，它正在发挥作用。但效果不佳。有时会崩溃。有时它实际上启动了与 Nworkers 数量相同的 python 进程，有时当我指定时，一次只有 2 或 3 个进程在运行Nworkers = 15.

例如，我遇到的一个经典错误在我提出的以下主题中进行了描述：在多处理之后调用 matplotlib 有时会导致错误：主线程不在主循环中 https://stackoverflow.com/questions/53045307/calling-matplotlib-after-multiprocessing-sometimes-results-in-error-main-threa

什么是更Pythonic的方式来实现我想要的？如何改进该功能的控制？如何控制更多正在运行的python进程的数量？

Python 多处理的基本概念之一是使用队列。当您有一个可以迭代且不需要由子流程更改的输入列表时，它的工作效果非常好。它还可以让您很好地控制所有进程，因为您可以生成所需的数量，可以空闲运行它们或停止它们。

调试起来也容易得多。显式共享数据通常是一种更难以正确设置的方法。

队列可以容纳任何东西，因为根据定义它们是可迭代的。因此，您可以用文件路径字符串填充它们以读取文件，用不可迭代的数字来进行计算，甚至用图像来绘制。

在您的情况下，布局可能如下所示：

import multiprocessing as mp
import numpy as np
import itertools as it


def worker1(in_queue, out_queue):
    #holds when nothing is available, stops when 'STOP' is seen
    for a in iter(in_queue.get, 'STOP'):
        #do something
        out_queue.put({a: result}) #return your result linked to the input

def worker2(in_queue, out_queue):
    for a in iter(in_queue.get, 'STOP'):
        #do something differently
        out_queue.put({a: result}) //return your result linked to the input

def multiprocess_loop_grouped(function, param_list, group_size, Nworkers, *args):
    # your final result
    result = {}

    in_queue = mp.Queue()
    out_queue = mp.Queue()

    # fill your input
    for a in param_list:
        in_queue.put(a)
    # stop command at end of input
    for n in range(Nworkers):
        in_queue.put('STOP')

    # setup your worker process doing task as specified
    process = [mp.Process(target=function,
               args=(in_queue, out_queue), daemon=True) for x in range(Nworkers)]

    # run processes
    for p in process:
        p.start()

    # wait for processes to finish
    for p in process:
        p.join()

    # collect your results from the calculations
    for a in param_list:
        result.update(out_queue.get())

    return result

temp = multiprocess_loop_grouped(worker1, param_list, group_size, Nworkers, *args)
map = multiprocess_loop_grouped(worker2, param_list, group_size, Nworkers, *args)

当您担心队列内存不足时，可以使其更加动态。您需要在进程运行时填充和清空队列。看这个例子here https://stackoverflow.com/a/42625054/4141279.

最后的话：它并不像您所要求的那样更加 Pythonic。但对于新手来说更容易理解;-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

多处理另一个函数的函数的相关文章

boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
为什么我的代码不能根据字典解码加密字符串？

我有一本字典其中包含代表字母的键和值例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码并将该字符串转换为一个列表其中每个项目都是一个单词我需要根据字典中的项目来解决它代码示例是 wo
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
根据开始列和结束列扩展数据框（速度）

我有一个pandas DataFrame含有start and end列加上几个附加列我想将此数据框扩展为一个时间序列从start值并结束于end值但复制我的其他专栏到目前为止我想出了以下内容 import pandas as
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
可以用 Django 制作移动应用程序吗？

我想知道我是否可以在我的网站上使用 Django 代码并以某种方式在移动应用程序 Flutter 等框架中使用它那么是否可以使用我现在拥有的 Django 后端并在移动应用程序中使用它所以就像models views etc 是的有
PyMC3-自定义 theano Op 进行数值积分

我使用 PyMC3 进行参数估计使用必须定义的特定似然函数我用谷歌搜索了一下发现我应该使用densitydist实现用户定义的似然函数的方法但它不起作用如何在 PyMC3 中合并用户定义的似然函数并找出最大 aposteriori
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
Python 惰性迭代器

我试图了解迭代器表达式如何以及何时被求值以下似乎是一个懒惰的表达 g i for i in range 1000 if i 3 i 2 然而这个在构造上失败了 g line strip for line in open xxx r if
如何使用 paramiko 查看（日志）文件传输进度？

我正在使用 Paramiko 的 SFTPClient 在主机之间传输文件我希望我的脚本打印文件传输进度类似于使用 scp 看到的输出 scp my file user host user host password my file 1
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
如何循环遍历字典列表并打印特定键的值？

我是 Python 新手有一个问题我知道这是一个非常简单的问题运行Python 3 4 我有一个需要迭代并提取特定信息的列表以下是列表称为部分的示例已截断数千个项目 state DEAD id phwl type name
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

对前导数字后跟非数字字符的字符串数组进行排序

我可以使用以下代码获得排序的文件名列表 log files scandir LLP LOG DIR sorted sort log files 文件名格式为 X log 其中 X 是渐进数值我该如何解决获取问题 0 log 1 log 1
如何在 Julia 0.4-pre 中从 now() 获取毫秒数？

如何获取从now 开始的毫秒数 Dates format now HH MM SS sss gives 18 32 11 000 哪里的 sss部分总是 000 now 不记录毫秒 julia gt show x now show Date
线程是否需要处于 RUNNABLE 状态才能被中断？

java中的线程在被中断方法中断之前是否必须处于就绪状态我尝试通过在下面输入上面给出的代码来检查这一点 class MyThread extends Thread public void run try for int i 0 i lt
如何使用 MVP 在 GridView 中绑定数据并对其进行操作

我对 MVP 的事情还很陌生并且正在慢慢地了解这一切我遇到的问题是如何在填充 GridView 和 ddls 但我们稍后会解决这个问题时保持与 MVP 方法的一致性可以将其直接连接到对象 DataSourceID 吗对我来说这似
“插件 org.eclipse.jdt.ui 无法加载类 org.eclipse.jdt.internal.ui.packageview.PackageExplorerPart。” adt 中的问题 (v22.6.2)

我在我的 adt eclipse 中收到此错误我正在使用java的更新版本请有人帮我解决这个问题我曾经在 Eclipse 中发现过同样的错误我在 Windows 更新后发生了这种情况我为解决问题所做的就是再次授予 Eclips
在android中自定义谷歌地图V2的配色方案

目前我正在我的 Android 应用程序中使用谷歌地图 v2 并且我遇到了地图配色方案定制的问题我在这里看到它可以在网络中使用javascripthttps developers google com maps customize htt
添加二进制数

有谁知道如何在Java中以二进制输入的2个二进制数相加例如 1010 10 1100 Use Integer parseInt String int radix http docs oracle com javase 7 docs api
PHP int类型解释为float，破坏页面

我正在学习 PHP 7 中的 OOP 遵循一本书上的示例关于代码
Java Casting 方法，但不知道要转换成什么

今天我在玩Java 我注意到一些奇怪的事情考虑这段代码 String foo cast hi int bar cast 1 The cast 方法在这里 public static
在模式匹配中失败

目前在 c 7 版本 15 3 4 中以下代码可以编译但两个变量都合法地无法使用 switch fruit case Apple apple case Orange orange impossible to use apple or o
在Java中读写TCP头（选项）

我想做的是使用 Java 编写客户端和服务器通过 TCP 发送字符串到目前为止使用 Socket 和输入输出流没有问题 But now I m trying to add 3 numbers to the Options field
尝试了解 .NET Core 中 appsettings.json 与 web.config 的新行为，但对 MSDN 上相互矛盾的信息感到困惑

因此我正在阅读 MSDN 上的所有 NET Core 基础知识文章同时在 Visual Studio 2017 中开发新的 NET Core MVC 应用程序我在文章中阅读的内容与实际内容之间似乎存在一些不一致我在我的申请中看到我
查找字符串中某个字符的索引

我有一根绳子NSString Original 88 12 sep 2012 or Original 8 blablabla 我只想打印之前的字符那么如何找到字符的索引或者我该怎么做提前致谢要打印第一个右括号之前的字符您可以这
使用 wicket 进行单元测试时如何设置自定义会话？

我正在尝试在仅允许您登录后访问的 wicket 页面上运行一些单元测试在我的 JUnit 测试中如果不设置会话我无法启动页面或呈现它你如何设置会话我在查找有关如何执行此操作的任何文档时遇到问题 WicketTester teste
random.setstate() 和 random.seed() 之间差异或相似之处的确切性质是什么

我对使用种子生成随机数有一个非常高的理解因此在生成随机数之前设置特定的种子将导致每次调用时生成相同的数字我假设通过以下方式恢复状态 import random test123 random getstate random setsta
在 WPF MediaElement 中播放 HTTPS 视频 URL 的解决方法

我有一个 C WPF 应用程序我需要通过 HTTPS 播放视频流我说的是 YouTube 视频通过使用提取的直接 URLYouTube爆炸 https github com Tyrrrz YoutubeExplode 众所周知 WPF
如何在Retrofit 2中使用gson TypeAdapter？

我有一个工作代码其中我的改造客户端可以从 api 检索对象列表国家地区问题是如果我用来检索所有国家地区则 api 使用的参数会返回一个 ARRAY 那么当我想要查询单个国家地区时它会返回单个 OBJECT 结果显示以下异常
SQLite 中空安全相等运算符 <=> 的等价物是什么？

我需要确定 SQLite 的等价物是什么运算符 http dev mysql com doc refman 5 0 en comparison operators html operator equal to在 MySQL 中任何想法
用于协调的 SQL 语句

给出以下架构 create table TBL1 ID varchar2 100 primary key not null MATCH CRITERIA varchar2 100 create table TBL2 ID varchar2
多处理另一个函数的函数

我正在对模拟的时间序列进行分析基本上它为每个时间步骤执行相同的任务由于时间步数非常多并且每个时间步的分析都是独立的因此我想创建一个可以多处理另一个函数的函数后者将有参数并返回结果使用共享字典和 lib并发 futures 我

多处理另一个函数的函数

多处理另一个函数的函数 的相关文章

随机推荐

热门标签

多处理另一个函数的函数的相关文章