如何在AWS Lambda中模拟multiprocessing.Pool.map()？

2024-04-22

AWS Lambda 上的 Python 不支持multiprocessing.Pool.map()，如记录在这另一个问题 https://stackoverflow.com/questions/34005930/multiprocessing-semlock-is-not-implemented-when-running-on-aws-lambda。请注意，另一个问题是问为什么它不起作用。这个问题是不同的，我问的是在缺乏底层支持的情况下如何模拟功能。

另一个问题的答案之一给了我们这段代码：

# Python 3.6
from multiprocessing import Pipe, Process

def myWorkFunc(data, connection):
    result = None

    # Do some work and store it in result

    if result:
        connection.send([result])
    else:
        connection.send([None])


def myPipedMultiProcessFunc():

    # Get number of available logical cores
    plimit = multiprocessing.cpu_count()

    # Setup management variables
    results = []
    parent_conns = []
    processes = []
    pcount = 0
    pactive = []
    i = 0

    for data in iterable:
        # Create the pipe for parent-child process communication
        parent_conn, child_conn = Pipe()
        # create the process, pass data to be operated on and connection
        process = Process(target=myWorkFunc, args=(data, child_conn,))
        parent_conns.append(parent_conn)
        process.start()
        pcount += 1

        if pcount == plimit: # There is not currently room for another process
            # Wait until there are results in the Pipes
            finishedConns = multiprocessing.connection.wait(parent_conns)
            # Collect the results and remove the connection as processing
            # the connection again will lead to errors
            for conn in finishedConns:
                results.append(conn.recv()[0])
                parent_conns.remove(conn)
                # Decrement pcount so we can add a new process
                pcount -= 1

    # Ensure all remaining active processes have their results collected
    for conn in parent_conns:
        results.append(conn.recv()[0])
        conn.close()

    # Process results as needed

可以修改此示例代码以支持multiprocessing.Pool.map()?

到目前为止我尝试过什么

我分析了上面的代码，没有看到要执行的函数的参数或数据，所以我推断它执行的功能与multiprocessing.Pool.map()。除了演示可以组装成解决方案的构建块之外，尚不清楚代码的作用。

这是一个“为我编写代码”的问题吗？

是的，在某种程度上，确实如此。这个问题影响了成千上万的Python开发者，如果我们所有人共享相同的代码，而不是强迫每个遇到这个问题的SO用户去开发，那么对世界经济来说会更加有效，减少温室气体排放等他们自己的解决方法。我希望我已经尽了自己的一份力量，将其提炼成一个明确的问题，并准备好假定的构建块。

我能够让这个在我自己的测试中工作。我的代码基于此链接：https://aws.amazon.com/blogs/compute/parallel-processing-in-python-with-aws-lambda/ https://aws.amazon.com/blogs/compute/parallel-processing-in-python-with-aws-lambda/

注1：你必须增加 lambda 函数的内存分配。使用默认的最小数量，多处理不会提高性能。我的帐户可以分配的最大数量（3008MB）达到了以下数字。

NB2：我在这里完全忽略了最大并行进程。我的用法没有太多需要处理的元素。

使用下面的代码，用法是：

work = funcmap(yourfunction,listofstufftoworkon)
yourresults = work.run()

从我的笔记本电脑运行：

jumper@jumperdebian[3333] ~/scripts/tmp  2019-09-04 11:52:30
└─ $ ∙ python3 -c "import tst; tst.lambda_handler(None,None)"
results : [(35, 9227465), (35, 9227465), (35, 9227465), (35, 9227465)]
SP runtime : 9.574460506439209
results : [(35, 9227465), (35, 9227465), (35, 9227465), (35, 9227465)]
MP runtime : 6.422513484954834

从AWS运行：

Function Logs:
START RequestId: 075a92c0-7c4f-4f48-9820-f394ee899a97 Version: $LATEST
results : [(35, 9227465), (35, 9227465), (35, 9227465), (35, 9227465)]
SP runtime : 12.135798215866089
results : [(35, 9227465), (35, 9227465), (35, 9227465), (35, 9227465)]
MP runtime : 7.293526887893677
END RequestId: 075a92c0-7c4f-4f48-9820-f394ee899a97

这是测试代码：

import time
from multiprocessing import Process, Pipe
import boto3

class funcmap(object):

    fmfunction=None
    fmlist=None

    def __init__(self,pfunction,plist):
        self.fmfunction=pfunction
        self.fmlist=plist

    def calculation(self, pfunction, pload, conn):
        panswer=pfunction(pload)
        conn.send([pload,panswer])
        conn.close()

    def run(self):
        datalist = self.fmlist
        processes = []
        parent_connections = []
        for datum in datalist:
            parent_conn, child_conn = Pipe()
            parent_connections.append(parent_conn)
            process = Process(target=self.calculation, args=(self.fmfunction, datum, child_conn,))
            processes.append(process)

        pstart=time.time()
        for process in processes:
            process.start()
            #print("starting at t+ {} s".format(time.time()-pstart))
        for process in processes:
            process.join()
            #print("joining at t+ {} s".format(time.time()-pstart))

        results = []
        for parent_connection in parent_connections:
            resp=parent_connection.recv()
            results.append((resp[0],resp[1]))
        return results


def fibo(n):
    if n <= 2 : return 1
    return fibo(n-1)+fibo(n-2)

def lambda_handler(event, context):
    #worklist=[22,23,24,25,26,27,28,29,30,31,32,31,30,29,28,27,26,27,28,29]
    #worklist=[22,23,24,25,26,27,28,29,30]
    worklist=[30,30,30,30]
    #worklist=[30]
    _start = time.time()
    results=[]
    for a in worklist:
        results.append((a,fibo(a)))
    print("results : {}".format(results))
    _end = time.time()
    print("SP runtime : {}".format(_end-_start))

    _mstart = time.time()
    work = funcmap(fibo,worklist)
    results = work.run()
    print("results : {}".format(results))
    _mend = time.time()
    print("MP runtime : {}".format(_mend-_mstart))

希望能帮助到你。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在AWS Lambda中模拟multiprocessing.Pool.map()？的相关文章

嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
检测到通过 ChromeDriver 启动的 Chrome 浏览器

我正在尝试在 python 中使用 selenium chromedriver 来访问 www mouser co uk 网站然而从第一次拍摄开始它就被检测为机器人有人对此有解释吗此后我使用的代码 options Options
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
字符串中的注释和注释中的字符串

我正在尝试使用 Python 和 Regex 计算 C 代码中包含的注释中的字符数但没有成功我可以先删除字符串以删除字符串中的注释但这也会删除注释中的字符串结果会很糟糕是否有机会通过使用正则表达式来询问不匹配注释中的字符串反之亦
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
附加两个具有相同列、不同顺序的数据框

我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du

随机推荐

Terraform 13，根据另一个变量的值验证变量

有没有办法实现以下逻辑 variable environment description The environment this will be run in can only be set to preprod test prod ty
file_get_contents：无法设置本地证书链文件

我们使用 Composer 来升级 Satis 的依赖项最近的服务器升级后我们无法这样做缩小可能的原因后我们发现 file get contents php 函数在尝试建立 ssl 连接时失败我们使用以下脚本来测试我们的 ssl
使用 pandas 将一列字典拆分/分解为单独的列

我的数据保存在postgreSQL数据库我正在使用 Python2 7 查询这些数据并将其转换为 Pandas DataFrame 但是该数据帧的最后一列内部有一个值字典数据框df看起来像这样 Station ID Pollutant
3D 空间：使用鼠标指针沿着对象指向的方向

给定相机面向的方向的 3D 向量以及 3D 空间中 3D 对象的方位方向向量如何计算鼠标指针在屏幕上必须遵循的 2 维斜率以便在视觉上沿着所述物体的方向移动基本上我希望能够单击箭头并通过拖动它来使其前后移动但前提是鼠标指针沿着箭
从 shell 脚本内的 php 脚本检索退出状态

我有一个 bash shell 脚本它调用一些像这样的 PHP 脚本 bin bash php f somescript php php f anotherscript php 我想根据这些脚本的结果编写错误日志和或活动报告有什么方法
从 Jenkins 运行 Robot Framework 测试时，浏览器永远不会打开

我正在尝试在我的 OSX 笔记本电脑上运行 Jenkins 的 RF Selenium2Library 测试 Jenkins 默认安装为用户 jenkins 我安装了 Jenkins 的 RF 插件并设置了环境变量一切正常除了浏览器永远
如何将当前行与r中所有以前的行进行比较

我在 r 中有一个数据框 No value time 1 2 12 2 4 23 3 6 13 4 8 8 5 10 13 6 12 24 我想要的数据框是 No value time flag 1 2 12 0 NA 2 4 23 0 4
git 的“文件模式”是什么？

什么是 gitfilemode 对我来说它在每个仓库中 git config文件靠近顶部 core filemode true 它是什么这是什么意思与以下有什么关系吗 bare false 我也不太明白 A git 裸仓库详细信息
Heroku 无法将我的 Laravel 应用程序识别为 PHP 应用程序，并且不进行 Composer 安装

我正在尝试在 Heroku 上发布我的 Laravel 应用程序我已从 gitignore中排除了composer lock文件并创建了一个包含 web vendor bin heroku php apache2 public 我创建了
两个具有相同 id 的 XML 元素

我试图以完全相同的方式修改两个 TextView 我想我可以给它们相同的 id 并使用 findViewById 和 setText 方法在两行中更改这些 TextView 但似乎只有一个 TextView 发生了变化有没有办法做到这一点
向量化函数 (Python)

我是 python 新手尝试进行硬件分配但它不断向我抛出此错误在 iPython Notebook 中 TypeError unsupported operand type s for or pow list and float 这是
Ruby - 将数组映射到哈希图

我有一个数组和一个返回给定值的函数最终我想创建一个哈希映射将数组的值作为键值将 f key value 的结果作为值是否有一种干净简单的方法例如类似于数组的each map 使用块来执行此操作所以相当于 hsh 1 2 3 4
OpenCV 对白色像素进行分组

我已经完成了艰苦的工作将 MacBook 上的 iSight 摄像头变成了红外摄像头对其进行了转换设置了阈值等现在得到的图像如下所示 alt text http www tommed co uk images opencv ir e
将位图居中并重复边缘像素

我正在尝试在我的 Android 应用程序中使用图像作为背景如果图像不适合屏幕我希望图像水平居中并垂直顶部应通过重复边缘来填充剩余的屏幕区域我的布局 xml 如下所示
如何在“单击”槽中使用 QApplication::mouseButtons() 来判断鼠标按钮？

我有一个 QMainWindow 并且想要处理来自其中较小的小部件例如 tableview 的单击信号最初我将信号连接到这个 QMainWindow 的插槽这是最常见的方法现在我需要判断单击了哪个鼠标按钮并对左右按钮执行不同的
我可以使用 System.Text.Json 通过私有构造函数反序列化 Json 吗？

想知道是否可以拥有私有构造函数并使用新的 System Text Json 序列化器 public class MyModel public string Name get set public string Data get set pr
iOS：使用覆盖裁剪从 UIImagePickerController 相机抓取的静态图像

我是 iOS 新手过去一周我一直在网上寻找教程例如处理 Exif 图像 http niftybean com main blog 16 selecting regions from rotated exif images on iph
计算数组的平均值

我想使用数组计算平均数我希望程序询问成绩的数量然后我想输入成绩数字在我想获得平均输出之后double 到目前为止这是我的代码 public class Average public static void main String a
使用 purrr::map 将多个数据帧写入 csv 文件 [重复]

这个问题在这里已经有答案了 PROBLEM 我有一个数据帧列表应将其作为 csv 文件写入磁盘假设这是数据框列表 dfs lt list iris mtcars 什么没有奏效我尝试像这样构建正确的文件名但它不起作用 dfs gt m
如何在AWS Lambda中模拟multiprocessing.Pool.map()？

AWS Lambda 上的 Python 不支持multiprocessing Pool map 如记录在这另一个问题 https stackoverflow com questions 34005930 multiprocessing s

如何在AWS Lambda中模拟multiprocessing.Pool.map()？

如何在AWS Lambda中模拟multiprocessing.Pool.map()？ 的相关文章

随机推荐

热门标签

如何在AWS Lambda中模拟multiprocessing.Pool.map()？的相关文章