在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁）

2024-01-14

我正在使用通过 uvicorn 提供的 FastAPI 构建一个 API。该 API 具有使用 python 多处理库的端点。

端点为 CPU 密集型任务生成多个进程以并行执行它们。以下是高级代码逻辑概述：

import multiprocessing as mp

class Compute:
    
    def single_compute(self, single_comp_data):
        # Computational Task CPU BOUND
        global queue
        queue.put(self.compute(single_comp_data))

    def multi_compute(self, task_ids):
        # Prepare for Compuation
        output = {}
        processes = []
        global queue
        queue = mp.Queue()
        
        # Start Test Objs Computation
        for tid in task_ids:
            # Load  task data here, to make use of object in memory cache
            single_comp_data = self.load_data_from_cache(tid)
            p = mp.Process(target=self.single_compute, args=single_comp_data)
            p.start()
            processes.append(p)

        # Collect Parallel Computation
        for p in processes:
            result = queue.get()
            output[result["tid"]]= result
            p.join()

        return output

下面是简单的 API 代码：

from fastapi import FastAPI, Response
import json


app = FastAPI()
#comp holds an in memory cache, thats why its created in global scope
comp = Compute()

@app.get("/compute")
def compute(task_ids):
    result = comp.multi_compute(task_ids)
    return Response(content=json.dumps(result, default=str), media_type="application/json")

当像这样与多个工作人员一起运行时：

uvicorn compute_api:app --host 0.0.0.0 --port 7000 --workers 2

我收到这个 python 错误

TypeError: can't pickle _thread.lock objects

只有 1 个工作进程就可以了。该程序在 UNIX/LINUX 操作系统上运行。

有人可以向我解释一下为什么这里的多个 uvicorn 进程不可能分叉一个新进程，以及为什么我会遇到这个锁？

最终应该实现的目标很简单：

uvicorn 进程会产生多个其他进程（子进程通过 fork）以及该 uvicorn 进程的内存副本。执行CPU密集型任务。

类型错误：无法 pickle _thread.lock 对象

源于您传递到子流程中的任何数据

p = mp.Process(target=self.single_compute, args=single_comp_data)

包含一个不可腌制的对象。

所有 args/kwargs 发送到multiprocessing子流程（无论是通过流程，还是通过Pool) 必须是可腌制的，同样，函数 run 的返回值也必须是可腌制的，以便可以将其发送回父进程。

如果您在 UNIX 上并使用fork多处理的启动方法（这是 Linux 上的默认设置，但不是 macOS 上的默认设置），您还可以利用写时复制内存语义，通过使数据可用来避免“向下”复制到子进程，例如通过实例状态、全局变量……，在生成子进程之前，并让它通过引用获取它，而不是将数据本身作为参数向下传递。

这个例子正在使用imap_unordered为了性能（假设不需要按顺序处理 id），并将返回一个将输入 ID 映射到它创建的结果的字典。

class Compute:
    _cache = {}  # could be an instance variable too but whatever

    def get_data(self, id):
        if id not in self._cache:
            self._cache[id] = get_data_from_somewhere(id)
        return self._cache[id]

    def compute_item(self, id):
        data = self.get_data(id)
        result = 42  # ... do heavy computation here ...
        return (id, result)

    def compute_result(self, ids) -> dict:
        for id in ids:
             self.get_data(id)  # populate in parent process
        with multiprocessing.Pool() as p:
             return dict(p.imap_unordered(self.compute_item, ids))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁）的相关文章

UnicodeDecodeError：“utf-8”编解码器无法解码位置 14 中的字节 0xb9：起始字节无效

我正在使用 Django REST 进行文件上传测试 Python3 6 2Django1 11djangorest框架 3 6 4Excel OSX 15 38 170902 操作系统 10 12 6 过去使用普通照片文件可以成功完成此操
如何生成大型网站的图形站点地图[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想为我的网站生成图形站点地图据我所知有两个阶段抓取网站并分析链接关系提取树形结构生成视觉上
如何仅选择数组中的第一列并对其求和？

这是我的代码 import numpy as np contrainte1 1080 0 65 minutes tous les jours contrainte2 720 0 55 minutes du lundi au vendredi
Visual Studio Code：如何使用参数调试 Python 脚本

我正在使用 Visual Studio Code 来调试 Python 脚本下列的本指南 https code visualstudio com docs python debugging 我在中设置了参数launch json file
System.Threading._IOCompletionCallback.PerformIOCompletionCallback(...) 处的 System.AccessViolationException

使用 Net Framework 4 我在多线程 C 代码中遇到 System AccessViolationException 即使我的所有代码都是托管代码这可能是 Net 中的一个错误吗因为我一直认为使用 Net 意味着无论我犯什么
python blpapi安装错误

我试图根据 README 中的说明为 python 安装 blpapi 3 5 5 但是在运行时 python setup py install 我收到以下错误 running install running build running b
无法使用 Python 循环分页 API 响应

所以我对这个感到摸不着头脑使用 HubSpot 的 API 我需要获取我客户的门户帐户中所有公司的列表遗憾的是标准 API 调用一次只能返回 100 家公司当它返回响应时它包含两个参数使分页响应成为可能其中之一是 ha
Django 说“id 可能不为 NULL”，但为什么会这样呢？

我今天要疯了我只是尝试插入一条新记录但它返回了 post blogpost id 可能不为 NULL 错误这是我的模型 class BlogPost models Model title models CharField max le
Python 可选参数对

我正在使用argparse模块获取两个可选的命令行参数 parser add argument start date nargs metavar START DATE help start date in YYYY MM DD parser
Python 中使用 globals() 的原因？

Python 中有 globals 函数的原因是什么它只返回全局变量的字典这些变量已经是全局的所以它们可以在任何地方使用我只是出于好奇而问试图学习Python def F global x x 1 def G print glob
HttpMediaTypeNotAcceptableException / HttpMediaTypeNotAcceptableException：找不到可接受的表示

我有一个客户端正在尝试连接的 API 但是它会抛出错误 2015 09 22 04 21 44 297 org springframework web servlet mvc method annotation HttpEntityMeth
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
使用 os.forkpty() 创建一个伪终端以 ssh 到远程服务器并与其通信

我正在尝试编写一个 python 脚本它可以 ssh 到远程服务器并可以从 python 客户端执行 ls cd 等简单命令但是在成功 ssh 到服务器后我无法读取伪终端的输出任何人都可以在这里帮助我以便我可以在服务器上执行一
使用 Python 导入包含文本和数字数据的文件

I have a txt file which has text data and numerical data The first two rows of the file have essential information in te
Django INSTALLED_APPS 的命名约定是如何工作的？

该网站上的教程创建了一个名为 polls 的应用程序它使用 django 1 9 所以在 INSTALLED APPS 中它是 polls apps PollsConfig 我正在观看一个教程他将应用程序命名为新闻通讯并且在 INST
如何输入可变的默认参数

Python 中处理可变默认参数的方法是将它们设置为无 https stackoverflow com a 366430 5049813 例如 def foo bar None bar if bar is None else bar ret
重写 PyGObject 中的虚拟方法

我正在尝试实施高宽几何管理 http developer gnome org gtk3 3 2 GtkWidget html geometry management在 GTK 和 Python 中用于我的自定义小部件我的小部件是来自的子类
如何通过 Selenium 内部的文本查找按钮（Python）？

我有以下三个按钮我不知道如何获取其中的文本例如异常值我试过browser find element by link text Outliers click 但出现无法找到元素错误我该怎么做 See find element by
AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题这是我在js中的实现附加 iv 与加密消息并使用 base64 进行编码
如何从Python枚举类中获取所有值？

我正在使用 Enum4 库创建一个枚举类如下所示 class Color Enum RED 1 BLUE 2 我要打印 1 2 作为某处的列表我怎样才能实现这个目标您可以执行以下操作 e value for e in Color

随机推荐

检测连接到 Wifi 的 Android 设备

我想制作一个连接到 Wifi 网络的 Android 应用程序假设网络 SSID ABC 假设它已连接到 Wifi ABC 连接到 ABC 后我希望我的应用程序显示连接到同一 wifi ABC 网络的所有 Android 设备的 ip
使用 Parallel.For 和 EPPlus 创建 Excel 工作表

我正在使用EPPlus http epplus codeplex com 库来创建包含许多工作表的 Excel 工作簿我想知道并行构建工作表是否安全如果库支持这种行为我在有限的文档中找不到提及 package new ExcelP
在 Visual Studio 2013 中的托管单元测试上使用混合模式调试

我在 Visual Studio 2013 测试框架中有一个 C 单元测试它练习 CLI 和本机代码我想在执行 C 单元测试时研究代码的本机部分但是运行测试 gt 调试 gt 所有测试会运行托管调试器因此不会命中本机代码中的断
不同内核的线程如何访问同一全局内存地址？

如果一个线程束中的许多线程想要读取全局内存中的某个地址那么该数据就会被广播对吗如果 warp 中的许多线程想要写入全局内存中的某个地址则存在序列化但无法预测顺序对吗但是第一个问题如果不同扭曲不同块中的许多线程想要写入全局
设置要在 PowerShell 导出 csv 中使用的日期格式？

我正在尝试将数据库表导出为文本 CSV ish 以供以后批量插入采用 ISO 格式 yyyy mm dd 的日期会少很多麻烦我相信我最终说服了 SQL Server Express 在导入时采用英式格式尽管无论我做什么灰色的服务器
GitHub Copilot 命令不起作用并显示错误

我安装 GitHub Copilot 只是为了测试但是这些命令都不起作用例如如果我尝试按 CTRL Enter 则会收到以下错误消息未找到命令 github copilot generate 我正在尝试使用 JS 文件我安装了最
c# HttpWebRequest 不向代理服务器发送默认凭据

我正在使用鱿鱼代理服务器在将请求传递到公共网络之前对客户端进行身份验证我还没设置HttpWebRequest Proxy对象因此我假设 Web 请求将采用默认窗口凭据并传递到代理服务器我也已将用户条目添加到鱿鱼代理但在发出请求时出现
使用 UCWA API 进行聊天机器人？

UCWA 能否用于 Skype For Business 本地服务器上的企业聊天机器人应用程序我找不到太多与此相关的文档使用 UCWA 实现聊天机器人绝对是可能的但您必须经历一些挑战这主要是为了让 UCWA 模拟的 App 始终在线
jQuery 手风琴展开所有 div

当页面加载或事件发生时是否可以展开所有组件谢谢只需使用这个 accordion ui accordion content show
Base 64 编码有何用途？

我时常听到人们谈论 base 64 编码它是干什么用的当您想要通过网络传输一些二进制数据时通常不会仅通过以原始格式在网络上传输位和字节来实现为什么因为有些媒体是为流文本而设计的你永远不知道某些协议可能会将你的二进制数据解释为控
Vue 组件和 AJAX 加载 HTML 内容

我有一个 Vue 组件它基本上是复杂 HTML 标记的简写初始加载时一切正常我正在使用 AJAX 将更多这些组件加载到页面上问题是该组件在使用 AJAX 加载后不想编译成 HTML 我只得到未渲染的 Vue 组件如下所示
在 asp.net webform 应用程序中选择启用 ajax 的 WCF 服务时有哪些优点和缺点？

我刚刚经历了我的第一次ajax enabled WCF service在样本中asp net webform应用程序如果我的网络应用程序中有 10 15 个页面其中涉及add edit view and delete操作是否有可能使它
UIPickerView 导致崩溃

每当我尝试在应用程序中选择 UIPickerView 时它就会崩溃我已经实现了所有委托方法但收到此错误 2013 01 15 13 57 56 176 tracker 16142 c07 Assertion failure in UI
我应该如何编辑查询以提高性能，同时保留现有结构？

我想提高查询的性能如下所示里面有一个索引isl ref and isl date字段但由于我使用 gt 运算符并且使用因此无法使用索引 1 1440 增加一分钟isl date场地我应该如何编辑查询以提高性能同时保留现有结构 S
如何在 Eclipse LogCat 查看器中过滤掉标记名

我有一个 Android 应用程序会发送垃圾邮件 LogCat 我想删除它的 logcat 条目以使输出更具可读性是否可以有一个过滤器来删除特定标记名称的 LogCat 条目或者一种有效的搜索模式是的创建一个过滤器其中按日志标
Terraform /AWS aws_servicecatalog_portfolio

我正在尝试通过 Terraform 部署服务目录当我尝试通过代码部署服务目录产品时 Service catalog product resource aws servicecatalog product linuxDesktop name
ExtJS 7.3 中没有可用的 ext-locale 包

由于某些奇怪的原因我收到此错误无法满足 ext locale 的要求错误以下内容版本无法满足 ERR 应用程序 ext locale 否匹配 ERR 无法解决包要求根据官方说明我将需求添加到了 app json classi
如何通过 printf 打印二进制数[重复]

这个问题在这里已经有答案了可能的重复有 printf 转换器可以以二进制格式打印吗 https stackoverflow com questions 111928 is there a printf converter to prin
使用 Robospice 和 Retrofit 将图像上传到 Google appengine

我正在尝试使用 Robospice 和 Retrofit 将图像上传到我的 Google appengine blobstore 我可以获取 GAE 提供的上传 URL 但是当我尝试将带有图像的 URL 作为 Multipart POST
在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁）

我正在使用通过 uvicorn 提供的 FastAPI 构建一个 API 该 API 具有使用 python 多处理库的端点端点为 CPU 密集型任务生成多个进程以并行执行它们以下是高级代码逻辑概述 import multiproces

在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁）

在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁） 的相关文章

随机推荐

热门标签

在 Uvicorn 中与多个工作线程一起使用多重处理（线程锁）的相关文章