如何为多处理池中的单个进程分配Python请求会话？

2024-04-23

考虑以下代码示例：

import multiprocessing
import requests

session = requests.Session()
data_to_be_processed = [...]

def process(arg):
    # do stuff with arg and get url
    response = session.get(url)
    # process response and generate data...
    return data

with multiprocessing.Pool() as pool:
    results = pool.map(process, data_to_be_processed)

例如，Session被分配为全局变量，因此在创建进程后Pool它将被复制到每个子流程中。我不确定会话是否是线程安全的，也不知道会话中的池化是如何工作的，所以我想为池中的每个进程分配单独的会话对象.

我知道，我可以使用requests.get(url)代替session.get(url)，但我想使用 session 并且我也在考虑使用requests-html (https://html.python-requests.org/ https://html.python-requests.org/).

我对 python 的多处理不太熟悉，到目前为止我只使用了池，因为它对我来说是并行处理数据而没有关键部分的最佳解决方案，所以我对不同的解决方案持开放态度。

有没有一种方法可以干净、直接地做到这一点？

简短的回答：您可以使用全局命名空间在之间共享数据初始化器 and func:

import multiprocessing
import requests

session = None
data_to_be_processed = [...]

def init_process():
    global session
    session = requests.Session()

def process(arg):
    global session
    # do stuff with arg and get url
    response = session.get(url)
    # process response and generate data...
    return data

with multiprocessing.Pool(initializer=init_process) as pool:
    results = pool.map(process, data_to_be_processed)

长答案： Python 使用三种可能的方法之一启动方法 https://docs.python.org/3/library/multiprocessing.html#contexts-and-start-methods。它们都将父进程和子进程之间的内存对象分开。在我们的例子中，这意味着运行的进程的全局命名空间发生变化Pool()不会传播回父进程，也不会传播回兄弟进程。

对于对象销毁，我们可以依靠垃圾收集器，它会在子进程完成其工作后介入。缺少显式关闭方法多处理.Pool()使得它不可能与不可被 GC 破坏的对象一起使用（例如Pool()本身 - 请参阅警告here https://docs.python.org/3/library/multiprocessing.html#module-multiprocessing.pool）判断从请求文档 https://requests.readthedocs.io/en/master/user/advanced/#session-objects,使用起来完全没问题请求.Session没有明确的 close() 。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何为多处理池中的单个进程分配Python请求会话？的相关文章

将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
使用记事本打开文本文件作为python中的帮助文件？

我想为我的简单程序的用户提供打开帮助文件的机会以指导他们如何充分利用我的程序理想情况下我希望在 GUI 上有一个蓝色的小帮助链接可以随时单击该链接从而在本机文本编辑器例如记事本中打开 txt 文件有没有一种简单的方法可以做到
每个刻度标签都有不同的颜色

我正在尝试使用 matplotlib python 3 5 创建一个散点图其中 x 轴上的每个刻度都有不同的颜色这怎么可能例如假设 x 刻度为 Mo Tu We Th Fr Sa Su 现在我希望 Mo 是绿色的 Tu 是蓝色的等
用定点迭代求解该方程

我怎样才能解这个方程 x3 x 1 0 使用定点迭代有没有定点迭代我可以在网上找到代码尤其是Python 吗 Using scipy optimize fixed point http docs scipy org doc scipy
在 python 中查找价格动量的有效方法：对列的最后 n 个条目求平均值

我正在定义价格动量是给定股票过去动量的平均值n days 反过来动量是一种分类如果当天的收盘价高于前一天则每天标记为 1 如果当天的收盘价低于前一天则标记为 1 我的库存变化百分比如下 df close in percent np
VS Code Pylint 在缺失的函数/类文档字符串上用蓝色下划线突出显示整个函数

这种情况突然开始发生当出现缺少函数文档字符串警告时 python pylint 会用蓝色波浪线突出显示整个函数我怎样才能让它只突出显示函数定义或在定义行上制作一个小指示器在开发时突出显示整个文件是非常烦人的这是缺少类文档字符串的示例
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
参数太少错误，同时未使用参数占位符

我尝试使用 PYODBC 在 Access 数据库中执行 SQL 查询但出现以下错误 pyodbc Error 07002 07002 Microsoft ODBC Microsoft Access 驱动程序参数太少预期为 1 301
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
配置 Flask 以正确加载 Bootstrap js 和 css 文件

如何使用 Flask 中的 url for 指令来正确设置以便使用 Bootstrap 和 RGraph 的 html 页面可以正常工作假设我的 html 页面看起来像这样部分片段
python matplotlib 使用按钮事件添加和删除图形中的文本

我试图在调用button press event 时将文本添加到鼠标指针位置的图形中并在调用button release event 时将其删除我已成功添加文本但无法将其删除这是我使用的代码的一部分 def onclick even
Buildozer Numpy RuntimeError：工具链损坏：无法链接简单的 C 程序

用 Python 编写我的第一个 Android 应用程序并使用 Buildozer 对其进行打包因为稍后在项目中需要使用numpy 所以我尝试打包以下测试代码 import numpy import kivy kivy require
Django - 该进程无法访问该文件，因为该文件正在被另一个进程使用

我正在尝试在 Windows 10 上运行 Django 我是 Django 的新手我正在使用 Compressor Toolkit 我的问题是我可以运行 manage py 但本地主机说 base html 第 9 行出错该进程无法访
有效地写入 pandas 中的多个相邻列

使用 numpy ndarray 可以一次写入多个列而无需先进行复制只要它们相邻如果我想写入数组的前三列我会写 a 0 0 3 1 2 3 this is very fast a is a numpy ndarray 我希望在 pa
更新或插入 MySQL Python

如果记录已存在我需要更新一行如果不存在我需要创建一个新记录我理解 ON DUPLICATE KEY 将使用 MYSQLdb 完成此操作但是我无法使其正常工作我的代码如下 cursor database cursor cursor
Django admin.py 未知命令：'collectstatic'

我已经从 django 1 2 7 升级到 django 1 5 1我正在使用 python 2 6 6当我尝试跑步时python manage py collectstatic i get 未知命令 collectstatic 从我的设置
django 南迁移，不设置默认值

我使用 South 来迁移我的 Django 模型然而南方有一个令人讨厌的错误它不会在 Postgres 数据库中设置默认值例子 created at models DateTimeField default datetime no
了解字典的深度

假设我们有这个字典 d a 1 b c 了解嵌套的最直接方法是什么depth of it 您需要创建一个递归函数 gt gt gt def depth d if isinstance d dict return 1 max map dept
使用条件在 pandas 数据框中生成新列

我有一个 pandas 数据框如下所示 portion used 0 1 1 0 1 2 0 3 2 3 0 0 3 4 0 8 我想根据以下内容创建一个新专栏used列以便df看起来像这样 portion used alert 0 1
捕获 SQLAlchemy 异常

我可以使用什么捕获 SQLAlechmy 异常的上层异常 gt gt gt from sqlalchemy import exc gt gt gt dir exc ArgumentError CircularDependencyError

随机推荐

SQL Server 使用参数导致结果缓慢

我有一个选择一些数据的查询我在其中传递了一些参数 DECLARE FromAccDocNo INT 1 ToAccDocNo INT 999999999 FromDate CHAR 10 1900 01 01 ToDate CHAR 10
如何设置像“YYYYMM”这样的 Postgresql 默认值日期戳？

作为标题如何将表的列设置为当前年份和月份的默认值格式为 YYYYMM 例如今天的 200905 请记住日期的格式与存储无关如果您认为日期很重要stored在这种格式中您需要定义自定义数据类型或将其存储为字符串然后你可以使用组合e
将 csv 列放入数组中

我有一个带有列标题的 csv 描述库存 mfgid 以及我不需要的其他一些标题我需要从数组中的列标题 stock 和 mfgid 获取数据我正在使用 fgetcsv 但它将整行放入数组中的独占键中在 stackoverflow 上找
如何将 Ruby 编译为 Javascript？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在研究一段逻辑我想在服务器和浏览器中表达它类似于验证表单其中基于已输入的内容元素之间必须存在某些逻辑关系所以如果我可以编写
统一使用单例的最佳方法[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我想知道哪种是使用单例实例的正确方法当我创建一个名为 Manager 的单例类并且它包含一个名为 value 的 int 变量并且我有另一个名
通过代理服务器访问HTTPS站点

我正在添加代码以使用代理服务器访问互联网从正常 HTTP 位置请求文件时该代码可以正常工作但在访问安全位置 HTTPS 时则不起作用这是运行良好的代码 URL http UnSecureSite net file xml Dim w
Blob 转换：获取 xlsx 文件

我正在尝试发送一封电子邮件其中包含xlsx文件已附加但我遇到的问题是当我下载该文件时该文件以 PDF 格式打开这是我的代码 function sendMail var sheet SpreadsheetApp getActiveS
React Native 中无法读取 null 错误的属性“绑定”

从反应本机运行应用程序时我在模拟器设备上收到以下错误消息 ERROR The development server returned response error code 500 URL http 10 0 2 2 8081 inde
语义版本控制中 -rc 的含义是什么？

我了解了 MAJOR MINOR PATCH 的逻辑并且直观地了解了 semver 编号末尾的 alpha 和 beta 的含义但 rc 并没有给我敲响任何警钟在那里找不到满意的答案 gt https semver org https
基于带有图标的列的数据表搜索[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在制作一个带有状态列的数据表我正在考虑提供搜索图标的可能性因此如果有人在搜索框中键入打开它应该显示带有打开图标的所有
在 Windows 上安装 Pinax

我可以安装吗Pinax http pinaxproject com 在 Windows 环境下有简单的方法吗您推荐哪种环境我安装了 pinax 0 7rc1 并在 Windows 7 上运行没有任何问题请观看此视频了解如何执行此
更改文本字体大小以适应浏览器语言翻译时的 div 容器，而不是在视口更改上[重复]

这个问题在这里已经有答案了 NOTE 这与响应视口更改的字体更改不同 IE 字体大小 3 2vw 纯 CSS 使字体大小根据动态字符数量进行响应 https stackoverflow com questions 14431411 pure
Pandas：删除重复索引的所有记录

我有一个数据集其中可能包含重复的标识符记录appkey 理想情况下重复的记录不应该存在因此我认为它们是数据收集错误我需要删除一个的所有实例appkey这种情况发生不止一次 The drop duplicates方法在这种情况下没有用
在 Jetty 中运行的 Grails 在没有布局模板的情况下呈现 404 错误页面

我有一个 Grails 2 0 1 应用程序我设置了以下 UrlMapping controller home 500 view error serverError 404 view error notFound 这是我的 notFoun
如何在AWS中获取EC2实例的arn

如何获取AWS中ec2实例的arn 我正在尝试使用资源标签 api 将标签添加到 EC2 实例资源标签 api 需要所有资源的 arn 我如何获取它您可以自己构建它 arn aws ec2
如何将 UIImage 旋转 90 度？

我有一个UIImage那是UIImageOrientationUp 纵向我想逆时针旋转 90 度横向我不想使用CGAffineTransform 我想要的像素UIImage实际转移位置我正在使用一段代码如下所示最初旨在调整UII
如何停止优化器丢弃未使用的变量？

我想调试我的代码但无法访问进程中的内部层因为这会干扰与硬件的通信在监视列表会干扰基本读取访问的情况下执行易失性操作因此我正在测试接口的返回值但 IAR 编译器甚至会优化未使用的易失性变量和这样的声明 i object foo
Openlayers 3 中的拖放功能

OpenLayers 2 OpenLayers Control DragFeature 功能的等效项是什么我需要向地图添加一个可以用鼠标移动的图标当掉落时我需要捕捉事件在 OpenLayers 2 中描述的功能是 new OpenL
Tableau - 计算日期小于另一个数据源的值的平均值

我正在尝试计算 Tableau 中列的平均值但问题是我正在尝试使用来自另一个数据源的单个日期值基于筛选器来仅计算考试日期注意参数在这里对我不起作用因为新的日期值不断添加到集合中我尝试了许多不同的方法但最简单的方法是尝试使用计
如何为多处理池中的单个进程分配Python请求会话？

考虑以下代码示例 import multiprocessing import requests session requests Session data to be processed def process arg do stuff w

如何为多处理池中的单个进程分配Python请求会话？

如何为多处理池中的单个进程分配Python请求会话？ 的相关文章

随机推荐

热门标签

如何为多处理池中的单个进程分配Python请求会话？的相关文章