子进程+多重处理-按顺序执行多个命令

2024-06-09

我有一组命令行工具，我想在一系列文件上并行运行。我写了一个 python 函数来包装它们，看起来像这样：

def process_file(fn):
    print os.getpid()
    cmd1 = "echo "+fn
    p = subprocess.Popen(shlex.split(cmd1))

    # after cmd1 finishes
    other_python_function_to_do_something_to_file(fn)

    cmd2 = "echo "+fn
    p = subprocess.Popen(shlex.split(cmd2))
    print "finish"

if __name__=="__main__":
    import multiprocessing
    p = multiprocessing.Pool()
    for fn in files:
        RETURN = p.apply_async(process_file,args=(fn,),kwds={some_kwds})

虽然这有效，但它似乎并没有运行多个进程；看起来它只是串行运行（我尝试过使用Pool(5)具有相同的结果）。我缺少什么？是否致电Popen“封锁”？

编辑：澄清一点。我需要 cmd1，然后是一些 python 命令，然后是 cmd2，以便在每个文件上按顺序执行。

EDIT2：上面的输出具有以下模式：

pid
finish
pid
finish
pid
finish

而类似的调用，使用map代替apply（但没有任何通过的规定kwds）看起来更像

pid
pid
pid
finish
finish
finish

然而，地图调用有时（总是？）在明显成功后挂起

是否致电Popen“封锁”？

不，只是创建一个subprocess.Popen立即返回，为您提供一个可以等待或以其他方式使用的对象。如果你想阻止，很简单：

subprocess.check_call(shlex.split(cmd1))

同时，我不确定为什么你要把你的参数放在一个字符串中，然后尝试shlex他们回到一个列表。为什么不直接写清单呢？

cmd1 = ["echo", fn]
subprocess.check_call(cmd1)

虽然这有效，但它似乎并没有运行多个进程；看起来它只是串行运行

是什么让你这么想？鉴于每个进程只是尽快将两个进程启动到后台，因此很难判断它们是否并行运行。

如果您想验证是否从多个处理中获得工作，您可能需要添加一些打印或日志记录（并抛出类似的内容os.getpid()到消息中）。

同时，看起来您正试图完全复制以下效果multiprocessing.Pool.map_async脱离循环multiprocessing.Pool.apply_async，除了不是累积结果，而是将每个结果存储在名为的变量中RESULT然后在使用之前将其扔掉。为什么不直接使用map_async?

最后，你问是否multiprocessing是适合这项工作的工具。好吧，你显然需要一些异步的东西：check_call(args(file1))必须阻止other_python_function_to_do_something_to_file(file1)，但同时不阻塞check_call(args(file2)).

我可能会用threading，但实际上，这并没有多大区别。即使您所在的平台上进程启动成本很高，您也已经付出了这笔成本，因为重点是运行 N * M 组子进程，因此另外 8 个子进程池不会造成任何损害。而且，通过在线程之间共享数据而意外创建竞争，或者意外地创建看起来像是在进程之间共享数据但实际上没有共享数据的代码的风险很小，因为没有任何内容可以共享。所以，无论你更喜欢哪一个，就去吧。

另一种选择是编写一个事件循环。我实际上可能会开始自己解决这个问题，但我会后悔的，而且你不应该这样做......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

multiprocessing

子进程+多重处理-按顺序执行多个命令的相关文章

如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
如何移动我的图像？ python 3.10.4 pygame

我会移动我的图像图像是matiskinfinal png 我尝试将像素添加到 x 或其他我不知道它是什么的东西因为我真的是 python 的初学者 pygame但是是 x x 变化但图像没有移动 import os import py
如何使用 lxml 解析包含前缀但没有名称空间声明的 XML？

我有一堆使用前缀但没有相应名称空间声明的 XML 文件像这样的东西
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
如何从 Lua 调用 Python 函数？

我想从我的 lua 文件运行 python 脚本我怎样才能实现这个目标 Example Python代码 sum py file def sum from python a b return a b Lua code main lua f
python 脚本中 os.system 的 256 和 512 响应代码是什么

当我在 python 中使用 os system ping 服务器时我得到多个响应代码使用的命令 os system ping q c 30 s SERVERANME 0 在线 256 离线 512 512 是什么意思 Per the
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词

随机推荐

R：在因素对之间进行 t 检验

我有一个 R 数据框其中因子变量有 8 个级别有序我想在级别 1 和 2 3 和 4 5 和 6 以及 7 和 8 之间进行 t 检验虽然我可以对数据进行子集化以提取每对类别但我想知道是否有更简单的方法它想不通尝试了以下方法
在ubuntu中使用gcc生成特定频率的声音？

如何在 C C 中生成特定频率的声音我运行 Ubuntu 10 04 并使用 gcc 有一个void sound int frequency Windows 版 TurboC 上的功能 gcc 有等效的吗下面是利用 PortAudio
从 Chrome 应用程序在浏览器中打开选项卡

自从获得许可 tabs and chrome tabsChrome 应用程序中不提供 API 如何在浏览器中打开具有指定 URL 的选项卡尝试动态创建一个链接并调用它click method function openTab url va
Rails Bundle，gems 冲突，解决它的最佳方法

我在使用 Bundle 解决宝石冲突时遇到了麻烦无法激活 activemodel 3 0 8 actionpack 3 0 8 railties 3 0 8 的构建器 gt 2 1 2 运行时已激活的 builder 3 0 0 黄瓜
如何测试 Angular 2 ErrorHandler 实现？

我已经覆盖了 angular core ErrorHandler 并且我正在尝试测试它但是我收到了一个错误服务工作正常但测试在某处失败异常处理程序 service ts import Injectable ErrorHandler
查找所有n位相邻数字为1的n位二进制数[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 让我用一个例子来解释一下如果n 4
将组“Everyone”添加到目录及其所有子目录

我目前使用的是 Vista 32 位如何添加 Windows 安全组 Everyone 并完全控制目录及其所有子目录和所有文件有我可以使用的 powershell 脚本吗 Thanks 我已经扩展了 martona 的代码片段并且能够
Nativescript：如何以编程方式禁用/启用 ScrollView 滚动？

有没有办法以编程方式禁用启用 NativeScript 中的 ScrollView 滚动好的我找到了该怎么做在 iOS 上这实际上非常简单 var scrollView page getViewById YOUR VIEW ID s
从 mongoDB 获取数据并在 HTML 上显示

我无法理解如何从 MongoDB 数据库获取数据并将其显示在 HTML 上我已经设置了数据这是 server js 文件 const path require path const express require express con
是否可以以编程方式构造 std::initializer_list？

我正在包装以下形式的 C fn foo input std initializer list
流多播 - 读取一次流，但以不同的方式处理它，并使用最少的缓冲

为了可扩展性和节省资源最好避免将整个输入流读入内存而是尝试将其作为流处理一次读取小块当您想要对数据执行一件事例如从 Web 请求中读取数据并将其保存到文件中时这在 NET 中很容易实现简单的例子 input CopyTo o
如何将 int numpy 数组的列乘以浮点数字并保持 int 形式？

我有一个 numpy 数组 gt gt gt b array 2 2 6 4 10 6 我想将第一列乘以浮点数结果我需要 int 数字因为当我这样做时 gt gt gt b 0 2 1 It says TypeError Cannot
从图中删除节点或重置整个默认图

使用默认全局图时是否可以在添加节点后将其删除或者将默认图重置为空当我在 IPython 中交互地使用 TF 时我发现自己必须反复重新启动内核如果可能的话我希望能够更轻松地尝试图表更新 11 2 2016 tf reset de
Windows Azure Active Directory 备份/恢复 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一种备份恢复 Windows Azure Active Directory 以防止用户错误的方法我认识到 Azure 的强大
Uri.parse("文件://" + ???);访问特定文件夹

我的问题分为两部分如何获取以下代码来访问此位置存储模拟 0 电影特定文件夹 Code private Uri getUriFromMediaStore int position int dataIndex mMediaStoreCu
在 Visual Studio 中引用同一解决方案中的项目

我有一个包含两个项目的解决方案其中一个项目是一个带有 DLL 文件的库我希望能够在其他项目中引用该项目库以使用其类我的最终目标是做到这一点同时仍然可以访问库源代码我尝试过引用 dll 也尝试过引用 csproj 这两种情况都有效
如何从Azure配置文件获取所有配置设置？

我需要从 Azure cscfg 文件获取所有配置设置当前角色或所有角色都无关紧要我想这样做是因为我不想通过 RoleEnvironment GetConfigurationSettingValue key 方法一一获取所有值有什么办
服务器端MVC+客户端MVC

一个应用程序既是JS密集型的又具有复杂的业务逻辑庞大的数据流使用backboneJS来构造JavaScript代码并且还需要服务器端MVC 在本例中是Spring 与客户端 MVC 主干一起实现服务器端 MVC spring 是一
如何以角度形式创建传单地图

我的要求是以角度形式创建传单地图但我对这种形式很陌生我知道如何将地图与普通 html 结合使用如下所示地图组件 ts ngOnInit const map L map map setView 51 509865 0 118092 1
子进程+多重处理-按顺序执行多个命令

我有一组命令行工具我想在一系列文件上并行运行我写了一个 python 函数来包装它们看起来像这样 def process file fn print os getpid cmd1 echo fn p subprocess Popen

子进程+多重处理-按顺序执行多个命令

子进程+多重处理-按顺序执行多个命令 的相关文章

随机推荐

热门标签

子进程+多重处理-按顺序执行多个命令的相关文章