Windows 上的异步子进程

2024-04-22

首先，我要解决的总体问题比我在这里展示的要复杂一些，所以请不要告诉我“使用阻塞线程”，因为如果没有公平、公平的重写，它就无法解决我的实际情况重构。

我有几个不需要我修改的应用程序，它们从标准输入获取数据，并在发挥其魔力后将其输出到标准输出。我的任务是链接其中几个程序。问题是，有时他们会窒息，因此我需要跟踪他们在 STDERR 上输出的进度。

pA = subprocess.Popen(CommandA,  shell=False, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
# ... some more processes make up the chain, but that is irrelevant to the problem
pB = subprocess.Popen(CommandB, shell=False, stdout=subprocess.PIPE, stderr=subprocess.PIPE, stdin=pA.stdout )

现在，直接通过 pA.stdout.readline() 和 pB.stdout.readline() 或普通的 read() 函数读取是一个阻塞问题。由于不同的应用程序以不同的速度和不同的格式输出，因此不能选择阻塞。（正如我上面所写的，除非万不得已，否则线程不是一个选择。）pA.communicate()是死锁安全的，但由于我需要实时信息，所以这也不是一个选择。

因此谷歌把我带到了这个异步子流程片段 http://code.activestate.com/recipes/440554-module-to-allow-asynchronous-subprocess-use-on-win/在活动状态上。

一开始一切都很好，直到我实施它。比较 cmd.exe 的输出pA.exe | pB.exe，忽略两个输出到同一窗口造成混乱的事实，我看到非常即时的更新。但是，我使用上面的代码片段和read_some()函数在那里声明，并且需要 10 秒以上才能通知单个管道的更新。但当它发生时，它会进行更新，例如将进度一路提升至 40%。

因此，我做了一些更多的研究，并看到许多有关 PeekNamedPipe、匿名句柄以及即使管道中有可用信息也返回 0 字节的主题。由于事实证明这个主题远远超出了我的专业知识，无法修复或编码，因此我来到 Stack Overflow 寻求指导。 :)

我的平台是 W7 64 位和 Python 2.6，应用程序是 32 位（以防万一），并且与 Unix 的兼容性不是问题。我什至可以处理一个完整的 ctypes 或 pywin32 解决方案，如果它是唯一的解决方案，它可以完全颠覆子进程，只要我可以异步地从每个 stderr 管道中读取数据，并立即执行性能并且没有死锁。 :)

必须使用线程有多糟糕？我遇到了很多同样的问题，最终决定使用线程来收集子进程的 stdout 和 stderr 上的所有数据，并将其放入线程安全队列中，主线程可以以阻塞方式读取该队列，而不必担心幕后发生的线程。

目前尚不清楚基于线程和阻塞的解决方案预计会出现什么问题。您是否担心必须使其余代码成为线程安全的？这不应该成为问题，因为 IO 线程不需要与任何其余代码或数据交互。如果您的内存要求非常严格，或者您的管道特别长，那么您可能会对生成如此多的线程感到不高兴。我对你的情况不太了解，所以我不能说这是否可能是一个问题，但在我看来，既然你已经产生了额外的进程，那么与它们交互的一些线程不应该是一个可怕的负担。在我的情况下，我还没有发现这些 IO 线程特别有问题。

我的线程函数看起来像这样：

def simple_io_thread(pipe, queue, tag, stop_event):
    """
    Read line-by-line from pipe, writing (tag, line) to the
    queue. Also checks for a stop_event to give up before
    the end of the stream.
    """
    while True:
        line = pipe.readline()

        while True:
            try:
                # Post to the queue with a large timeout in case the
                # queue is full.
                queue.put((tag, line), block=True, timeout=60)
                break
            except Queue.Full:
                if stop_event.isSet():
                    break
                continue
        if stop_event.isSet() or line=="":
            break
    pipe.close()

当我启动子进程时，我这样做：

outputqueue = Queue.Queue(50)
stop_event = threading.Event()
process = subprocess.Popen(
    command,
    cwd=workingdir,
    env=env,
    shell=useshell,
    stdout=subprocess.PIPE,
    stderr=subprocess.PIPE)
stderr_thread = threading.Thread(
    target=simple_io_thread,
    args=(process.stderr, outputqueue, "STDERR", stop_event)
)
stdout_thread = threading.Thread(
    target=simple_io_thread,
    args=(process.stdout, outputqueue, "STDOUT", stop_event)
)
stderr_thread.daemon = True
stdout_thread.daemon = True
stderr_thread.start()
stdout_thread.start()

然后，当我想读取时，我可以阻塞输出队列 - 从它读取的每个项目都包含一个字符串来标识它来自哪个管道，以及来自该管道的一行文本。很少有代码在单独的线程中运行，并且它仅通过线程安全队列与主线程通信（加上一个事件，以防我需要提前放弃）。也许这种方法很有用，可以让您通过线程和阻塞来解决问题，但不必重写大量代码？

（我的解决方案变得更加复杂，因为我有时希望尽早终止子进程，并希望确保线程全部完成。如果这不是问题，您可以摆脱所有 stop_event 内容，它会变得非常简洁。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Windows 上的异步子进程的相关文章

为什么 python 允许没有“pass”语句的空函数（带有文档字符串）主体？

class SomeThing object Represents something def method one self This is the first method will do something useful one da
用于在 Windows 中自动执行桌面活动的 Python 代码

我想使用 Python 在 Windows 环境中自动化桌面活动怎样才能做到呢一些例子也会有帮助我所说的桌面活动是指控制鼠标和键盘访问活动窗口属性双击桌面上的图标最小化和最大化窗口通过键盘向输入弹出窗口输入数据等操作看一下S
动态添加jinja模板

我有一个 jinja 模板它是一组 div 标签内的唯一内容 div include temppage html div 当我按下按钮时我想用其他内容替换标签之间的所有内容我希望用另一个 jinja 模板 include realpa
QTextEdit.find() 在 Python 中不起作用

演示问题的简单代码 usr bin env python import sys from PyQt4 QtCore import QObject SIGNAL from PyQt4 QtGui import QApplication QTe
PyQt：如何设置组合框项目可检查？

为了将 GUI 小部件数量保持在最低限度我需要找到一种方法来为用户提供下拉菜单项的选择这些菜单项可用于过滤掉 listWidget 项中显示的内容假设 listWidget 列出了 5 个不同类别的项目 Cat A Cat B Cat
如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items
使用 Python 读取 App Engine 上的文件？

是否可以在 GAE 上打开文件来读取其内容并获取最后修改的标签我收到 IOError Errno 13 文件无法访问我知道我无法删除或更新但我相信阅读应该是可能的有人遇到过类似的问题吗 os stat f r st mtim 您可能
python 中的子进程调用以使用 JAVA_OPTS 调用 java jar 文件

示例代码 import subprocess subprocess call java jar temp jar 如何在上面的命令中指定JAVA OPTS 当我使用上述命令时我收到 java lang OutOfMemoryError 无
使用 RGB 数据将输入数据剪切到 imshow 的有效范围（对于浮点数为 [0..1]，对于整数为 [0..255]）

我尝试将 MRI 切片转换为 PNG 格式后运行图形切割算法我不断遇到以下问题 Clipping input data to the valid range for imshow with RGB data 0 1 for floats
在 LINUX 上使用 Python 连接到 OLAP 多维数据集

我知道如何在 Windows 上使用 Python 连接到 MS OLAP 多维数据集嗯至少有一种方法通常我使用 win32py 包并调用 COM 对象进行连接 import win32com client connection wi
按最小值分组并用另一列中的值填充 NA

我有一个如下所示的示例数据框 df pd DataFrame data uid 1 1 1 2 2 3 pagename home blah blah home blah blah startpage NA NA NA home home
Python range() 和 zip() 对象类型

我了解功能如何range and zip 可以在 for 循环中使用然而我期望range 输出一个列表很像seq在 Unix shell 中如果我运行以下代码 a range 10 print a 输出是range 10 表明它不是一
无法编辑，但可以在 Django 管理中添加新的内联

这是我的模型 class Note note models TextField null False blank False editable True user models ForeignKey to User null True bl
如何配置应用程序中的所有记录器

Python 的日志记录模块允许模块或类定义自己的记录器不同的记录器可以有不同的处理程序其中一些可能选择记录到文件而另一些则选择记录到标准输出现在我的应用程序使用其中几个模块每个模块都有自己的记录器这些记录器具有各种处理程序
如何在 VS Code 宏中将焦点返回到编辑器，将 Python 文本发送到调试控制台？

我尝试按键绑定宏以将 python 文本发送到调试控制台并将焦点返回到 Visual Studio Code 中的编辑器这是我尝试过的安装了vscode python https marketplace visualstudio com
获取 pandas 中最后一次出现特定值之后的所有行

我的数据框看起来像 ID colA 1 B 1 D 2 B 2 D 2 C 我已返回每组中事件 B 最后一次出现后的所有行输出将是 ID colA 1 D 2 D 2 C 我试过 a df colA str contains B grou
将 celery 与 Flask 应用程序上下文一起使用会导致“弹出错误的应用程序上下文”。断言错误

我或多或少使用设置来使用您的 Flask 应用程序上下文来运行 Celery 任务 http flask pocoo org docs 0 10 patterns celery http flask pocoo org docs 0 10
将文本文件转换为 plink PED 和 MAP 格式

我有以下数据其中的一小部分名为 short2 pre snp tumor txt rs987435 C G 1 1 1 0 2 rs345783 C G 0 0 1 0 0 rs955894 G T 1 1 2 2 1 rs608879
Python：Scrapy返回元素后面的所有html，而不仅仅是元素的html

我遇到了 Scrapy 行为异常的问题几个月前我编写了一个简单的函数它返回给定 xpath 处的项目列表 def get html response path sel Selector text response page source
Python中矩阵元素的双重求和

基于下面的简化示例我想在我的代码中 from sympy import import numpy as np init printing x y symbols x y mat Matrix x 1 1 y X 1 2 3 Y 10 20

随机推荐

IIS 7 URL 重写

我已经为此工作了几个小时现在正试图让它发挥作用我有一个 CodeIgniter 网站曾经在 Apache 服务器上运行良好我使用 Apache URL Rewriter 作为 URL 来隐藏 index php 由于某种原因我无法
python 的日志记录模块在 cygwin 下报告不正确的时区

我正在 Windows 7 上的 cygwin 下运行使用日志记录模块的 python 脚本 date命令报告正确时间 date Tue Aug 14 2012 2 47 49 PM 然而 Python 脚本已经关闭了五个小时 2012 0
SQL 查询中的“NOT LIKE”

为什么这个简单的查询会返回 ORA 00936 缺少表达式正如您所知数据库是 Oracle SELECT FROM transactions WHERE id NOT LIKE 1 AND NOT LIKE 2 我觉得自己很傻但我做错
如何使用 MS SQL 2008 获取数据库中的表列表？

我想验证数据库中是否存在表如果不存在则创建它如何获取当前数据库中所有表的列表我可以使用这样的 SELECT 获取数据库列表 SELECT FROM sys databases 剩下的就是创建该表如果该表不存在我还尝试与数据库同时
+exposeBinding 不起作用

我试图在 NSWindowController 的子类中公开自定义绑定我在子类中添加了以下代码 void initialize self exposeBinding customBinding 然后在 IB 中我有一个子类的对象实例
如何暂停使用DownloadManager？

我想实现下载时可以由用户暂停停止如何使用 DownloadManager 实现此目的 You can 删除下载 http developer android com reference android app DownloadMana
如何从外部网站重新创建图像预览？

与 Facebook 的 UI 类似我尝试从外部链接网站生成预览图像这样当用户输入要链接的 url 时 UI 将默认扫描该网站以查找图像并抓取预览缩略图这项技术有具体的名称吗或者有人可以指出我学习这个的方向吗非常感谢其名为刮
如何调整外部 SWF 的大小以适合容器？

我想要完成的是调整外部 SWF 的大小使其适合在舞台上作为容器呈现的显示对象现在它显示在容器外部重要提示我不希望外部 SWF 占据整个舞台我在舞台上为它准备了一个特殊的地方那个容器 public function loaderC
Perl CGI 脚本根据运行返回不同的结果

我有一个 Perl CGI 脚本它明显随机地发出不同的 HTML 所有输入都没有改变例如我会跑wget两次并得到两个不同的结果 CGI 由开发数据库支持该数据库也不会改变我有一个调试语句通知我相同数量的元素从数据库返回到脚本中
将 csv 数据写入命名空间内的矩阵时，TCL 抛出无效命令名称

这是一个奇怪的问题我似乎无法弄清楚我正在使用 TCL 8 5 我正在尝试使用以下命令将数据从 CSV 文件读取到矩阵中csv read2matrix命令然而每次我这样做时它都会说我试图写入的矩阵是无效命令我正在做的事情的片段 p
嵌入式 JavaScript 中的特殊字符

我有一些嵌入在 html 文件中的 javascript 如下所示它有一条像这样的线 if os Mac br Safari br Chrome 一切顺利这意味着脚本可以工作但是验证者 http validator w3 org 正在
在 App Engine 标准 python 中使用 Google Stackdriver 日志时出错

我的堆栈谷歌应用程序引擎标准Python 2 7 Goal 要在 Google Stackdriver Logging 中创建命名日志 https console cloud google com logs viewer https co
如何将这些数据存储在cookies中？

假设我有一些文本框文本区域其中的值必须存储这些值必须在按键时存储以便当用户过早关闭页面时不会丢失数据这是我当前的代码使用cookie function createCookie name value days if days v
箭头呢？

阅读有关 Haskell 各种类别主题课程的各种教程我们发现诸如Monoid Functor Monad等等所有这些都有数十个实例但由于某种原因当我们到达Arrow 只有两个实例函数和 monad 在这两种情况下使用Arrow与
如何使用 Go 的 flag 包打印位置参数的用法？

鉴于这个简单的 Go 程序只需要一个命令行参数我该如何改进它以便flag Usage 给出有用的输出 package main import flag fmt os func main flag Parse if len flag Arg
Python中不可变对象的类型是什么（对于mypy）

我总是用mypy in my Python程式类型是什么来自typing 对于不可变对象那些可以用作字典键的对象回到上下文中我想编写一个从字典继承的类并且我有以下代码 class SliceableDict dict def g
Pthreads 与 OpenMP

我正在使用 Linux 用 C 创建一个多线程应用程序我不确定是否应该使用 POSIX 线程 API 还是 OpenMP API 使用两者有何优缺点 Edit 有人可以澄清这两个 API 是否创建内核级 or 用户级线程 Pthreads
获取特定时区的当前时间

我有一个具有不同时区的日期和时间格式的数据框我想将其与该时区的当前时间进行比较所以我想在下面的日期和时间列中添加 1 小时然后将其与该时区的当前时间进行比较就像第一个一样时区是 EDT 当前时间是 2017 07 18 10
Java 枚举和 Switch 语句 - 默认情况？

对于建议抛出异常的人抛出异常不会给我带来编译时错误它会给我带来运行时错误我知道我可以抛出异常我宁愿在编译期间死也不愿在运行时死首先我使用的是 eclipse 3 4 我有一个数据模型其模式属性是枚举 enum Mode on
Windows 上的异步子进程

首先我要解决的总体问题比我在这里展示的要复杂一些所以请不要告诉我使用阻塞线程因为如果没有公平公平的重写它就无法解决我的实际情况重构我有几个不需要我修改的应用程序它们从标准输入获取数据并在发挥其魔力后将其输出到标准输出我的

Windows 上的异步子进程

Windows 上的异步子进程 的相关文章

随机推荐

热门标签

Windows 上的异步子进程的相关文章