shell执行神器，赶紧来围观（python，附源码)

2023-11-09

前言

我们在python代码里时常会用shell调起其他进程执行
有时调起进程的不止一个，非常多，但又不希望他们一个一个跑，或全部一起跑，就需要用到线程池
但是有些进程之间有依赖关系，比如进程A必须完成后进程B才可以执行，还需要额外的逻辑保证顺序执行
某些场景下，需要调起的不仅有外部进程，还有自己写的某一段函数
为了发现执行时间过长的的任务，我们需要设置任务超时时间
需要调起的任务这么多，难免有些任务出错，为防止任务大面积报错，我们需要设置多少个任务出错后停止执行
任务出错一次可能是运气不好，我们需要设置重试次数，重试时间间隔
当一次调起中有任务失败时，可以清楚的看到日志，然后方便的重跑没执行成功的任务

思路

提到相互依赖的任务，一定会想到dag(有向无环图)
但是dag的点边关系配置复杂，每次新增节点就得为节点添加一条或多条线，这事在图上操作比较直观，但是在代码里非常捉急了
因此咱们重新设计dag表达方式，如下：
- 先用list定义一个3个任务的任务集，[1,2,3]
- 定义这个任务集为有序任务集：[True,1,2,3],即执行顺序1->2->3，当然，无序就是False，他们可以并行执行
- 多个任务集就形成嵌套，我们规定：嵌套中，相邻层的任务集[顺序性]相反，且这个True,False只能写在最外层，仅写一次。接下来，举几个例子你就明白了
  - 先执行[True,1,2]，再执行[False,3,4,5]
    - 写法：[True,1,2,[3,4,5]]
  - [True,1,2]和[True,3,4]可以同时执行
    - 写法：[False,[1,2],[3,4]]

使用

1.示例代码


from multiple_cmd import multiple_cmd

cmd_list=[True,['echo 1','echo 2'],['error',['echo 4','echo 5']],'echo 6']

multiple_cmd(max_exec=6,max_error=3,retry_times=1,retry_wait_second=1,time_out_second=9999,cmds=cmd_list).exec_task()

2.参数：

max_exec=1: 最大并行的线程数
time_out_second=999999: 超时错误
max_error=1: 出错多少次时停止执行任务(值大等于>=1),正在执行的线程继续执行完,没执行的取消
retry_times=0: 出错重试次数
retry_wait_second=1: 重试时间间隔
cmds=None: 任务列表,支持shell与函数,list[str|function],例:[True,‘cmd1’,[‘cmd2’,‘cmd3’],‘cmd4’],True有序,False无序,list的相邻层有序无序交替

3.等效dag：
(img-OpaaJi4U-1617091445575)(../../asset/命令行批处理.jpg)]
4.执行结果
在这里插入图片描述
5.注意：执行shell或函数的返回值为0则成功，非0失败,执行函数时，函数体内不能使用sys.exit(status)，推荐用返回值传递作业执行状态

进阶（函数任务）

1.示例代码


from utils.multiple_cmd import multiple_cmd

def func(a):
    try:
        if a!=3:
            print(a)
        else:
            # 错误的退出方式，应该用 return 1
            # sys.exit(1)
            return 1
    except Exception as e:
        return 1
    return 0
cmd_list=[False] 
cmd_list.append([(func,{'a':1}),(func,{'a':2})])
cmd_list.append([(func,{'a':3}),(func,{'a':4})])
multiple_cmd(max_exec=1,max_error=0,retry_times=1,retry_wait_second=1,cmds=cmd_list).exec_task()

2.结果
在这里插入图片描述
3.注意：函数是需要自己代码控制日志打印的

源码


#!/usr/bin/env python3
# -*- coding: utf-8 -*-

from concurrent.futures import ThreadPoolExecutor, wait
# 定义临时目录，用来放执行日志，按需改
import tmp_file_path
# 定义自己的日志打印方式，按需改
import writeLog
import time
import threading
import subprocess


class tree_node(object):
    '''任务树节点
    cmd_exec:执行任务
    tmp_file_name:日志文件名
    cmd:原始命令
    is_finish:任务是否完成
    '''

    def __init__(self, cmd_exec, tmp_file_name: str, cmd: str, is_finish=True):
        self.cmd_exec = cmd_exec
        self.tmp_file_name = tmp_file_name
        self.cmd = cmd
        self.is_finish = is_finish

        # 父节点集合
        self.parent_nodes = []

    def parent_is_finish(self):
        '''父节点是否全部完成
        '''
        status = 1
        for node in self.parent_nodes:
            status &= node.is_finish
        return status


class multiple_cmd(object):
    '''
    '''

    def __init__(self, max_exec=1, time_out_second=999999, max_error=1, retry_times=0, retry_wait_second=1, cmds=None):
        '''多线程执行工具(注意：执行shell或函数的返回值为0则成功，非0失败,执行函数时，函数体内不能使用sys.exit(status)，推荐用返回值传递作业执行状态)
        max_exec=1: 最大并行的线程数\n
        time_out_second=999999: 超时错误\n
        max_error=1: 出错多少次时停止执行任务(值大等于>=1),正在执行的线程继续执行完,没执行的取消\n
        retry_times=0: 出错重试次数\n
        retry_wait_second=1: 重试时间间隔\n
        cmds=None: 任务列表,支持shell与函数,list[str|function],例:[True,'cmd1',['cmd2','cmd3'],'cmd4'],True有序,False无序,list的相邻层有序无序交替
        '''

        self.__max_error = max(max_error,1)
        self.__time_out_second = time_out_second
        self.__retry_times = retry_times
        self.__retry_wait_second = retry_wait_second
        # 锁
        self.__lock = threading.Lock()
        # 线程池
        self.__executor = ThreadPoolExecutor(max_workers=max_exec)

        # 当前执行的任务数
        self.__exec_num = 0

        # 第一层标志位:是否有序
        self.__cmds = cmds
        self.__is_order = self.__cmds[0]
        self.__cmds.remove(self.__is_order)
        # 任务数
        self.__tasks_num = 0
        # 根节点
        self.__root_node = tree_node('root', 'root', 'root')
        # 任务列表
        self.__all_task = []
        # handler列表
        self.__handler_list = []
        # 是否取消任务
        self.__is_cancel = False
        # 取消的任务
        self.__cancel_list = []
        # 成功的任务
        self.__success_list = []
        # 失败的任务
        self.__fail_list = []

    def cmd_parser_task(self, cmds: list, order: bool, root_nodes: list):
        '''递归任务列表，生成表达依赖关系的n阶树\n
        cmds:任务列表\n
        order:当前层执行顺序\n
        root_nodes:父节点
        '''
        tmp_node = root_nodes
        parent_nodes = []
        for i in range(len(cmds)):
            if isinstance(cmds[i], str) or isinstance(cmds[i], tuple):
                cmds[i] = self.parse_cmd_list(cmds[i])
                cmds[i].parent_nodes = tmp_node
                self.__all_task.append(cmds[i])
                tmp_node = [cmds[i]] if order else tmp_node
                parent_nodes.extend([cmds[i]])
            elif isinstance(cmds[i], list) and len(cmds[i]) > 0:
                node = self.cmd_parser_task(cmds[i], 1-order, tmp_node)
                tmp_node = node if order else tmp_node
                parent_nodes.extend(node)
            else:
                raise RuntimeError('命令参数含有非str,function,list的类型')
        return parent_nodes[len(parent_nodes)-1:] if order else parent_nodes

    def task_parser_cmd(self, cmds: list):
        '''筛选未执行完成的命令，用以重跑\n
        cmds:命令列表
        '''
        remove_list = [[], []]
        for i in range(len(cmds)):
            if isinstance(cmds[i], tree_node):
                if cmds[i].is_finish:
                    remove_list[0].append(cmds[i])
                else:
                    cmds[i] = cmds[i].cmd
            elif isinstance(cmds[i], list) and len(cmds[i]) > 0:
                self.task_parser_cmd(cmds[i])
                if len(cmds[i]) == 0:
                    remove_list[1].append(cmds[i])
        # 先清除已完成任务，然后清除空列表
        for remove_type in remove_list:
            for remove_item in remove_type:
                cmds.remove(remove_item)

    def cmd_generator(self):
        '''根据命令的顺序和完成状态返回可执行命令
        '''
        result = []
        all_task = self.__all_task.copy()
        for task in all_task:
            if task.parent_is_finish():
                result.append(task)
                self.__all_task.remove(task)
        return result

    def run(self, node: tree_node, retry_times: int, retry_wait_second: int, index: int):
        '''线程函数\n
        node:命令基础信息\n
        retry_times:出错重试次数\n
        retry_wait_second:重试时间间隔\n
        index:任务序号
        '''
        if self.__retry_times == retry_times:
            writeLog(f'任务{index}开始执行,日志:{node.tmp_file_name},命令:{node.cmd}')
        status = self.run_task(node.cmd_exec)
        # 定义状态码
        status_info = {
            '0': '正常',
            '-1': '超时',
            '1': '异常'
        }
        # 任务重试
        while status != 0:
            if retry_times > 0:
                writeLog(f'任务{index}{status_info[str(status)]}')
                time.sleep(retry_wait_second)
                writeLog(f'任务{index}第{self.__retry_times-retry_times+1}次重试')
                status = self.run_task(node.cmd_exec)
                retry_times -= 1
            else:
                break
        self.__lock.acquire()
        try:
            if status != 0:
                self.__exec_num += 1
                writeLog(
                    f'任务{index}执行失败,进度:{self.__exec_num}/{self.__tasks_num}')
                self.__fail_list.append([node.tmp_file_name, node.cmd])
                # 达到最大错误数，取消未执行的任务
                self.__max_error -= 1
                if self.__max_error == 0:
                    for task in self.__handler_list:
                        if task[2].cancel():
                            self.__cancel_list.append(task)
                    self.__is_cancel = True
                    for task in self.__all_task:
                        self.__cancel_list.append(task)
                    self.__all_task.clear()
                    writeLog(f'达到最大错误次数', 'error')
                    self.__exec_num += len(self.__cancel_list)
            else:
                self.__exec_num += 1
                writeLog(
                    f'任务{index}执行成功,进度:{self.__exec_num}/{self.__tasks_num}')
                self.__success_list.append([node.tmp_file_name, node.cmd])
                node.is_finish = True
        finally:
            self.__lock.release()

    def exec_task(self):
        '''执行任务,输出结果
        '''
        # 获取任务执行句柄，生成任务编号
        handlers, index = [], 1
        # 生成任务列表
        self.cmd_parser_task(self.__cmds, self.__is_order, [self.__root_node])
        self.__tasks_num = len(self.__all_task)
        # 每一个任务执行完或取消时，检查有无新的可执行任务，放入线程池
        while not self.__is_cancel and len(self.__all_task) > 0:
            self.__lock.acquire()
            try:
                tasks = self.cmd_generator()
                # 如果当前没有正在执行的任务，却无法调启任务，死锁，退出
                if self.__max_error > 0 and len(self.__all_task) != 0 and len(tasks) == 0 and len(self.__success_list)+len(self.__fail_list) == len(self.__handler_list):
                    self.__cancel_list.extend(self.__all_task)
                    self.__all_task.clear()
                    writeLog('依赖关系死锁', 'error')
                    break
            finally:
                self.__lock.release()
            for task in tasks:
                task_handler = self.__executor.submit(
                    self.run, task, self.__retry_times, self.__retry_wait_second, index)
                index += 1
                self.__handler_list.append(
                    [task.tmp_file_name, task.cmd, task_handler])
                handlers.append(task_handler)
            wait(handlers, return_when='FIRST_COMPLETED')
        # 等待所有任务执行完成
        wait(handlers)
        return self.print_res()

    def print_res(self):
        '''打印结果
        '''
        writeLog('任务执行完成')
        writeLog(f'成功{len(self.__success_list)}个')
        writeLog(f'失败{len(self.__fail_list)}个')
        writeLog(f'取消{len(self.__cancel_list)}个')
        writeLog(f'失败日志文件:{str(self.__fail_list)}')
        writeLog(f'成功日志文件:{str(self.__success_list)}')

        # 生成重跑的命令
        self.task_parser_cmd(self.__cmds)
        # 加入执行顺序标志位
        self.__cmds = [self.__is_order]+self.__cmds
        writeLog(f'需要重跑的命令:{str(self.__cmds)}')
        return len(self.__fail_list)

    def parse_cmd_list(self, cmd):
        '''生成列表，执行命令，日志文件，原始命令，是否完成\n
        cmd:shell或函数
        '''
        # 获取当前时间戳拼接日志文件名
        time_st = str(time.time()).replace('.', '')
        tmp_file_name = tmp_file_path+time_st+'.log'
        cmd_exec = f'{cmd} 1>{tmp_file_name} 2>&1'
        is_finish = False
        result = None
        if isinstance(cmd, tuple):
            result = tree_node(
                cmd, '无', f'({cmd[0].__name__},{str(cmd[1])})', is_finish)
        else:
            result = tree_node(cmd_exec, tmp_file_name, cmd, is_finish)
        return result

    def run_task(self, cmd_exec):
        '''执行task
        cmd_exec:待执行的task
        '''
        code = 0

        if isinstance(cmd_exec, tuple):
            code = cmd_exec[0](**cmd_exec[1])
        else:
            try:
                code = subprocess.call(
                    cmd_exec, timeout=self.__time_out_second, shell=True)
                code = 1 if code != 0 else 0
            except subprocess.TimeoutExpired:
                code = -1
            except subprocess.CalledProcessError:
                code = 1
        return code

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

DAG

调度

shell执行神器，赶紧来围观（python，附源码) 的相关文章

如何在GPU支持下运行python代码

我创建了一个 Flask 服务用于接受以相机 URL 作为参数的请求用于在相机框架中查找对象桌子椅子等我已经在 Flask 中编写了用于接受 POST 请求的代码 app route rest detectObjects meth
打乱列表并返回副本

我想对数组进行洗牌但我找到的只是类似的方法random shuffle x from 在 Python 中随机化字符串列表的最佳方法 https stackoverflow com questions 1022141 best way t
使用 scipy.signal.spectrogram 在 pyqtgraph 中绘制 wavfile 的频谱

我有一个用于音乐和语音分析的 PyQt 加 pyqtgraph 程序我想绘制 wav 文件的频谱使用 scipy python 包计算我可以在 matplotlib 中完成但由于 matplotlib 的性能我需要切换到 pyqt
如何并行安装/编译 pip 要求（使 -j 等效）

我的 pip 要求中有很多软件包需要安装我想并行处理它们我知道例如如果我想要n并行作业来自make我必须写make j n 是否有满足 pip 要求的等效命令 Thanks 有时 pip 使用 make 来构建依赖项如果在开始之前
分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
Django 视图集没有属性“get_extra_actions”

我第一次使用 Django 我正在尝试构建一个 API 我正在遵循一些教程和示例它工作正常但在安装所有要求和项目后我现在正在 Raspberry Pi 中运行该项目失败并出现以下错误 Performing system checks
通过 beautiful soup python 找到所有字体大小大于最常见字体的跨度样式

我了解如何从特定的位置获取文本div or span这个问题的风格如何找到最常见的跨度样式 https stackoverflow com questions 40762692 is there a way to find the mos
[matplotlib]：理解“set_ydata”方法

我试图了解如何使用 set ydata 方法我在 matplotlib 网页上找到了很多示例但我只找到了 set ydata 被淹没在大型且难以理解的代码中的代码我想要一个简短且易于理解的代码来帮助我理解 set ydata 的工
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
在 Windows 上使用 pycrypto 时如何修复“ImportError：无法从 Crypto.Cipher 导入名称 _AES”？

我在 Crypto 的 Cipher 模块中有 AES Python27 Lib Crypto Cipher AES 当我尝试做的时候 from Crypto Cipher import AES 我收到以下错误 Traceback most
谷歌colab录音，如何实现更精确的方式告诉用户开始对着麦克风说话

我正在尝试创建一个为机器学习项目录制音频的程序我想使用 google colab 这样人们就不必在他们的系统上安装或运行任何东西我在网上找到了这个录制和播放音频的示例单元格 1 包含用于录制音频的 js 代码和用于将其转换为字节对象的
使用 Django 添加额外 \\ 字符的 JSON 编码

我正在尝试创建一个函数将包含消息和 Django 模型实例的字典转换为 JSON 然后我可以将其传回客户端例如我在 models py 中定义了模型 Test from django db import models class Te
使用 python 将多个 JSON 文件插入 MongoDB

JSON文件如下a json b json z json 26个json文件每个文件的 json 格式如下 a cappella word a cappella wordset id 5feb6f679a meanings id 4920
如果出现重复，则主键取正值

我有一个数据框df Key1 Key2 Value K11 K21 V1 K11 K21 V1 K13 K23 V2 K13 K23 V2 现在例如对于相同的键 K11 K21 组合我们有 2 个值一负一正如何从此 df 中仅获取正
仅将唯一行插入 SQLite (python)

我在用着cursor executemany将 CSV 文件中的批量行插入到 SQLite 表中根据主键字段其中一些行预计会重复当我执行该命令时可以预见的是我会收到完整性错误并且不会插入任何内容如何有选择地仅插入非重复行而无
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
如何在我的 heroku 应用程序上安装软件包？

我有一个使用 Shortuuid 的应用程序 https pypi python org pypi shortuuid 0 1 https pypi python org pypi shortuuid 0 1 当我使用 runapp py
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决
与仅调用依赖函数/类相比，在 FastAPI 中使用 Depends 有哪些优点？

FastAPI 提供了way https fastapi tiangolo com tutorial dependencies 通过其自己的依赖关系解析机制来管理依赖关系例如数据库连接它类似于一个pytest夹具系统简而言之您在函数
pyodbc 无法正确处理 unicode 数据

我确实使用 pyodbc 成功连接了 MySQL 数据库并且它可以很好地处理 ascii 编码的数据但是当我打印使用 unicode utf8 编码的数据时它引发了错误 UnicodeEncodeError ascii codec c

随机推荐

【Wechat】微信小程序注册以及认证流程

小程序注册流程 1 注册方法在微信公众平台官网首页 mp weixin qq com 点击右上角的立即注册按钮 2 选择注册的帐号类型选择小程序点击查看类型区别可查看不同类型帐号的区别和优势 3 填写邮箱和密码请填写未注册
Dev-C++的安装方法

1 下载安装包下载地址 https bloodshed dev c en softonic com 打开网址后单击 Free Download 单击新的界面中的 Free Download 下载好后单击 Relaunch download
java 变量名_java获取类中的变量名（利用反射机制）

要获取的类 package com jzxk server entities player public class Hero public int Id public String loginId public String heroNa
一个人的命运决定于晚上8点到10点之间

经典语录1 哈佛有一个著名的理论人的差别在于业余时间而一个人的命运决定于晚上8点到10点之间每晚抽出2个小时的时间用来阅读进修思考或参加有意的演讲讨论你会发现你的人生正在发生改变坚持数年之后成功会向你招手不要每天抱着Q
KOA框架编程24 在线聊天室(非常有价值的文章)

目录 1 前言 2 功能介绍 3 前端代码 3 1 代码结构 3 2 源码下载 3 3 难点分析
STM32 基础系列教程 31 – DAC

前言学习stm32 DAC数模转换接口使用学会用STM32 的DAC接口通过DAC接口将数字信号转变成模拟信号输出或查看内部变量值的变化波形学习DAC波形发生器的使用示例详解基于硬件平台 NUCLEO F302R8 NUCLE
如何用vue-cli2.9创建一个vue项目并运行的详细步骤

以下是使用vue cli2 9创建一个vue项目并运行的详细步骤使用yarn作为包管理器 1 安装yarn 如果你还没有安装yarn 可以从官网下载并安装 https classic yarnpkg com en docs install
经典的生产者和消费者模型问题

典型的生产者消费者问题可以使用 Java 中的 java util concurrent 包提供的 BlockingQueue 来实现 BlockingQueue 是一个线程安全的队列它可以处理这种生产者消费者的场景以下是一个示例
QT - 10进制转2进制，2进制需要按16位显示

可以使用 QString number 函数将十进制数字转换为二进制字符串并在转换之后使用 QString leftJustified 函数居左对齐字符串如下所示 int number 42 QString binaryString Q
计算机中找不到msvcp140.dll无法继续执行代码,解决方法

DLL是Dynamic Link Library的缩写意为动态链接库 dll文件是电脑系统及软件运行的重要文件电脑如果丢失dll文件那么很多软件跟游戏都是无法运行的 msvcp140 dll丢失这个问题就有很多小伙伴遇到小编今天就分
Python 笔记 — 面向对象基础

目录一面向过程和面向对象 1 面向过程 Procedural Programming 2 面向对象 Object Oriented Programming OOP 3 区别与对比二类和对象 1 类 Class 1 1 定义 1 2
北漂9年了，37岁的我跳槽进了国企，开启了一段新的人生旅程

背景上一次的博客是2021 02 01发表的年终总结距离现在也有半年的时间没有更新博客了这段时间只写过一篇文章关于孩子教育的几点分享确实有些尴尬这是因为年初的时候我跳槽了入职了一家新公司是一家国企而且是国企中的央企是教育
Python 遗传算法求解Stackelberg均衡问题（带概率约束）

目录引言遗传算法关键词解释 MCMC Stackelberg 算法思路求解某一次博弈过程中的遗传算法逻辑各文件模块间调用关系求解结果在50轮博弈中下层的决策变化在50轮博弈中上层的决策变化放在三维空间中 z轴为各自
Windows安装Pytorch3d

Windows安装Pytorch3d 1 前提安装Visual Studio 2019 我记得必须是2017 2019之间的版本我一开始用的是2022的版本就安装不了网址 pytorch和pytorch3d cuda和NVIDIA C
Python计算机视觉编程第六章——图像聚类(K-means聚类，DBSCAN聚类，层次聚类，谱聚类，PCA主成分分析)

Python计算机视觉编程图像聚类一 K means 聚类 1 1 SciPy 聚类包 1 2 图像聚类 1 1 在主成分上可视化图像 1 1 像素聚类二层次聚类三谱聚类图像聚类聚类概念无监督学习没有标签对于监督学习问
利用Docker快速部署hadoop、hive和spark

文章目录一配置文件yml 1 docker compose yml 二执行脚本 1 启动脚本run sh 2 关闭脚本stop sh 一配置文件yml 1 docker compose yml version 3 4 service
maven引用spire相关jar
lua安装不成功

usr local lib libreadline so 6 undefined symbol PC A by Wooce cd usr local lib mkdir temp mv libreadline temp ldconfig 再
mysql load data infile 报错 1290 处理方法

mysql load data infile 命令导入数据报错 16 06 13 load data infile var lib mysql test employee csv into table emp fields terminat
shell执行神器，赶紧来围观（python，附源码)

前言我们在python代码里时常会用shell调起其他进程执行有时调起进程的不止一个非常多但又不希望他们一个一个跑或全部一起跑就需要用到线程池但是有些进程之间有依赖关系比如进程A必须完成后进程B才可以执行还需要额外的逻辑保

shell执行神器，赶紧来围观（python，附源码)

前言

思路

使用

进阶（函数任务）

源码

shell执行神器，赶紧来围观（python，附源码) 的相关文章

随机推荐

热门标签