python多进程服务高可用

2023-11-17

python多进程服务高可用

目的

多进程服务高可用目的暂定为两个：

任务超时（计算超时，或者内部死锁），会出现timeout，任务计算失败。
子进程挂掉（比如动态基线卡爆子进程，手动kill -9子进程），主进程会重新启用子进程，并分配任务。丢失的任务，可以从日志中看到

高可用暂不支持：

暂不支持任务回收，即丢失的任务重新计算

不支持任务回收因为不确定子进程何时会挂掉，所以对子进程爆掉时的任务难处理

实现方式：

子进程挂掉使用multiprocess里的pool的机制：若主进程接到任务，则使用pool.apply_async产生子进程并计算；若进程卡死，则pool会自动创建新的子进程
超时机制为：在子进程里使用signal.alarm函数，对子进程状态进行监控

出现的问题

在pool中，子进程挂掉后，新启用的子进程不能工作

尝试思路

根据系统级别日志出现的segfault，尝试修复打包环境，修复环境后未解决问题
尝试使用主进程监控子进程的形式，尝试实现高可用，结果为：mac好用，Linux不好用
尝试修改超时监控策略，结果不好用
尝试修改进程启动策略，结果不好用
使用gdb调试不工作进程，进展为：认为可能存在死锁问题

问题产生原因：

子进程使用logging时，拷贝上下文时，会把主进程的锁拷贝进来，但此时主进程可能并没有release掉，因此在子进程acquire锁时，获取不到主进程的锁，最终产生死锁，导致子进程不工作

问题解决方式：

在子进程使用logging之前，删除继承过来的logging处理器（此时删除掉了继承过来的锁），并重新创建处理器。
logging.config.dictConfig 肯定存在bug，避免在子进程中使用logging.config.dictConfig函数

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python多进程服务高可用的相关文章

判断线程是否已经启动

如何判断Python线程是否已经启动有一个方法is alive 但这是真的before and while一个线程正在运行你可以看看ident领域的Thread实例这Python 2 7 线程文档 http docs python o
Python3+Kivy+Plyer 推送通知图标问题

我在使用 Android 的简单通知测试应用程序时遇到了一个奇怪的错误错误 python AttributeError type object notification org notificator R drawable has no
在 python 2 和 3 的spyder之间切换

根据我在文档中了解到的内容它指出您只需使用命令提示符创建一个新变量即可轻松在 2 个 python 环境之间切换如果我已经安装了 python 2 7 则 conda create n python34 python 3 4 anaco
如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref
如何有条件地组合两个相同形状的 numpy 数组

这听起来很简单但我想我把它想得太复杂了我想创建一个数组其元素是从两个形状相同的源数组生成的具体取决于源数组中哪个元素更大为了显示 import numpy as np array1 np array 2 3 0 array2 np
Pytest：如何使用从夹具返回的列表来参数化测试？

我想使用由固定装置动态创建的列表来参数化测试如下所示 pytest fixture def my list returning fixture depends on other fixtures return a dynamically
返回不包括指定键的字典副本

我想创建一个函数返回字典的副本不包括列表中指定的键考虑这本词典 my dict keyA 1 keyB 2 keyC 3 致电without keys my dict keyB keyC 应该返回 keyA 1 我想用一行简洁的字典理
如何从网站中提取冠状病毒病例？

我正在尝试从网站中提取冠状病毒 https www trackcorona live https www trackcorona live 但我得到了一个错误这是我的代码 response requests get https www t
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
使用 Python 解析 XML，解析外部 ENTITY 引用

在我的 S1000D xml 中它指定了一个带有对公共 URL 的引用的 DOCTYPE 该 URL 包含对包含所有有效字符实体的许多其他文件的引用我使用 xml etree ElementTree 和 lxml 尝试解析它并得到解析错
以编程方式将列名称添加到 numpy ndarray

我正在尝试将列名称添加到 numpy ndarray 然后按名称选择列但这不起作用我无法判断问题是在添加名称时出现还是在稍后尝试调用它们时出现这是我的代码 data np genfromtxt csv file delimiter
熊猫记忆

我有冗长的计算我重复了很多次因此我想使用记忆诸如jug http packages python org Jug and joblib http packages python org joblib memory html 与Pan
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
如何使用注释和聚合在 Django 的 ORM 中执行此 GROUP BY 查询

我真的不知道如何翻译GROUP BY and HAVING到姜戈的QuerySet annotate and QuerySet aggregate 我正在尝试将这个 SQL 查询转换为 ORM 语言 SELECT EXTRACT year
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
从 Apache 运行 python 脚本的最简单方法

我花了很长时间试图弄清楚这一点我基本上正在尝试开发一个网站当用户单击特定按钮时我必须在其中执行 python 脚本在研究了 Stack Overflow 和 Google 之后我需要配置 Apache 以便能够运行 CGI 脚本
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
scrapy python 请求未定义

我在这里找到了答案 code for site in sites Link site xpath a href extract CompleteLink urlparse urljoin response url Link yield Re
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当
如何抑制 Pandas Future 警告？

当我运行该程序时 Pandas 每次都会给出如下所示的未来警告 D Python lib site packages pandas core frame py 3581 FutureWarning rename with inplace

随机推荐

JS String 字符串方法

1 charAt 方法从一个字符串中返回指定的字符 var anyString Brave new world console log anyString charAt 0 B console log anyString charAt 1
移动端自动化测试实战

UI自动化测试的价值 1 提升回归测试的效率 2 可以进行兼容性测试 UI 自动化测试应用场景冒烟测试自动化提测之前自动断言提测质量提供准入参考功能测试自动化辅助 QA 与测试工程师的快速验证验收测试自动化兼容性测试等移动端
Markdown 语法完全指南

这里写目录标题简介 1 标题 2 段落和换行 3 文本样式粗体和斜体删除线和代码嵌套标记 4 链接内联链接引用链接 5 列表无序列表有序列表嵌套列表任务列表 6 引用块 7 插入图片 8 水平线 9 代码块 10 表格
MySQL 的优化方案总结

性能优化 Optimize 指的是在保证系统正确性的前提下能够更快速响应请求的一种手段而且有些性能问题比如慢查询等如果积累到一定的程度或者是遇到急速上升的并发请求之后会导致严重的后果轻则造成服务繁忙重则导致应用不可用它对我们
如何使用命令实现在达梦数据库里修改表的某个字段

达梦数据库里当字段长度太小的时候在应用程序里会出现这样的报错列 XXXX 长度超出定义说明当前要存储的内容跟设定的字段长度是不匹配的很明显这样的问题是要调整字段长度的的定位到列所在的表就可以通过达梦sql脚本去修改这个字段的长度
【Xilinx】Spartan 7上手指南（ARTY S7开发板）

Spartan 7上手指南一安装board文件 1 下载并解压板卡压缩文件 2 复制到Vivado安装目录二 demo工程 1 下载demo 2 修改tcl 3 恢复工程 4 生成bit 三调试运行 1 连接电脑 2 设置串口 3
分布式应用：Zabbix 自动发现与自动注册

目录一理论 1 Zabbix 自动发现 2 Zabbix 自动发现部署 3 Zabbix 自动注册 4 Zabbix 自动注册部署二实验 1 Zabbix 自动发现部署 2 Zabbix 自动注册部署三总结一理论 1 Zab
浅谈前端单元测试

首先声明一点长期以来前端开发的单元测试并不是在前端的开发过程中所必须的也不是每个前端开发工程师所注意和重视的甚至扩大到软件开发过程中单元测试这一环也不是在章程上有书面规定所要求的但是随着每个工程的复杂化代码的高复用性要求和前端代
MySql设置唯一标识主键等设置

建立表 create table user score name char 10 not null default score smallint not null default 0 增加一列 alter table user score
【简单】阶乘之和

描述给定n的值求Sn 1 2 3 4 5 n 之值但Sn可能很大因此只要求出Sn关于100007的余数输入输入数据有多组每组占一行每行一个正整数n n lt 1000 输出每组输出一个整数即Sn Mod 100007 样
自动化测试用例设计实例

在编写用例之间笔者再次强调几点编写自动化测试用例的原则 1 一个脚本是一个完整的场景从用户登陆操作到用户退出系统关闭浏览器 2 一个脚本脚本只验证一个功能点不要试图用户登陆系统后把所有的功能都进行验证再退出系统 3 尽量只做功能中正向
2022年全新Java学习路线图，含源码+笔记

简洁版本Java学习路线 Java SE基础 gt Java Web gt Maven gt Git gt SSM框架 gt MybatisPlus gt Spring Boot gt 传智健康医疗行业 gt Spring Cloud g
TLS 安全设置未设置为默认设置，这也可能导致此错误。

edge浏览器打开网页时打示 TLS 安全设置未设置为默认设置这也可能导致此错误如图此时可以通过启用TLS功能处理该问题控制面板 Internet选项高级如图启用TLS功能后刷新页面或重启浏览器之后就不会提示之前的报错了
ctfshow-萌新-web1( 利用intval函数的特性获取敏感数据)

ctf show 萌新模块的web1关这一关考察的是intval 函数转换字符串时的特性以及SQL的拼接绕过这一关直接就给了源码并提示我们 id 1000 时就是flag 先分析一下源码首先是 intval 函数将参数id转换为数
Educoder---计算机系统基础-----计算机系统2.1测试

1 5 B C A D C 6 10 D C B C B 10题讲解过程在8位寄存器中存放补码表示的数0FEH 算术左移一位后其十六进制代码是 A 0FFH B 0FCH C 7CH D 7EH 我是谁 a student a skat
43_iPhone如何查看idfa

今天工作时需要帮一位同事查看iPhone的idfa 然后通过idfa做一些定向操作网上查了十几分钟一直没有找到合适的方法最后找到一个对我来说非常简单的方法很快就找到了我们需要的idfa 在这里记录一下思路并不做详细解释懂的人自
【第10篇】MobileNets：用于移动视觉应用的高效卷积神经网络

MobileNets 用于移动视觉应用的高效卷积神经网络文章目录 MobileNets 用于移动视觉应用的高效卷积神经网络摘要一简介二前期工作三 MobileNet 架构 3 1 深度可分离卷积 3 2 网络结构和训练 3 3
Python爬虫，京东自动登录，在线抢购商品

京东抢购 Python爬虫自动登录京东网站查询商品库存价格显示购物车详情等可以指定抢购商品自动购买下单然后手动去京东付款就行 chang log 2017 03 30 实现二维码扫码登陆 2017 06 27 Golang版J
飞哥送书第二期：充能书单｜618，买什么都不如买知识！

您好我是码农飞哥 wei158556 感谢您阅读本文欢迎一键三连哦 1 Python基础专栏基础知识一网打尽 9 9元买不了吃亏买不了上当 Python从入门到精通 2 毕业设计专栏毕业季咱们不慌忙几百款毕业设计等你选 3 Py
python多进程服务高可用

python多进程服务高可用目的实现方式出现的问题尝试思路问题产生原因问题解决方式目的多进程服务高可用目的暂定为两个任务超时计算超时或者内部死锁会出现timeout 任务计算失败子进程挂掉比如动态基线卡爆子进程

python多进程服务高可用

python多进程服务高可用

目的

实现方式：

出现的问题

尝试思路

问题产生原因：

问题解决方式：

python多进程服务高可用 的相关文章

随机推荐

热门标签

python多进程服务高可用的相关文章