How to fix hung_task_timeout_secs and blocked for more than 120 seconds problem

2023-11-01

Author:Skate
Time:2015/03/04

 

How to fix hung_task_timeout_secs and blocked for more than 120 seconds problem

 

现象:系统hang住,可以ping通,但ssh无响应

查看message log
[1379100.801689] [<ffffffff81536f95>] page_fault+0x25/0x30
[1379100.801693] INFO: task java:710923 blocked for more than 120 seconds.
[1379100.801766] Not tainted 2.6.32-042stab104.1 #1
[1379100.801835] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[1379100.801963] java D ffff8800372d7200 0 710923 709954 67084186 0x00000000
[1379100.801968] ffff880e57e71cf0 0000000000000082 ffffea00021a8fc0 ffff880e57e71c68
[1379100.801972] ffffffff81155c60 ffff8800372d7200 ffffea00021a8fc0 ffff88100c409638
[1379100.801976] 00000007fa23bffc ffff880e57e71c78 ffffffff81155cd1 ffff880e57e71ca8
[1379100.801980] Call Trace:
[1379100.801984] [<ffffffff81155c60>] ? __lru_cache_add+0x40/0x90
[1379100.801988] [<ffffffff81155cd1>] ? lru_cache_add_lru+0x21/0x40
[1379100.801992] [<ffffffff81172c9c>] ? handle_pte_fault+0x65c/0x1040
[1379100.801996] [<ffffffff81536705>] rwsem_down_failed_common+0x95/0x1d0
[1379100.802000] [<ffffffff81536896>] rwsem_down_read_failed+0x26/0x30
[1379100.802004] [<ffffffff812a6a34>] call_rwsem_down_read_failed+0x14/0x30
[1379100.802008] [<ffffffff81535d94>] ? down_read+0x24/0x30
[1379100.802011] [<ffffffff8104dffe>] __do_page_fault+0x18e/0x480
[1379100.802015] [<ffffffff8106f0c8>] ? finish_task_switch+0xc8/0x120
[1379100.802019] [<ffffffff81539c2e>] do_page_fault+0x3e/0xa0
[1379100.802022] [<ffffffff81536f95>] page_fault+0x25/0x30
Show  Vitaly Medvedev added a comment - Yesterday 10:34 PM [1379100.801682] [<ffffffff81015019>] ? read_tsc+0x9/0x20 [1379100.801685] [<ffffffff81539c2e>] do_page_fault+0x3e/0xa0 [1379100.801689] [<ffffffff81536f95>] page_fault+0x25/0x30 [1379100.801693] INFO: task java:710923 blocked for more than 120 seconds. [1379100.801766] Not tainted 2.6.32-042stab104.1 #1 [1379100.801835] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [1379100.801963] java D ffff8800372d7200 0 710923 709954 67084186 0x00000000 [1379100.801968] ffff880e57e71cf0 0000000000000082 ffffea00021a8fc0 ffff880e57e71c68 [1379100.801972] ffffffff81155c60 ffff8800372d7200 ffffea00021a8fc0 ffff88100c409638 [1379100.801976] 00000007fa23bffc ffff880e57e71c78 ffffffff81155cd1 ffff880e57e71ca8 [1379100.801980] Call Trace: [1379100.801984] [<ffffffff81155c60>] ? __lru_cache_add+0x40/0x90 [1379100.801988] [<ffffffff81155cd1>] ? lru_cache_add_lru+0x21/0x40 [1379100.801992] [<ffffffff81172c9c>] ? handle_pte_fault+0x65c/0x1040 [1379100.801996] [<ffffffff81536705>] rwsem_down_failed_common+0x95/0x1d0 [1379100.802000] [<ffffffff81536896>] rwsem_down_read_failed+0x26/0x30 [1379100.802004] [<ffffffff812a6a34>] call_rwsem_down_read_failed+0x14/0x30 [1379100.802008] [<ffffffff81535d94>] ? down_read+0x24/0x30 [1379100.802011] [<ffffffff8104dffe>] __do_page_fault+0x18e/0x480 [1379100.802015] [<ffffffff8106f0c8>] ? finish_task_switch+0xc8/0x120 [1379100.802019] [<ffffffff81539c2e>] do_page_fault+0x3e/0xa0 [1379100.802022] [<ffffffff81536f95>] page_fault+0x25/0x30


宿主机的load达到460左右

By default Linux uses up to 40% of the available memory for file system caching.
After this mark has been reached the file system flushes all outstanding data to
disk causing all following IOs going synchronous. For flushing out this data to
disk this there is a time limit of 120 seconds by default. In the case here the
IO subsystem is not fast enough to flush the data withing 120 seconds. As IO
subsystem responds slowly and more requests are served, System Memory gets filled
up resulting in the above error, thus serving HTTP requests.


解决方案:

1. 修改参数 vm.dirty_ratio 和 vm.dirty_backgroud_ratio 可以避免这个问题

# sysctl -w vm.dirty_ratio=10
# sysctl -w vm.dirty_background_ratio=5

立即生效:
# sysctl -p

永久修改(需要reboot生效):
# vi /etc/sysctl.conf
vm.dirty_background_ratio = 5
vm.dirty_ratio = 10

2.找到好资源的进程,然后对其优化


参考:http://www.blackmoreops.com/2014/09/22/linux-kernel-panic-issue-fix-hung_task_timeout_secs-blocked-120-seconds-problem/


-------end-------

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

How to fix hung_task_timeout_secs and blocked for more than 120 seconds problem 的相关文章

  • linux修改主机名的方法

    linux修改主机名的方法 用hostname命令可以临时修改机器名 但机器重新启动之后就会恢复原来的值 hostname 查看机器名 hostname i 查看本机器名对应的ip地址 另外一种方法就是之久修改配置文件 修改 etc sys
  • linux的几个进程的作用

    author skate time 2011 08 10 linux的几个进程的作用 1 kswapd0 Linux uses kswapd for virtual memory management such that pages tha
  • 修改mysql的字符集和默认存储引擎

    author skate time 2012 05 18 修改mysql的字符集和默认存储引擎 1 修改mysql的字符集 mysql库现有字符集 mysql gt show variables like character Variabl
  • mysql的binlog详解

    author skate time 2012 03 27 mysql的binlog详解 什么是binlog binlog日志用于记录所有更新了数据或者已经潜在更新了数据 例如 没有匹配任何行的一个DELETE 的所有语句 语句以 事件 的形
  • mysql replication环境检查脚本

    author skate time 2013 05 13 mysql replication环境检查脚本 此脚本部署在slave端 可以通过短信或邮件监控slave的mysqld健康 replication环境健康 及复制延迟 脚本 mys
  • Mysql分表准则

    author skate time 2013 05 14 Mysql分表准则 在大量使用mysql时 数据量大 高访问时 为了提高性能需要分表处理 简介下mysql分表的标准 后续会继续补充 环境 业务类型 OLTP 硬件 cpu 8cpu
  • passwd: Authentication token manipulation error----linux

    author skatetime 2009 04 11 更改centos4 7 linux的root密码 报 passwd Authentication token manipulation error 如下所示 root ticket A
  • check/repair与myisamchk对比

    author skate time 2012 02 29 check repair与myisamchk对比 一 不相同点 1 myisamchk不但可以检查 修复myisam表 还可以获得表的信息 优化和分析myisam表 而check可以
  • How to fix hung_task_timeout_secs and blocked for more than 120 seconds problem

    Author Skate Time 2015 03 04 How to fix hung task timeout secs and blocked for more than 120 seconds problem 现象 系统hang住
  • mysql的sql性能分析器

    author skate time 2012 02 17 mysql的sql性能分析器 MySQL 的SQL性能分析器主要用途是显示SQL执行的整个过程中各项资源的使用情况 分析器可以更好的展示 出不良SQL的性能问题所在 mysql sq
  • nmon的安装与使用

    author skate time 2011 08 06 nmon的安装与使用 1 下载 nmon http nmon sourceforge net pmwiki php n Site Download nmonanalyser http
  • mysql内存使用分析(一)

    author skate time 2012 02 16 mysql内存使用分析 从内存的使用方式来说 MySQL数据库的内存使用主要分为以下两类 1 线程独享内存 2 全局共享内存 1 线程独享内存 在MySQL 中 线程独享内存主要用于
  • innodb索引概念

    author skate time 2013 04 09 总结记录下innodb的索引概念 以备查看 innodb索引分类 聚簇索引 clustered index 1 有主键时 根据主键创建聚簇索引 2 没有主键时 会用一个唯一且不为空的
  • 磁盘性能基本测试方法

    author skate time 2011 08 22 磁盘性能基本测试方法 dd if dev zero of tmp bs 1M count 10 用dd命令测试瞬间写的能力 iozone a i 1 i 0 c g 5M n 1M
  • stop带有临时表的slave步骤

    author skate time 2014 06 30 stop带有临时表的slave步骤 在stop slave之前一定要确定变量 Slave open temp tables 为0 如果在不为0时 停止了slave server或sl
  • linux的inode暴增

    author skate time 2012 04 26 linux的inode暴增 今天刚到公司 接收到一个报警短信 一个数据库的inode使用率达到99 root DBtmp df h Filesystem Size Used Avai
  • SaltStack Installation(一)

    author skate time 2014 11 11 SaltStack Installation Installation from EREL 1 If EPEL is not enabled on your system you c
  • myisamchk命令使用总结

    author sakte time 2012 02 28 myisamchk命令使用总结 myisamchk实用程序可以用来获得有关你的数据库表的统计信息或检查 修复 优化他们 1 常用于myisamchk的检查选项 information
  • oswatch的安装和使用

    author skate time 2011 08 06 oswatch的安装和使用 1 下载和安装 oswatch的安装与使用也比较简单 和nmon一样 都是下载后直接解压就可以使用的 oswatch是通过调用系统的命令完成信息的收集 命
  • 内存文件系统提升磁盘性能瓶颈

    author skate time 2011 08 22 提升磁盘性能瓶颈 linux的内存文件系统 ramdisk ramfs tmpfs ramdisk 是块设备 在使用它们之前必须用选择文件系统将其格式化 并且调整文件系统大小比较麻烦

随机推荐

  • 内网离线安装Docker

    文章目录 描述 下载docker离线包地址 1 安装docker 1 下载 Docker 二进制文件 离线安装包 2 上传离线包 3 解压安装包 4 将docker 相关命令拷贝到 usr bin 5 docker注册成系统服务 6 添加执
  • QT--信号槽与带参Lambda表达式

    一 常规的不带参数的Lambda表达式响应槽函数 connect ui btn QushButton clicked to do something 二 带参的Lambda表达式响应槽函数 connect ui spbox static c
  • ArcSDE超出最大连接数问题解决

    ARCSDE数据库默认连接的实例数为48 可用 sdemon o info I users 命令查看当前的用户链接数 因为连接的用户很多时 会导致实例数不够用 这个时候需要对连接的实例数进行修改 修改方法如下 1 plsql登录sde用户
  • 你还没有Aspose 2021中文开发指南吗?中文指南打包带走

    说到文档处理 就得来说说Aspose系列 Aspose是全球领先的图表控件开发商 旗下产品覆盖Word Excel PDF 条码 ZIP CAD HTML 电子邮件 PSD等各个文档管理领域 为全球 NET Java C 等各大平台程序员提
  • ARM平台移植libcurl curl-7.49.0

    libcurl是免费的轻量级的客户端网络库 支持DICT FILE FTP FTPS Gopher HTTP HTTPS IMAP IMAPS LDAP LDAPS POP3 POP3S RTMP RTSP SCP SFTP SMTP SM
  • SpringMVC重要接口(三)HttpMessageConverter

    大部分人的第一反应是通过SpringMVC拦截器 Interceptor 中的postHandler方法处理 实际这是行不通的 因为当程序运行到该方法 是在返回数据之后 渲染页面之前 所以这时候HttpServletResponse中的输出
  • C++-类和对象(上)

    类和对象 上 一 构造函数 1 概念 2 特性 二 析构函数 1 概念 2 特性 三 拷贝构造 1 概念 2 特性 四 运算符重载 1 概念 2 赋值运算符重载 五 重载与const 重载 六 总结 一 构造函数 1 概念 class St
  • Java后端、前端、大数据、python、Golang学习路线

    面向招聘要求学编程 加油 小y同学 blibli很多资源 黑马 尚硅谷 狂神说等等 1 后端 Java基础 完成 Java Web 完成 Maven 完成 Git 完成 SSM Spring框架 SpringMVC 持久层框架Mybatis
  • 充电IC和电量计的驱动调试

    LK是little kernel的缩写 高通平台android普遍采用LK作为其bootloader LK是一个开源项目 但是 LK只是整个系统的引导部分 所以它不是独立存在 LK是一个功能极其强大的bootloader 但只支持arm和x
  • 手把手教SYSU_2023SpringRL之实践作业二 (期末):Multi-Agent Reinforcement Learning (MARL)

    手把手教SYSU 2023SpringRL之实践作业二 期末 Multi Agent Reinforcement Learning MARL 0 前言 最终成绩90 1 环境概述 观测空间 动作空间 奖励函数 2 代码实战 训练环境配置 训
  • python Statsmodel 回归模型笔记

    Statsmodels是Python中一种常用的统计分析库 支持多种回归模型的建立和分析 以下是Statsmodels中常见的几种回归模型及其用途 线性回归模型 Linear Regression Model 用于建立自变量和因变量之间线性
  • 二维线段树的讲解【建立在线段树上的提升】

    二维线段树 二维线段树最主要用于平面统计问题 类似一维线段树 最经典的就是求区间最值 或区间和 推广到二维 求得就是矩形区域最值 或矩形区域和 对于矩形区域和 二维树状数组更加高效 而矩形区域最值 更加高效的方法是二维RMQ 但是二维RMQ
  • Mybatis框架的配置文件总结

    一 Mybatis核心文件的配置 他是有顺序的 固定前缀 额外属性
  • 阿里人机检测验证码的自动化操作尝试

    感谢作者 kunyus 1 通过检测浏览器状态来进行人机检测 使用selenium打开浏览器 通过 selenium 打开的浏览器是出于测试状态的 和正常的浏览器不太一样 通过 selenium 打开的浏览器哪怕人工手动拖动验证码也会被判断
  • PTA 4-7-7 Sigmoid函数及其梯度 (35 分)

    4 7 7 Sigmoid函数及其梯度 35 分 为了方便表述 对于作用于矩阵的激活函数 本文中如果无特殊说明 表示它分别作用于矩阵的每个元素 即f X i j f Xi j 如果没有非线性函数作为激活函数 那么无论多层感知机 MLP 有多
  • js设置随机颜色

    获取随机颜色 16进制 Math floor Math random 16777215 toString 16 eg
  • C语言经典100例题(39)-- 有一个已经排好序的数组。现输入一个数,要求按原来的规律将它插入数组中。

    目录 题目 问题分析 代码 测试结果 题目 有一个已经排好序的数组 现输入一个数 要求按原来的规律将它插入数组中 问题分析 首先判断此数是否大于最后一个数 然后再考虑插入中间的数的情况 插入后 此元素之后的数 依次后移一个位置 代码 inc
  • Ubuntu安装腾讯会议及运行腾讯会议的命令 亲测有用

    运行腾讯会议的命令 A A Dell G15 5511 opt wemeet wemeetapp sh 参考 Ubuntu安装腾讯会议 Ubuntu16 04 18 04 20 04 22 04 ubuntu下载腾讯会议 HIT Vanni
  • 人脸检测、人脸对齐(MTCNN方法)

    众所众知 严格定义上的人脸识别分为四个步骤 人脸检测 从图片中准确定位到人脸 人脸矫正 对齐 检测到的人脸 可能角度不是很正 需要使其对齐 对矫正后的人脸进行特征提取 对两张人脸图像的特征向量进行对比 计算相似度 这里 我们主要是推荐步骤1
  • How to fix hung_task_timeout_secs and blocked for more than 120 seconds problem

    Author Skate Time 2015 03 04 How to fix hung task timeout secs and blocked for more than 120 seconds problem 现象 系统hang住