问题引起原因:①yum更新导致无法使用yum,于是将占用进程kill掉,导致。 ps -A -ostat,ppid,pid,cmd | grep -e ‘^[Zz]’ ps -ef --no-headers ②k8s环境kubelet服务异常,systemd1服务超时,导致多数命令执行超时无响应阻塞状态变为僵尸进程,这些僵尸进程的父进程都是1,直接kill掉进程号为1的会导致系统瘫痪。尝试找到子进程使用kill发起HUP信号挂起,无响应不行; 查看状态 1、vmstat -n 3 [root@k8s-node2 ~]# vmstat -n 3 procs -----------memory---------- —swap-- -----io---- -system-- ------cpu----- r b swpd free buff cache si so bi bo in cs us sy id wa st 4 0 0 455900 0 889356 0 0 10 25 373 379 0 13 86 0 0 4 0 0 455932 0 889388 0 0 0 0 2030 910 0 50 50 0 0 4 0 0 455784 0 889388 0 0 0 0 2027 916 0 50 50 0 0 4 0 0 455792 0 889388 0 0 0 0 2026 896 0 50 50 0 0 5 0 0 455760 0 889388 0 0 0 0 2023 895 0 50 50 0 0 4 0 0 455760 0 889388 0 0 0 0 2027 908 0 50 50 0 0 5 0 0 455760 0 889388 0 0 0 0 2025 904 0 50 50 0 0 4 0 0 455760 0 889388 0 0 0 0 2027 927 0 50 50 0 0 2、[root@k8s-node2 ~]# w 10:53:04 up 9:11, 1 user, load average: 21.13, 21.00, 20.60 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT root pts/3 192.168.40.128 10:37 0.00s 0.08s 0.00s w 3、如图可见, sy—> 内核空间占用cpu1 100%,cpu被占满,且有19个僵尸进程 因为是systemd1服务挂了,所以systemctl命令都无法使用,且所有调用这个函数的命令都无法使用,即关机reboot、init 0、shutdown -h now都无效; 只能强制关机了(生产这个操作有风险,慎重考虑执行) 强制重启后,恢复正常