在运维过程中,我们经常会碰到机器由于某几个特殊的僵尸进程造成整台服务器上的进程异常卡死,负载变高。
例如以下:
其中,存在8个僵尸进程,并且进程19712的CPU使用异常。查看具体的僵尸进程有哪些:
发现这些子僵尸进程的父进程即为19712进程。其对应的其实就是namenode进程
解决办法:
(1)如果业务不繁忙,允许停机,可以使用重启机器来解决