load average 长期超过 CPU 逻辑核心数×0.7(如4核超2.8)需排查;wa>5%表明IO卡顿最危险;buff/cache属可回收内存,应看avail Mem是否趋近0;僵尸进程无法kill,须检查并修复父进程wait调用。

load average 超过多少才算危险?
不是看绝对值,而是看它和 CPU 逻辑核心数的比值。执行 grep -c 'model name' /proc/cpuinfo 得到核数(比如结果是 4),那负载均值长期超过 2.8(即 4 × 0.7)就该排查了——0.7 是预警阈值,不是崩溃线。1 分钟值突增但 5/15 分钟平稳,可能是瞬时任务;若 15 分钟值持续高于核数,说明系统已持续过载。
%Cpu(s) 各字段代表什么?哪个高才真要命?
us 高说明业务代码在猛算(比如 Python 循环没优化);sy 高往往意味着频繁系统调用(如小文件狂读);wa 高才是磁盘或网络 IO 卡住了,这时候 top 看起来“CPU 闲”,但服务响应却极慢——这是最易误判的点。别只盯着 %CPU 列排序进程,先扫一眼 wa 值是否 >5%。
Mem 行里的 buff/cache 到底能不能算“可用内存”?
能,而且必须算。buff/cache 是内核自动管理的“可回收内存”,不是泄露也不是浪费。真正反映内存压力的是 avail Mem(Linux 3.14+ 默认显示),它已扣除不可回收部分。如果 free 很低但 avail Mem 充足,系统完全健康;反之,avail Mem 接近 0 且 si(swap in)开始上升,才是内存真正见底的信号。
GNU makefile中文手册 pdf,文比较完整的讲述GNU make工具,涵盖GNU make的用法、语法。同时重点讨论如何为一个工程编写Makefile。阅读本书之前,读者应该对GNU的工具链和Linux的一些常用编程工具有一定的了解。诸如:gcc、as、ar、ld、yacc等本文比较完整的讲述GNU make工具,涵盖GNU make的用法、语法。重点讨论如何使用make来管理软件工程、以及如何为工程编写正确的Makefile。 本手册不是一个纯粹的语言翻译版本,其中对GNU make的一些语法
僵尸进程(zombie)要不要立刻 kill?
不能 kill,也 kill 不掉。僵尸进程状态是 Z,PID 还在,但实际已终止,只等父进程调用 wait() 收尸。强行 kill -9 它无效。正确做法是查它的父进程(用 ps -o pid,ppid,stat,comm -C '进程名'),再决定:如果是短期脚本遗留,重启父进程即可;如果是长期服务(如某个 daemon),需检查其是否漏处理子进程退出信号——这才是根因。









