0

0

Linux高负载如何排查_操作步骤详解提升实战能力【教学】

舞姬之光

舞姬之光

发布时间:2025-12-21 22:40:03

|

821人浏览过

|

来源于php中文网

原创

linux高负载需结合cpu核心数、io等待、内存压力等多维度判断:先用uptime和nproc计算负载比值,再通过top看%cpu(s)、r列和mem行定位瓶颈,接着用ps、iostat、iotop等命令找异常进程,最后用strace、lsof、perf深入追踪。

linux高负载如何排查_操作步骤详解提升实战能力【教学】

Linux高负载不是单看一个数字就能下结论的事,关键得结合CPU核心数、进程状态、IO等待、内存压力这些维度交叉判断。下面分四步带你实操排查,每一步都带命令和解读,照着做就能定位问题根源。

一、确认负载是否真高

先别急着杀进程,先看负载值和CPU核数的关系:

  • 运行 uptimecat /proc/loadavg,拿到三个值(1/5/15分钟平均负载)
  • 运行 nprocgrep -c processor /proc/cpuinfo 查清逻辑CPU总数
  • 计算比值:比如负载是 6.2, 4.8, 2.1,CPU是4核,那1分钟负载6.2 ÷ 4 = 1.55 → 已过载;若负载是 0.8, 0.9, 1.0,哪怕看起来“有1”,其实完全正常

二、快速判断瓶颈类型

打开 top,重点盯三块:

What-the-Diff
What-the-Diff

检查请求差异,自动生成更改描述

下载
  • %Cpu(s) 行:看 us(用户态)高?sy(内核态)高?还是 wa(IO等待)高?   → us高:业务进程在狂算;   → sy高:系统调用频繁(如大量fork、socket操作);   → wa高:磁盘或网络卡住了,进程在等IO
  • load average 值持续高于CPU核数,且 r 列(运行队列长度)长期 > CPU核数,说明有任务在排队
  • Mem 行:如果 free 极低、buff/cache 占比高但 available 也低,可能内存吃紧;再查 free -havailable 是否告急

三、定位具体“搞事”的进程或线程

根据上一步线索选择对应命令:

  • 如果是 us/sy 高:   → ps aux --sort=-%cpu | head -10 找CPU大户   → top -Hp [PID] 进入线程视图,看哪个线程占CPU多(Java服务可配合 jstack [PID] 查堆
  • 如果是 wa 高:   → iostat -x 1 3 看 %util 和 await,%util > 90% 或 await > 10ms 说明磁盘慢   → iotop -o 直接看哪些进程在刷盘(需root)
  • 怀疑内存压力大:   → ps aux --sort=-%mem | head -10 找内存大户   → dmesg | grep -i "killed process" 看有没有OOM Killer干掉过进程

四、深入追踪异常行为(进阶)

当常规命令看不出明显问题时,可以追加深度诊断:

  • 对某个可疑进程做系统调用追踪:strace -tt -T -p [PID] -o /tmp/trace.log(观察是否卡在 open/read/write/futex 等系统调用)
  • 检查该进程打开的文件句柄:lsof -p [PID] | wc -l,超限可能引发阻塞
  • 查网络连接状况:ss -s 看总连接数、TIME-WAIT 数量;ss -tnp | grep [PID] 看它建了哪些连接
  • 查内核级资源争用:perf top -p [PID](需安装 perf),看热点函数在哪

基本上就这些。不复杂但容易忽略的是:别只盯着 load average 数字,一定要同步看 CPU 核心数、wa 值、r 列、available 内存这四个关键信号。它们合起来,才能告诉你系统到底卡在哪一环。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

443

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

605

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

765

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Git 教程
Git 教程

共21课时 | 4.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号