0

0

LinuxOOM问题如何排查_内存溢出处理实战【教学】

舞夢輝影

舞夢輝影

发布时间:2025-12-18 19:43:02

|

838人浏览过

|

来源于php中文网

原创

Linux OOM本质是内存耗尽后内核强制终止进程,排查关键在于厘清压力来源、识别真实瓶颈、验证是否误杀;需分析OOM日志定位被杀进程与触发条件,分层验证内存使用,深挖进程内存增长源头,并实施临时缓解与长期治理措施。

linuxoom问题如何排查_内存溢出处理实战【教学】

Linux OOM(Out of Memory)问题本质是系统内存耗尽后,内核触发OOM Killer强制终止进程来保全系统。排查关键不在于“找哪个进程占内存最多”,而在于厘清内存压力来源、识别真实瓶颈、验证是否误杀关键服务。

看懂OOM日志:定位被杀进程和触发条件

系统触发OOM时,内核会在dmesg或/var/log/kern.log中输出完整日志。重点抓三类信息:

  • 时间戳与触发上下文:确认OOM发生时刻,结合业务日志判断是否有批量任务、流量突增或定时作业
  • “Killed process XXX (pid YYY)”行:明确被终止的进程名、PID、UID,注意不是最高RSS的进程,而是oom_score_adj值最高且内存占用大的“综合得分最高者”
  • “Mem-Info”快照:查看Active/Inactive(anon)、SwapCached、PageTables等字段,判断是匿名页(堆/)、页表开销还是缓存膨胀导致压力

查内存真实使用:别只盯free -h

free命令显示的“available”是估算值,易误导。需分层验证:

BrainyAI
BrainyAI

BrainyAI—你的智能网页助手,一款聚合AI大模型和搜索引擎的浏览器插件

下载
  • cat /proc/meminfo | grep -E "(MemTotal|MemFree|MemAvailable|Buffers|Cached|SReclaimable|SwapTotal|SwapFree|Committed_AS|CommitLimit)":重点关注Committed_AS(已承诺虚拟内存)是否接近CommitLimit,超限即可能OOM
  • slabtop -o:检查内核slab分配器是否泄漏(如dentry、inode、ext4_inode_cache异常增长)
  • smem -w -k -c "pid user command swap pss uss" | head -20:按PSS(比例集大小)排序,比RSS更准确反映进程实际内存贡献

分析内存增长源头:从进程到应用层

确认某进程持续吃内存后,不能直接杀掉了事,要深挖原因:

  • 查该进程的内存映射:cat /proc/PID/smaps | awk '/^Size:/ {sum+=$2} END {print sum}',再对比/proc/PID/status中的VmRSS,差值大说明存在大量未映射但已分配的虚拟内存(如Java堆外内存、mmap大块未用区域)
  • 看是否频繁minor/major fault:watch -n1 'cat /proc/PID/status | grep -E "(VmRSS|MMU|thr)"',配合perf record -e page-faults,minor-faults,major-faults -p PID观察缺页行为
  • 对Java应用:加-XX:+PrintGCDetails -Xloggc:gc.log,并用gceasy.io分析GC日志;检查是否存在DirectByteBuffer泄漏、静态集合无清理、线程数失控

临时缓解与长期治理

OOM不是故障终点,而是系统设计信号:

  • 紧急止血:echo -17 > /proc/PID/oom_score_adj 可降低关键进程被杀优先级(仅临时,重启失效);swapoff && swapon可重置swap状态(慎用)
  • 限制资源边界:用systemd设置MemoryMax=2G、MemoryHigh=1.5G,或cgroup v2统一管控;容器场景务必设–memory和–memory-swap
  • 监控前置化:部署node_exporter + Prometheus,告警指标包括node_memory_CommitLimit_bytes - node_memory_Committed_AS_bytes gout陡升、slab_unreclaimable > 500MB

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

187

2023.09.27

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

399

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

577

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

399

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

577

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

546

2023.08.10

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1436

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

708

2023.06.29

AO3官网入口与中文阅读设置 AO3网页版使用与访问
AO3官网入口与中文阅读设置 AO3网页版使用与访问

本专题围绕 Archive of Our Own(AO3)官网入口展开,系统整理 AO3 最新可用官网地址、网页版访问方式、正确打开链接的方法,并详细讲解 AO3 中文界面设置、阅读语言切换及基础使用流程,帮助用户稳定访问 AO3 官网,高效完成中文阅读与作品浏览。

89

2026.02.02

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.3万人学习

Git 教程
Git 教程

共21课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号