0

0

进程被 OOM kill 但 oom_score_adj 已调低仍被选中的隐藏规则

舞姬之光

舞姬之光

发布时间:2026-01-22 19:16:02

|

657人浏览过

|

来源于php中文网

原创

oom killer按cgroup局部决策,oom_score_adj仅在同cgroup内生效;badness得分由实际内存占用(含匿名页等)、cgroup压力系数等加权计算,-1000不等于免疫。

进程被 oom kill 但 oom_score_adj 已调低仍被选中的隐藏规则

进程被 OOM kill 却已将 oom_score_adj 设为较低值(比如 -1000),仍被选中,往往不是因为配置没生效,而是内核在最终决策时引入了几个**不常被文档强调、但实际起决定性作用的隐藏规则**。

内存压力来源决定“谁该死”的优先级范围

OOM killer 不是全局扫描所有进程挑分最低的,而是先聚焦于**触发 OOM 的内存域(memory cgroup 或 NUMA node)内正在分配失败的进程所属的 cgroup**。即使你把某个后台服务的 oom_score_adj 调到 -1000,只要它恰好运行在当前内存紧张的 cgroup 里,而同 cgroup 内其他进程的分更高,它就可能成为备选——哪怕宿主机上还有大量空闲内存。

  • 检查方式:cat /proc/<pid>/cgroup</pid> 看进程归属;cat /sys/fs/cgroup/memory/<cgroup_path>/memory.oom_control</cgroup_path> 查该 cgroup 是否已触发过 OOM
  • 关键点:OOM 是按 cgroup 隔离粒度触发的,oom_score_adj 只在本 cgroup 内有效

实际内存占用 ≠ RSS,内核看的是 badness score 的完整计算逻辑

oom_score_adj 只是 badness 公式中的一个偏移项,真正得分由以下几项加权得出:

  • 进程实际使用的内存页数(包括匿名页、文件缓存脏页、swapcached 页等) —— 这比 rss 更大,尤其对 mmap 大文件、使用 tmpfs 或有大量 page cache 的进程影响显著
  • 进程的 CPU 时间权重(越老的进程权重略低) —— 但影响微弱,通常可忽略
  • 是否为 superuser 进程(uid 0)会轻微降低得分
  • oom_score_adj 值线性叠加,但有上下限(-1000 到 +1000) —— 设为 -1000 并不等于“免疫”,只是让基础分归零;若其内存占用是同类进程的 10 倍,仍可能高于其他轻量进程

某些内存类型会被“加倍惩罚”

内核对以下两类内存,在计算 badness 时会额外加重计分:

A1.art
A1.art

一个创新的AI艺术应用平台,旨在简化和普及艺术创作

下载
  • 不可回收的匿名页(如 malloc 分配、堆、mmap(MAP_ANONYMOUS)) —— 因无法写回磁盘,回收代价最高
  • 属于 memcg 且超出 memory.high 限制后继续增长的内存 —— 此时该 cgroup 已进入“压力模式”,其内进程的 badness 会被乘以一个增长系数(2x~4x),oom_score_adj 无法抵消该放大效应

例如:一个 Java 进程设了 oom_score_adj = -1000,但它的 heap 和 metaspace 占用 4GB 且全部是匿名页,同时所在 cgroup 已超 memory.high=3G,那么它的实际 badness 很可能远高于一个只占 500MB 但 oom_score_adj = 0 的 Nginx 进程。

确认是否真被 OOM killer 杀掉,而非其他机制

别默认日志里出现 “Killed process” 就是 OOM killer 所为:

  • 检查 dmesg -T | grep -i "killed process" 输出中是否有 Out of memory: Kill process 开头的完整行 —— 这才是 OOM killer 日志
  • 若只有 Memory cgroup out of memory 但无后续 kill 行,可能是 cgroup v2 的 memory.oom 控制器直接 freeze 进程,而非发送 SIGKILL
  • 某些容器运行时(如 containerd)或 systemd 服务会拦截 OOM 事件并自行重启/退出,掩盖真实原因

不复杂但容易忽略。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
nginx 重启
nginx 重启

nginx重启对于网站的运维来说是非常重要的,根据不同的需求,可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容,供大家免费下载体验。

246

2023.07.27

nginx 配置详解
nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件,可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大,允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

522

2023.08.04

nginx配置详解
nginx配置详解

NGINX与其他服务类似,因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章,大家可以免费学习。

610

2023.08.04

tomcat和nginx有哪些区别
tomcat和nginx有哪些区别

tomcat和nginx的区别:1、应用领域;2、性能;3、功能;4、配置;5、安全性;6、扩展性;7、部署复杂性;8、社区支持;9、成本;10、日志管理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

244

2024.02.23

nginx报404怎么解决
nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误,表明服务器无法找到请求资源,可以通过以下步骤解决:1. 检查文件是否存在且路径正确;2. 检查文件权限并更改为 644 或 755;3. 检查 nginx 配置,确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

693

2024.07.09

Nginx报404错误解决方法
Nginx报404错误解决方法

解决方法:只需要加上这段配置:try_files $uri $uri/ /index.html;即可。想了解更多Nginx的相关内容,可以阅读本专题下面的文章。

3618

2024.08.07

nginx部署php项目教程汇总
nginx部署php项目教程汇总

本专题整合了nginx部署php项目教程汇总,阅读专题下面的文章了解更多详细内容。

54

2026.01.13

nginx配置文件详细教程
nginx配置文件详细教程

本专题整合了nginx配置文件相关教程详细汇总,阅读专题下面的文章了解更多详细内容。

71

2026.01.13

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.1万人学习

Java 教程
Java 教程

共578课时 | 80.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号