oom_score_adj 无效的 cgroup v1 vs v2 memory controller 迁移坑

冷漠man

发布时间：2026-01-30 13:56:54

258人浏览过

来源于php中文网

原创

oom_score_adj写入后未生效的根本原因是cgroup v2已启用而操作仍按v1设计：必须先将进程移入目标cgroup，再写入该cgroup内才有效，否则仅作用于默认root cgroup且不参与OOM决策。

oom_score_adj 无效的 cgroup v1 vs v2 memory controller 迁移坑

为什么 `oom_score_adj` 写入后没生效？

直接写 /proc/$PID/oom_score_adj 看似成功，但进程仍被误杀，根本原因常是 cgroup v2 已启用，而你的操作逻辑还按 v1 设计。cgroup v2 下，oom_score_adj 的作用范围被严格限制在 leaf cgroup 内，且仅对该 cgroup 内的 direct children 进程有效；父 cgroup 的设置不继承，更不会影响已存在的、未被显式移动进该 cgroup 的进程。

cgroup v1 和 v2 对 `memory.oom_control` 和 `oom_score_adj` 的处理差异

v1 中：memory.oom_control 是开关，配合 oom_score_adj 共同决定是否触发 OOM killer；v2 废弃了 memory.oom_control，改用 memory.low / memory.high / memory.max 分级管控，并把 OOM 判定逻辑下沉到内核 memory controller，oom_score_adj 仅用于同一 cgroup 内多个进程间的相对优先级排序，不再参与“是否该 OOM”的决策。

v1：可全局调优单个进程的 OOM 抵抗力，靠 oom_score_adj 偏移值
v2：必须先将进程 move 到目标 cgroup（如 /sys/fs/cgroup/memory/myapp/），再写 oom_score_adj，否则写入无效或被忽略
v2 中若 cgroup 设置了 memory.max 为有限值，且内存超限，内核会直接 kill 该 cgroup 中任意一个进程（选 oom_score_adj 最低者），不查全局 /proc/*/oom_score_adj

迁移时最常踩的三个坑

从 v1 迁移到 v2，光改路径不够，行为逻辑已变。

Grokipedia

xAI推出的AI在线百科全书

下载

误以为 echo -1000 > /proc/$PID/oom_score_adj 仍能保命 —— v2 下它只在进程所属 cgroup 内起相对作用，无法覆盖 cgroup 级别的内存硬限
忘记将进程 move 到目标 cgroup：echo $PID > /sys/fs/cgroup/memory/myapp/cgroup.procs 缺失，导致 oom_score_adj 写入的是默认 root cgroup，完全不生效
混用 v1/v2 挂载点：系统启用了 v2（mount | grep cgroup 显示 type cgroup2），但脚本还在读写 /sys/fs/cgroup/memory/xxx/ 下的 v1 接口（如 memory.limit_in_bytes），这些文件已不存在或返回 ENOENT

验证 `oom_score_adj` 是否真在起作用

不能只看写入是否成功，要确认进程当前归属的 cgroup 及其 memory 控制策略。

查进程所在 cgroup：cat /proc/$PID/cgroup | grep memory，确认输出类似 0::/myapp（v2）而非 memory:/myapp（v1）
查该 cgroup 是否设了 memory.max：cat /sys/fs/cgroup/myapp/memory.max，若为 max 表示无硬限，若为数值（如 512M），OOM 就由它触发，oom_score_adj 仅影响 kill 顺序
对比同 cgroup 内多进程的 oom_score_adj 值：for p in $(cat /sys/fs/cgroup/myapp/cgroup.procs); do echo "$p $(cat /proc/$p/oom_score_adj 2>/dev/null)"; done | sort -k2n，观察排序是否符合预期

真正关键的不是调高某个进程的分数，而是确保它在正确的 cgroup 里、且该 cgroup 的 memory.max 设置合理。否则 oom_score_adj 就像给即将沉船的乘客调换舱位。

如何在 Kivy 应用中正确引用屏幕内的控件（如 TextInput）

Django 外部脚本中正确配置 ORM 环境以加载自定义 App 模块

Django 外部脚本中正确配置 ORM 并导入自定义 App 模块的完整指南

Django 外部脚本中正确配置 ORM 并导入自定义 App 模块

Flask 中使用 url_for() 生成路由链接的正确方法

相关标签:

app 为什么 echo NULL sort for 继承接口

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Pandas 中实现 DataFrame 行级交错合并（非关联式垂直拼接）下一篇：Python 向量化计算的本质优势

作者最新文章

clawdbot国内能用吗 clawdbot使用方法教程

2026-01-29 11:31

高德淘金实名认证不了怎么办高德淘金点击实名认证没反应

2026-01-29 11:31

高德淘金道路任务怎么做高德淘金道路任务怎么拍摄

2026-01-29 11:42

生化危机9配置要求生化危机9电脑配置要求

2026-01-29 11:55

生化危机9主角是谁生化危机9主角是里昂吗

2026-01-29 11:56

Linux 系统时间不同步的排查流程

2026-01-29 12:10

systemd-journald "Journal header limits reached or header out-of-date" 的修复

2026-01-29 12:15

用 Go 实现一个高性能的 LRU 缓存

2026-01-29 12:53

SQL 如何处理“闰年/闰月”导致的日期计算错误

2026-01-29 13:34

Pinterest大砍15%人力理由是「想要精通AI的人才」

2026-01-29 13:48

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

237

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

458

2024.03.01

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

395

2023.09.04

硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍：1、IDE接口是一种并行接口，主要用于连接硬盘和光驱等设备，它主要有两种类型：ATA和ATAPI，IDE接口已经逐渐被SATA接口；2、SATA接口是一种串行接口，相较于IDE接口，它具有更高的传输速度、更低的功耗和更小的体积；3、SCSI接口等等。

1135

2023.10.19