Linux cgroup 在资源控制中的作用

冷漠man

发布时间：2026-01-28 11:55:03

724人浏览过

来源于php中文网

原创

cgroup是内核级强制资源控制机制，能硬性限制CPU、内存、IO等资源；超限时进程被OOM killer杀掉或等待下个调度周期。

linux cgroup 在资源控制中的作用

Linux cgroup 是什么，它真能限制进程资源吗

能，而且是内核级强制控制。cgroup（control group）不是用户态工具或监控代理，而是 Linux 内核提供的资源隔离与分组管理机制。只要正确挂载、配置并把进程加入对应 cgroup，CPU、内存、IO 等资源上限就会被硬性执行——超限时，比如内存用超 memory.max，进程会直接被 OOM killer 杀掉；CPU 时间超配额，就只能等下个调度周期。

为什么 `memory.max` 设了却没生效

常见原因是没启用 memory controller，或者进程没真正进入目标 cgroup。从 kernel 5.8+ 开始，memory controller 默认不启用，需在启动参数中显式添加 cgroup_enable=memory 并配合 swapaccount=1（若需限制 swap）。另外，仅创建目录、写入 memory.max 不够，必须把进程 PID 写入该 cgroup 的 cgroup.procs 或 tasks 文件：

echo $PID > /sys/fs/cgroup/mygroup/cgroup.procs

注意：cgroup.procs 写入的是线程组 ID（即主线程 PID），tasks 才是单个线程 ID；混用会导致部分线程未受控。

systemd 启动的服务默认在自己的 scope 下，需用 SystemMaxMemory 或 MemoryMax= 在 unit 文件里配置，而非手动改 cgroup 文件
容器运行时（如 runc）通常自动设置 cgroup，但 debug 时建议检查 /proc/$PID/cgroup 确认进程归属
memory.max 为 max 表示不限制，不是“最大值”，别误设成字符串 "max"

`cpu.max` 和 `cpu.weight` 到底怎么选

两者定位完全不同：cpu.weight（cgroup v2）是相对权重，用于公平调度，不设硬上限；cpu.max 才是绝对配额，格式为 "max us/sec"，例如 "50000 100000" 表示每 100ms 最多用 50ms CPU 时间。

实际场景中：

AIBox 一站式AI创作平台

AIBox365一站式AI创作平台，支持ChatGPT、GPT4、Claue3、Gemini、Midjourney等国内外大模型

下载

做资源保障型服务（如数据库主实例），优先用 cpu.max 防止单一进程吃满 CPU
做批处理任务混部（如日志压缩 + 实时 API），用 cpu.weight 更灵活，避免低权任务完全饿死
cpu.max 对短时突发无效——它只在周期性配额检查点（默认 100ms）生效，高频小任务可能连续抢到多个周期的额度

为什么 cgroup v1 和 v2 混用会出问题

根本原因是两者不兼容：v1 按子系统挂载（cpu、memory 各自独立挂载），v2 是统一挂载单棵树，所有控制器必须同时启用或禁用。如果你看到 /sys/fs/cgroup/cpu 和 /sys/fs/cgroup/unified 同时存在，说明系统处于混合模式，此时 systemd、Docker 等组件行为不可预测。

确认方式：

mount | grep cgroup

理想输出应只含一行 cgroup2 on /sys/fs/cgroup type cgroup2。若要彻底切换到 v2：

内核启动参数加 systemd.unified_cgroup_hierarchy=1
禁用旧版控制器：确保 /proc/sys/kernel/cgroup_disable 为空或不含 cpu、memory 等
Docker 20.10+ 默认支持 v2，但需在 /etc/docker/daemon.json 中显式设 "cgroup-parent": "/docker" 类路径，否则可能 fallback 到 v1

cgroup 的复杂性不在语法，而在它和调度器、OOM killer、page cache 回收等内核子系统的耦合深度——一个配置项改错，可能让延迟毛刺变高，或让内存回收卡住整个节点。动手前，先看 /sys/fs/cgroup/xxx/cgroup.events 里的 populated 和 low 事件，比盲目调参更可靠。

Linux生产事故复盘方法_事故分析与改进

Linux系统卡死问题_内核日志分析

Linux系统中利用Ionice命令调整进程磁盘访问优先级

Linux条件判断语法_Shell判断实战

Linux系统中用户进程与内核线程区别及调度开销对比

相关标签:

linux js json docker 工具 json 字符串线程主线程事件 docker 数据库 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：haproxy backend health check 失败但 curl 直连正常的协议坑下一篇：random: crng init 卡死几分钟的 haveged / rng-tools / virtio-rng 加速

作者最新文章

Linux进程五种状态转换原理及R与D状态性能影响分析

2026-03-14 12:24

Linux系统中线程Thread与轻量级进程LWP内在联系分析

2026-03-14 12:41

MacOS系统针对外部存储的Spotlight索引禁用设置

2026-03-14 13:02

Windows运维中利用GPO配置无线网络配置文件自动连接

2026-03-14 13:14

Java中Apache缓存雪崩现象的预防与后端保护逻辑

2026-03-14 13:22

Linux系统卡死问题_内核日志分析

2026-03-14 13:34

Linux 大促场景性能优化_削峰填谷策略

2026-03-14 13:43

Linux日志切割配置_logrotate实践

2026-03-14 13:53

SQLSQL注入防护_输入校验与参数化查询

2026-03-14 14:02

SQL批量删除优化_DELETE与TRUNCATE对比

2026-03-14 14:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23