0

0

Linux kubelet 的 --eviction-hard / --eviction-soft 配置阈值经验值

舞夢輝影

舞夢輝影

发布时间:2026-02-20 16:04:03

|

717人浏览过

|

来源于php中文网

原创

eviction-hard 是立即驱逐,无缓冲;eviction-soft 需同时满足持续超阈值和无可用宽限期,二者阈值须有梯度且不可重叠,memory.available 应基于内核 memavailable 字段设定,避免误用 free 输出或百分比,并需配合 system-reserved 配置。

linux kubelet 的 --eviction-hard / --eviction-soft 配置阈值经验值

eviction-hard 和 eviction-soft 的本质区别

--eviction-hard 是“立刻驱逐”,一旦触发,kubelet 会立即终止 Pod,不给缓冲时间;--eviction-soft 是“软驱逐”,需要同时满足两个条件:资源持续超阈值(靠 --eviction-soft-grace-period 控制),且没有可用 grace period(靠 --eviction-max-pod-grace-period 配合)。硬阈值是保底安全线,软阈值是主动干预窗口。

常见错误现象:NodeConditionReady 反复变 Unknown,或 Pod 被杀但日志里查不到 Evicted 状态——大概率是只配了 --eviction-soft 却没设 grace period,导致软策略永远不生效。

  • --eviction-hard 推荐从 memory.available、<code>nodefs.available 起步,不要设成 <code> 或 <code>,否则磁盘写满前 kubelet 已失联
  • --eviction-soft 建议比 hard 早 1–2 Gi 或 5–8%,例如 memory.available 对应 <code>memory.available
  • 两者不能共用同一指标却不设差异,比如 memory.available 同时出现在 soft 和 hard 里——soft 会因无 grace period 永远卡住

memory.available 阈值为什么不能只看 free + buffers/cached

Linux 的 memory.available 是内核 3.14+ 通过 MemAvailable 字段暴露的估算值,它剔除了无法快速回收的 slab、page cache dirty pages、tmpfs 等。直接用 free -havailable 列只是近似,但 kubelet 读的是 /proc/meminfo 里的原始值,受 cgroup v1/v2、kmem accounting 是否开启影响极大。

使用场景:在容器密度高、启用 memory.kmem.limit_in_bytes 的节点上,memory.available 可能比预期低 20% 以上,此时按 free 输出设阈值会导致过早驱逐。

  • 确认内核版本:uname -r,低于 3.14 的节点根本没 MemAvailable,kubelet 会 fallback 到粗略估算,阈值需上浮 30%
  • cgroup v2 下若启用 memory.highmemory.available 计算更保守,建议 hard 阈值至少留 1Gi 缓冲
  • 避免用 nodefs.inodesFree 做主驱逐指标——inode 耗尽往往发生在小文件暴增场景,但驱逐 Pod 并不能释放已分配的 inode

disk pressure 驱逐的实际生效顺序和陷阱

nodefs.availableimagefs.available 触发时,kubelet 先尝试清理镜像(pruneImages),再删容器日志、emptyDir,最后才驱逐 Pod。但这个顺序不可控,且 pruneImages 默认只清理最近 5 分钟没被引用的镜像——如果业务 Pod 频繁重启,镜像可能永远不被清理。

阿里云AI平台
阿里云AI平台

阿里云AI平台

下载

常见错误现象:磁盘显示 95% 使用率,但 kubectl describe nodeConditions 没出现 MemoryPressureDiskPressure——大概率是 imagefsnodefs 指向同一挂载点,而 kubelet 默认只监控 nodefs,除非显式配置 --imagefs-available-margin

  • 确认 imagefs 路径:df -h | grep $(grep 'docker\|containerd' /proc/1/mountinfo | awk '{print $5}'),多数情况它和 nodefs 是同一个设备
  • 若共用设备,必须同时配置 --eviction-hard=nodefs.available,否则 <code>imagefs 阈值无效
  • --eviction-minimum-reclaim 对 disk 无效,它只影响 memory 和 pid;磁盘清理量由 kubelet 内部策略决定,无法强制最小清理 GB 数

阈值调得太激进反而引发雪崩

硬阈值设太紧(如 memory.available)会让 kubelet 在内存真正吃紧前就驱逐大量 Pod,剩余 Pod 因竞争加剧更快耗尽资源,形成“驱逐→负载升高→再驱逐”循环。尤其在 burstable QoS 的 Pod 上,cgroup memory limit 往往高于 request,驱逐后调度器可能把新 Pod 分配到同样快撑爆的节点。

性能影响:每次驱逐会触发 syncLoop 全量状态比对,若节点有 200+ Pod,单次驱逐可导致 kubelet CPU 占用尖峰达 300%,进一步拖慢状态上报,让 master 误判节点失联。

  • 生产环境 --eviction-hard 最低建议不低于 memory.available(小节点)或 <code>(32G+ 内存节点)
  • 避免用 allocatable 百分比设阈值,比如 memory.available——allocatable 本身随 kube-reserved 变化,百分比会漂移
  • 所有阈值必须配合 --system-reserved=memory=1Gi 类配置,否则 kubelet 自身内存开销会被计入可用量,导致误触发

最常被忽略的一点:--eviction-hard 阈值修改后,kubelet 不会自动 reload,必须重启进程才能生效;而 --eviction-soft 参数变更后,旧 grace timer 不会中断,新策略要等下一个监控周期才参与判断。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

13

2026.02.03

margin在css中是啥意思
margin在css中是啥意思

在CSS中,margin是一个用于设置元素外边距的属性。想了解更多margin的相关内容,可以阅读本专题下面的文章。

454

2023.12.18

k8s和docker区别
k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

265

2023.07.24

docker进入容器的方法有哪些
docker进入容器的方法有哪些

docker进入容器的方法:1. Docker exec;2. Docker attach;3. Docker run --interactive --tty;4. Docker ps -a;5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

512

2024.04.08

docker容器无法访问外部网络怎么办
docker容器无法访问外部网络怎么办

docker 容器无法访问外部网络的原因和解决方法:配置 nat 端口映射以将容器端口映射到主机端口。根据主机兼容性选择正确的网络驱动(如 host 或 overlay)。允许容器端口通过主机的防火墙。配置容器的正确 dns 服务器。选择正确的容器网络模式。排除主机网络问题,如防火墙或连接问题。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

411

2024.04.08

docker镜像有什么用
docker镜像有什么用

docker 镜像是预构建的软件组件,用途广泛,包括:应用程序部署:简化部署,提高移植性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

447

2024.04.08

Docker容器化部署与DevOps实践
Docker容器化部署与DevOps实践

本专题面向后端与运维开发者,系统讲解 Docker 容器化技术在实际项目中的应用。内容涵盖 Docker 镜像构建、容器运行机制、Docker Compose 多服务编排,以及在 DevOps 流程中的持续集成与持续部署实践。通过真实场景演示,帮助开发者实现应用的快速部署、环境一致性与运维自动化。

17

2026.02.11

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

776

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.4万人学习

Git 教程
Git 教程

共21课时 | 3.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号