0

0

Linux Pod 调度与管理实战

舞夢輝影

舞夢輝影

发布时间:2026-03-06 13:43:27

|

460人浏览过

|

来源于php中文网

原创

pod卡在pending主因是调度器无法找到匹配node,需检查nodeselector、污点、资源请求及topologyspreadconstraints;kubectl scale无效常因操作对象错误、hpa覆盖或gitops锁住replicas;node notready时pod不迁移需核查pod-eviction-timeout和terminationgraceperiodseconds;drain节点须预演并关注statefulset策略与pdb。

linux pod 调度与管理实战

Pod 为什么卡在 Pending 状态不启动

绝大多数时候,Pending 是调度器找不到符合条件的 Node,不是镜像拉取或容器启动失败。先看 kubectl describe pod <name></name>,重点盯 Events 区域里最后一行——常见的是 0/3 nodes are available: 3 node(s) didn't match Pod's node selector.Insufficient cpu/memory

实操建议:

Linux加PHP加MySQL案例教程
Linux加PHP加MySQL案例教程

通过大量实例系统全面地介绍了Linux+PHP+MySQL环境下的网络后台开发技术,详尽分析了近30个典型案例。 本书以培养高级网站建设与管理人才为目标,内容循序渐进,由浅入深,通过大量的实例系统全面地介绍了Linux+PHP+MySQL环境下的网络后台开发技术。 本书详尽分析了近30个典型案例。包括计数器、网站流量统计、留言扳、论坛系统、聊天室、投票与调查、用户管理、新闻发布系统、广告轮播

下载
  • 检查 nodeSelectortaintstolerations 是否匹配:用 kubectl get nodes -o wide 看节点标签,用 kubectl describe node <node></node> 看污点
  • 确认资源请求(resources.requests)没写成远超集群余量的值,比如写 cpu: 16 却只有一台 4 核机器
  • 如果用了 topologySpreadConstraints,注意它可能因拓扑域不均导致“死锁式 Pending”,临时删掉它能快速验证是否是它的问题

kubectl scale 不生效的三个常见原因

kubectl scale 命令本身几乎不会报错,但副本数就是不变——本质是命令没落到真正的控制器上。最典型的是误对 Pod 直接操作,或者控制器被其他工具覆盖。

实操建议:

  • 确认目标对象是 deploymentstatefulset 这类控制器,而不是 podkubectl scale deployment/myapp --replicas=3 ✅,kubectl scale pod/myapp-xxx --replicas=3 ❌(无效)
  • 检查是否有 HorizontalPodAutoscaler(HPA)在运行:kubectl get hpa;有 HPA 时,手动 scale 会被它立刻覆盖
  • 确认 Deployment 的 replicas 字段没被 GitOps 工具(如 Argo CD、Flux)锁住:查 kubectl get deploy/myapp -o yaml 里有没有 annotations: "argocd.argoproj.io/sync-options": "SkipDryRunOnMissingResource=true" 类似字段,这类配置可能导致 apply 后状态不更新

Node NotReady 时 Pod 没自动迁移?检查这两个配置

Kubernetes 默认不会立即驱逐 NotReady 节点上的 Pod,而是等 5 分钟(pod-eviction-timeout),且前提是 Pod 没设 controller.kubernetes.io/pod-deletion-costpriorityClassName 干扰调度逻辑。

实操建议:

  • 查 kube-controller-manager 启动参数是否含 --pod-eviction-timeout=30s(生产环境慎调太短,可能引发抖动)
  • 确认 Pod 的 spec.terminationGracePeriodSeconds 没设成极大值(如 86400),否则即使触发驱逐,也会卡在 “Terminating” 状态不释放 IP 和端口
  • 若用 StatefulSet,注意它默认带 podManagementPolicy: OrderedReady,新 Pod 启动前旧 Pod 必须完全终止——NotReady 节点上的旧 Pod 如果卡住,新 Pod 就一直 Pending

如何安全地 Drain 一个 Node(尤其有 StatefulSet)

kubectl drain 不是“一键清空”,它会按策略逐个处理 Pod,但对 StatefulSet、本地存储、PDB(PodDisruptionBudget)敏感,稍不注意就中断服务。

实操建议:

  • 先跑 kubectl drain <node> --dry-run=client -o wide</node>,看哪些 Pod 会被跳过(比如没配 PDB、有 local volume、或 controller.kubernetes.io/pod-deletion-cost 值极高)
  • StatefulSet,确保副本数 ≥ 2 且启用了 podManagementPolicy: Parallel,否则 drain 会等第一个 Pod 完全终止才动第二个
  • --ignore-daemonsets 是默认行为,但如果你真有关键 DaemonSet(比如网络插件),得手动确认它是否允许临时缺失——别依赖这个 flag 做业务可用性兜底
  • drain 失败后,别直接 kubectl delete pod 强删:可能破坏 StatefulSet 的序号一致性,优先用 kubectl delete pod --grace-period=0 --force 并确认 controller 已重建
事情说清了就结束。真正麻烦的从来不是命令怎么敲,而是每个 Pod 背后绑着的调度约束、控制器状态、以及人对“自动”二字的过度信任。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据库Delete用法
数据库Delete用法

数据库Delete用法:1、删除单条记录;2、删除多条记录;3、删除所有记录;4、删除特定条件的记录。更多关于数据库Delete的内容,大家可以访问下面的文章。

287

2023.11.13

drop和delete的区别
drop和delete的区别

drop和delete的区别:1、功能与用途;2、操作对象;3、可逆性;4、空间释放;5、执行速度与效率;6、与其他命令的交互;7、影响的持久性;8、语法和执行;9、触发器与约束;10、事务处理。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

222

2023.12.29

Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务
Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务

Golang云原生微服务Kubernetes (K8s) 是指 使用 Go 语言(Golang)编写的云原生微服务,并利用 Kubernetes 平台进行容器化部署、自动化管理、弹性伸缩和高效编排的一整套现代应用架构方案。

27

2025.12.22

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1542

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

linux修改文件名
linux修改文件名

本专题为大家提供linux修改文件名相关的文章,这些文章可以帮助用户快速轻松地完成文件名的修改工作,大家可以免费体验。

799

2023.07.05

linux系统安装教程
linux系统安装教程

linux系统是一种可以免费使用,自由传播,多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章,大家可以免费体验。

586

2023.07.06

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

23

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.2万人学习

Git 教程
Git 教程

共21课时 | 4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号