Go开发Kubernetes Operator核心是用controller-runtime监听CR变化实现状态收敛,需通过Operator SDK搭建骨架、在Reconcile中实现控制循环、用OwnerReference绑定资源生命周期,并分本地调试与集群部署两步走。

用 Go 语言开发 Kubernetes Operator,核心是通过 controller-runtime 框架监听自定义资源(CR)变化,并驱动实际的集群状态向期望状态收敛。它不是写个脚本部署应用,而是构建一个“有状态的自动化运维代理”。
从 Operator SDK 开始搭建骨架
Operator SDK 是最主流的起点,它封装了 controller-runtime 的通用逻辑,帮你快速生成项目结构、CRD 定义、控制器模板和构建脚本。
- 安装 SDK CLI(推荐 v1.30+),运行
operator-sdk init --domain example.com --repo github.com/example/myapp-operator初始化项目 - 用
operator-sdk create api --group app --version v1alpha1 --kind MyApp生成 CRD 和控制器骨架,SDK 自动创建 Go 类型、Scheme 注册、Reconcile 方法占位符 - 生成的
controllers/myapp_controller.go就是你编写业务逻辑的主入口,重点在Reconcile函数
在 Reconcile 中实现“控制循环”逻辑
Reconcile 不是只执行一次,而是被反复调用:每次 CR 创建/更新/删除,或所依赖对象(如 Pod、Service)发生变动时都会触发。它的职责是读取当前状态、比对期望状态、执行必要操作。
- 先用
r.Get(ctx, req.NamespacedName, &myApp)获取本次请求对应的 MyApp 实例 - 检查
myApp.DeletionTimestamp != nil判断是否正在被删除,若有则执行清理逻辑(如删掉关联的 Deployment) - 否则,确保期望的 Deployment 存在且配置正确:查询现有 Deployment,若不存在则创建;若存在但镜像/副本数不匹配,则 Patch 或 Update
- 最后用
r.Status().Update(ctx, &myApp)更新 CR 的 status 字段,比如写入 Pod 数量、就绪状态、最后同步时间
用 OwnerReference 绑定资源生命周期
Operator 创建的 Deployment、Service 等资源必须明确归属到当前 MyApp 实例,否则手动删 CR 后,这些资源会残留——Kubernetes 依靠 OwnerReference 实现级联删除。
立即学习“go语言免费学习笔记(深入)”;
- 构造 Deployment 对象时,调用
ctrl.SetControllerReference(&myApp, &dep, r.Scheme) - 这会在 Deployment 的
metadata.ownerReferences中添加一条指向 MyApp 的引用,包含 UID、APIVersion、Kind - 后续只要 MyApp 被删除(且未设置
orphan),Kubernetes API Server 会自动回收所有带该 OwnerReference 的子资源
本地调试与集群部署要分两步走
开发阶段优先在本地连接远程集群调试,避免反复 build/push/image/deploy,等逻辑稳定后再打包成容器部署。
- 用
kubectl config current-context确保 kubeconfig 可用,运行make run ENABLE_WEBHOOKS=false直接启动控制器(跳过 webhook 可简化初期验证) - 另起终端用
kubectl apply -f config/samples/创建示例 MyApp,观察控制器日志输出和生成的 Deployment 是否符合预期 - 确认逻辑无误后,执行
make docker-build docker-push IMG=your-registry/myapp-operator:v0.1,再用make deploy IMG=your-registry/myapp-operator:v0.1部署到集群
不复杂但容易忽略:CRD 的 validation schema 要尽早定义(在 api/v1alpha1/myapp_types.go 的 struct tag 里加 +kubebuilder:validation:*),status 字段更新必须用 Status().Update() 单独调用,不能混在普通 Update 里。









