0

0

Flashcat来炜:如何把运维的饭碗端稳

WBOY

WBOY

发布时间:2023-06-08 18:42:26

|

1864人浏览过

|

来源于51CTO.COM

转载

flashcat来炜:如何把运维的饭碗端稳

讲坛第1期《​​井源 - 运维几何​​​》和前段时间马驰的《​​是时候让运维集体下岗了​​》在业界引起广泛讨论,运维岗位真的没有前途了吗?如何把饭碗端稳?这一期,我们采访了快猫星云的来炜,来炜是运维破圈创业人士,既然能创业,一定是在行业内有很深的积累的,他会怎么看待这个问题?让我们一起来听一种新的声音!

这里是接地气、有高度的《​​运维百家讲坛​​》第 3 期,开讲!

介绍一下您自己以及现在的公司?

大家好,我是快猫星云的来炜。快猫星云是一家云原生智能运维科技公司,由开源监控工具“夜莺监控”的核心开发团队组成。快猫星云打造的云原生监控分析平台——“Flashcat平台”,旨在解决云原生架构、混合云架构下统一监控难、故障定位慢的问题。

如果想更多了解快猫星云创立背后的故事,大家可以进一步阅读 ITPub 对我的一个专访​​《十年死磕,从一线工程师到CEO》​​,欢迎大家指正。

有些运维老炮反映公司对运维的价值所知甚少,您是怎么给公司讲清楚运维的价值的?

把工作的价值,如何通俗易懂的给公司管理层讲清楚,并取得理解和支持,是所有中后台技术团队普遍面临的难题,否则失业分分钟的事情,运维工作的价值讲清楚更是难上加难。

从我的朋友圈来看,时不时就会看到劝运维下岗/转行的帖子:

  • 比如瑞典马工的​​《是时候让运维集体下岗了》​​​,振聋发聩,开篇就提到:​​明人不说暗话:在云原生和DevOps成熟的今天,运维作为一个岗位和团队已经完成了历史任务,应该退出舞台了。​
  • 再比如带我入行的井老板,在 SRETalk 第一期中,用心良苦的劝导:​​随着科技的发展,时代的变化,一个岗位的消亡是很正常的事情,及时做好调整和规划才是思考的重心。​

但是,运维这个岗位以及背后的运维人,从来都是一次次站在要被淘汰的边缘徘徊,又一次次倔强的起死回生,柳暗花明。他们往往乐于自嘲、主动拥抱危机、敢于求变。回想下,近十年来,云计算也好、云原生也罢、DevOps 也算,SRE 也行,所有这些 IT 的大变革,都是尝试在不断优化和改进“大运维”这个领域。运维这个行业没有消亡,反而是不断进化,生发出了新的内涵。

这说明了什么?说明运维很重要,说明运维也很难!但是如何把这个价值说清楚,我们从站位、目标设定、投入产出比上来分别着手分析,下个问题见。

您觉得运维工作最重要的几个目标是什么?您是怎么落地这些目标的?运维的价值如何更好的得到体现?

聚焦经典的运维领域,最主要的几个工作职责

  1. 代码发布和交付(delivery),做好最后一公里的价值交付;
  2. 提升架构的可伸缩性(scalability)并付诸实施;
  3. 保障系统的稳定性(reliability)并不断改善;
  4. 在满足前三项目标的同时,不断优化并降低系统的运行成本(finops)。

如果你发现自己的工作,并不是围绕着以上范畴展开,那么有两种可能,你不是运维或者你的工作超纲了!

明确了工作范畴,说大点就是明确了运维的使命之后,设定目标就相对容易些了,比如:

  1. 针对代码发布和交付,可以简单的用发布次数来度量;
  2. 针对系统的伸缩性,可以用扩容的时效性来度量;
  3. 针对稳定性,我们可以通过观察核心功能的不可用时长来度量;
  4. 针对系统运行成本,我们可以计算到每完成一笔核心交易所花费的资源成本和人力成本来表示和追踪。

关于如何体现运维的价值

首先我们运维人要转变的是态度和立场:坚定和业务站在一起,争取共背业务目标。

我举个例子,HR部门,也是属于公司内部后台的不能再后台的部门了,但是我所接触过的优秀的hr中,不管是recruiter、还是hrbp,从来都是把自己当作业务部门的一份子,把业务部门的目标当作自己的目标。当立场一致,大家都是自己人的时候,价值就好说了。

其次,价值这个事情,永远都是和“成本投入”相对应的。你如果组建了一个很大的运维团队,人力成本在公司很显眼,那么你就很容易成为老板眼中的“重点关注对象”,也会受到业务方更苛刻的挑战,正所谓,楚人无罪怀璧其罪:) 客观上来讲,运维团队的资源投入,一定是要和业务收入相匹配的,过高过低都是不健康的,不利于团队发展的。所以,“运维的价值创造”最后会落到运维效率的竞争上来。

最后,关于价值,定量和定性的描述都得有。譬如和行业水平的定量对比,来自公司内业务部门满意度调查的定量数据。也要有比如对公司战略项目支撑中的“存在感”这些定性数据。

ChatGPT这样的AI能力您觉得未来是否有可能解决运维行业的问题?

首先我们看看,ChatGPT的核心优势是什么?ChatGPT,在知识的丰富度、自然语言理解能力(以及上下文理解)、内容生成能力方面,有着代际的革新。

得到AI工具箱
得到AI工具箱

发现好用的AI工具

下载

然后,我们再分析下运维行业的核心问题是什么?

  • 是缺少领域知识吗?
  • 是交互效率低吗?
  • 是内容输出难吗?

以上都不是,运维行业所处理的问题,本质上还是一个系统性的工程问题,是为了解决IT系统价值快速交付的问题、解决伸缩性的问题、解决稳定性的问题、是不断提高系统运行维护性价比的问题。

目前来看,云计算、微服务对于运维行业的改变来的要更实质性一些。ChatGPT能有效改善运维行业知识沉淀的问题,或许会很快代替一些初级的运维架构师岗位。

工具选型这块,到底是自研,还是使用开源,还是使用商业产品,是如何抉择的?

这个问题没有绝对的答案,从我个人的从业经验来看,大概有以下几种情况:

自研的好处

  1. 心理上的自主可控感会更强一些;
  2. 短中期维度来看,对于团队的发展空间会更有利;
  3. 能根据自己的实际情况进行有针对性的、灵活的设计。

自研的弊端

  1. 时间成本很高,会造成较长一段时间拖后腿的情况,给业务的发展带来一定的影响;
  2. 人力成本高,以北京为例,要招聘一位相对资深的工程师,每年的薪资大概在50万,如果要自研相关运维工具到成熟,投入两位工程师还是需要的;
  3. 受限于研发人员的认知,自研容易和行业最佳实践脱钩,长期会造成内部工具落后于时代。

开源和开源二次开发

好处是能很快见效,投入生产。

坏处有三:

  1. 开源工具一般注重灵活性,功能上也比较聚焦,在产品化和用户体验上通常比较欠缺,拿来快速使用存在体验方面的问题;
  2. 写代码的朋友大家都有个体会,完全读懂和理解别人的代码和自己开发一套,难度其实是相当的,所以开源项目投入到生产环境,也是要投入足够的人力和时间去掌握的;
  3. 大多数针对开源项目的二次开发,会导致和社区主干脱钩,导致无法顺利升级到后续的最新版本,享受不到开源项目真正的红利。

使用商业产品和解决方案

优势:

  1. 时间成本优势明显,借助商业产品能够快速敏捷的支持业务的发展需要,首先做到不拖后腿!
  2. 原则上来讲,商业化产品的成本相比自研会有数倍的降低。这个成本差距是由商业模式决定的。商业产品能盈利的根本原因就是产品研发成本(加上销售成本)随着客户数量的增加而摊薄,否则这个公司没有存在的意义和可能;
  3. 商业产品的核心竞争力包括领域know-how、极致的产品体验、良好的技术支持和服务共同构成的,这通常意味着采用商业产品的技术团队会在公司业务方取得更好的口碑。

不足:

  1. 国内tob领域起步较晚,目前阻碍客户采用商业化产品最大的问题是缺少极致好用的产品,以及价格优势还不明显;
  2. 很多甲方客户技术历史包袱较重,个性化方案多,商业化产品往往很难做到完全匹配,导致客户不得不硬着头皮选择自研。

业内有观点认为云计算和Kubernetes这样的基础设施的崛起会让运维岗位逐渐消亡,您是怎么看待这样的观点呢?

诚然,云计算、K8s的出现,核心是为了改进“运维”这个行业,对运维行业的工作方式发生了重大影响。比如:

  • 以前的 clickops 逐步过渡到 IaC
  • 传统监控升级为更全面的可观测性体系
  • release 也从大版本定期发布变成了更敏捷的持续集成
  • 老中医式的开源软件维护模式,变成了对应的云服务的正确选型和使用
  • 扛机器上架的体力活变成了简单的控制台分分钟开通
  • 手敲命令配置网络路由的专家工作转变成云服务的各个网络产品的组合搭配
  • 从物理机混部提升利用率转变为采用微服务、云原生架构成本天然下降

我们看到,运维工作的内涵并没有变,工作的价值也并没有变弱,只是运维要掌握的技能树在升级。运维人继续保持危机感、保持主动求变精神、立足服务好业务,就能永立潮头,处处柳暗花明。

可选的监控工具有很多,用户选择贵司的 Flashcat 平台,理由是什么?

的确,开源的、商业化的监控平台有很多,我之前也写过一篇博客:​​《二十年里12个开源监控工具大对比》​​,大家可以参考。

回到为什么选择Flashcat平台,需要从监控系统的发展趋势以及Flashcat平台的特点说起。监控系统的发展趋势,可以参考我之前的博客文章 ​​《云原生监控的十大特点和趋势》​​。而Flashcat平台,正是面向这些趋势而生的针对性的解决方案:

  1. Flashcat面向更广泛多元的用户群:从面向运维工程师群体到面向全体研发、运营、CTO/CIO,Flashcat 让监控分析、信息拉齐如此简单;
  2. Flashcat与业务指标密切联动:当业务受损时,Flashcat 总能第一时间发现,并和 IT 系统深入联动,辅助技术团队快速展开调查;
  3. 云原生、混合云统一监控:无论采用什么样的 IT 架构,您只需要一套 Flashcat 平台。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Docker容器化部署与DevOps实践
Docker容器化部署与DevOps实践

本专题面向后端与运维开发者,系统讲解 Docker 容器化技术在实际项目中的应用。内容涵盖 Docker 镜像构建、容器运行机制、Docker Compose 多服务编排,以及在 DevOps 流程中的持续集成与持续部署实践。通过真实场景演示,帮助开发者实现应用的快速部署、环境一致性与运维自动化。

37

2026.02.11

Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务
Golang云原生微服务Kubernetes_Golang怎么集成Kubernetes开发云原生服务

Golang云原生微服务Kubernetes (K8s) 是指 使用 Go 语言(Golang)编写的云原生微服务,并利用 Kubernetes 平台进行容器化部署、自动化管理、弹性伸缩和高效编排的一整套现代应用架构方案。

27

2025.12.22

ChatGPT注册
ChatGPT注册

ChatGPT注册方法:1、访问OpenAI的官方网站,进入注册页面;2、完成注册后收到一份邮件,打开后点击验证账号;3、选择一个适合您需求的订阅计划;4、获得访问ChatGPT的权限即可。

555

2023.09.12

国内免费ChatGPT大全
国内免费ChatGPT大全

ChatGPT是一种基于深度学习技术的自然语言处理模型,由OpenAI开发。它是GPT的一个变体,专门设计用于生成上下文相关的文本回复。ChatGPT被训练成一个聊天机器人,可以与用户进行对话交互。更多关于ChatGPT的文章详情请查看本专题,希望对大家能有所帮助。

611

2023.10.25

手机安装chatgpt的方法
手机安装chatgpt的方法

手机安装chatgpt的方法:1、在ChatGTP官网或手机商店上下载ChatGTP软件;2、打开后在设置界面中,选择语言为中文;3、在对局界面中,选择人机对局并设置中文相谱;4、开始后在聊天窗口中输入指令,即可与软件进行交互。想了解更多chatgpt的相关内容,可以阅读本专题下面的文章。

2995

2024.03.05

chatgpt国内可不可以使用
chatgpt国内可不可以使用

chatgpt在国内可以使用,但不能注册,港澳也不行,用户想要注册的话,可以使用国外的手机号进行注册,注意注册过程中要将网络环境切换成国外ip。想了解更多chatgpt的相关内容,可以阅读本专题下面的文章。

1083

2024.03.05

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

43

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

38

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

35

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10万人学习

Excel 教程
Excel 教程

共162课时 | 19.7万人学习

C# 教程
C# 教程

共94课时 | 10.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号