0

0

站点可靠性工程师的深度工作

betcha

betcha

发布时间:2024-06-04 15:08:39

|

937人浏览过

|

来源于DZone

原创

深度工作是指在不受干扰的情况下专注于认知任务,例如自动化、提高可观察性、解决难题和流程改进。这对于提高工作意义感、促进心流状态和创造价值至关重要。对于 sre(站点可靠性工程师)来说,自动化、建立即时访问系统、规划项目和划分时间段等策略可以帮助他们减少浅层工作,从而腾出更多时间进行深度工作。这些策略通过促进专注、减少随机性和提供学习时间,有助于创造一个有利于产生影响和工作满意度的环境。

站点可靠性工程师的深度工作

什么是深度工作?

我们先来看看什么是深度工作。深度工作的概念是由卡尔·纽波特在他的著作《深度工作:在分心的世界中专注成功的规则》中提出的。在书中,卡尔·纽波特将深度工作定义为不受干扰地专注于一项需要认知的任务。与深度工作相反的是浅层工作,卡尔·纽波特将其定义为可以在分心时完成的后勤类任务,例如易于复制的工作协调和沟通任务。 

深度工作为何重要?

首先,深度工作是有意义的,让人感到满足的。根据盖洛普最近的一项调查,美国员工敬业度创下了历史新低,原因是他们对组织的了解程度和满意度较低。深度工作可以帮助解决这个问题。

其次,深度工作可以为心流状态铺平道路。研究发现,心流状态可以带来幸福。  

最后,深度工作是有回报的。从事需要认知的工作会给团队和组织带来价值,而这反过来又会为从事深度工作的个人带来晋升和经济奖励。正如卡尔·纽波特所说,“深度生活才是美好的生活。”

现在,让我们看一下对 SRE 具有认知要求的一些活动、可以被视为浅层活动的活动,以及 SRE 团队可以采用的一些策略,以在 SRE 团队内部促进深度工作。

对于 SRE 来说,哪些任务需要较高的认知要求?

以下是 SRE 团队可以执行的一些认知要求高的任务,以对组织产生更大的影响:

1、自动化和构建服务:开发良好的自动化以消除繁琐工作、提高管理基础设施的效率并降低成本是一项需要认知的任务。为后端团队开发的代码库做出贡献对 SRE 来说也是一个很好的机会,并且是一项需要认知的任务。

2、提高可观察性:站点可靠性工程师的另一项认知要求高的任务是提高系统的可观察性。这可以通过设计和创建可用的仪表板、调整警报以提高信噪比、检测代码库以发出有用的指标等来实现。

3、调试和解决影响生产系统的难题:在时间压力下解决影响生产系统可用性的难题是另一项需要认知能力的任务。  

4、改进流程:改进变更管理流程、事件管理流程等流程以提高团队的整体效率,改进 SLO 可能是另一项需要认知能力的任务。

5、改进文档:编写好的文档可能会产生影响,但需要集中精力才能完成。好的文档包括可用的故障排除指南、标准操作程序、架构图等。

6、学习新的技术技能:持续学习是做好 SRE 工作的关键。学习新的技术技能并跟上生成式 AI 等最新技术趋势也需要一定的认知能力。

SRE 在进行深度工作时面临哪些挑战?

以下是 SRE 在运营业务时需要执行的一些浅显任务,这些任务使他们很难进行深度工作:

1. 部署和升级

这些是业务必不可少的活动,但本质上往往是重复性的。根据团队内部的自动化水平,SRE 会花费一些时间在这些活动上。

2. 回答其他工程师的问题

通过来自其他团队的随机问题对 SRE 团队成员进行随机化可能会有所帮助,因为 SRE 团队往往对生产系统和基础设施有更深入的了解。

3. 生产访问请求

在许多团队中,只有 SRE 团队才能访问生产系统,以维护生产环境的稳定性。后端工程和数据工程团队等团队成员可能会中断 SRE 以从生产系统获取信息,用于各种目的,例如调试问题等。

4. 由于值班和生产问题而导致的随机化

SRE 往往对生产系统有全面的了解,即使 SRE 不在值班轮岗中,也经常会被拖入各种值班问题中。这会占用他们处理重要项目的时间。

深山旅游网站管理系统
深山旅游网站管理系统

旅游网站管理系统是由深山工作室自主研发而成,具有以下相应的功能.1. 旅游新闻发布,站内新闻发布2. 发布旅游线路详细信息.包括:线路名称、线路类型、线路报价、游完整条线路所需时间、线路说明、线路途经景点、行程安排及其它备注。3. 旅游景点介绍推广4. 旅行社加盟介绍系统.包括:各个旅行社可以发布自己的旅游线路.管理留言,发布信息(vip,会员)5. 酒店宾馆加盟介绍系统,酒店宾馆发布客房信息(v

下载

5. 会议

开会会产生很多开销。对于 SRE 角色来说,有时很多人会加入试图解决问题的电话会议,这些电话会议往往会很长,很多工程师在很长一段时间内只是充当旁观者。

6. 回复电子邮件并回复团队/Slack 聊天

这是知识经济中大多数工作人员的常见活动,SRE 也不能幸免。回复电子邮件和聊天会不断打乱 SRE 的时间,并分散他们对重要工作的注意力。

SRE 可以采用哪些策略来促进深度工作?

现在让我们看一下 SRE 团队可以采用的一些策略,以最大限度地减少花在浅层工作上的时间并将这些时间花在深度工作上:

1.投资自动化

SRE 团队应优先投入时间进行自动化,以消除繁琐的工作并减轻部署、升级等各种活动的运营负担。创建具有内置自动验证的强大持续集成和持续部署管道将减少在这些活动上花费的时间。目标应该是为开发团队提供必要的工具,以便他们能够通过升级和部署进行自助服务。SRE 团队管理层应规划项目,以便为此类项目分配适当的资源。

2. 建立即时访问系统

具有适当审计跟踪和批准流程的即时访问系统可以帮助 SRE 团队以外的人员获得对生产环境的适当访问权限,从而帮助 SRE 团队不必花时间为其他人提供影子访问权限,而可以专注于深度工作。

3. 积极规划项目

SRE 团队可以实施适当的项目管理来优先执行重要工作,例如提高关键生产服务的可观察性。

4. 与研发和后端工程团队共享待命负载

与后端工程团队共享值班负载,同时让 SRE 团队专注于改进工具和文档,并培训其他人如何有效地处理值班问题也会有所帮助。

5. 遵循高效的值班轮换和事件管理流程

按照高效的值班轮换制,即当周只有负责值班的工程师处理大部分值班问题,这样其他工程师就可以专注于专门的项目,并使团队的其他成员能够进行深度工作。拥有清晰易懂的故障排除指南将有助于实现这一目的。

6. 划分时间段,专注于重要项目

从个人层面来说,SRE 团队的各成员可以在日历上留出时间专注于重要项目,以避免随机化。  

7. 提供持续学习的时间和资源

为 SRE 团队成员提供学习和探索新技术的时间,以及实施这些技术来解决可靠性问题的自由,这是促进学习的好方法。此外,提供在线学习服务和书籍订阅也是一个好主意。

8. 允许 SRE 从事他们选择的项目

允许 SRE 团队成员从事他们选择的项目将是鼓励他们进行深度工作的好方法。例如,编写最终用户使用的功能、试验新技术以及在不同的团队中工作都是实现这一想法的一些方法。众所周知,谷歌允许所有员工将 20% 的时间花在他们选择的项目上。实施这样的政策将是鼓励深度工作的好方法。 

结论

通过遵循本文讨论的策略,站点可靠性工程师可以致力于进行深度工作并获得快乐、满意和有意义的工作,同时对组织产生更大的影响。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

66

2025.12.13

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

22

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

48

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

93

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

216

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

413

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

143

2026.03.04

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

221

2026.03.03

C++高性能网络编程与Reactor模型实践
C++高性能网络编程与Reactor模型实践

本专题围绕 C++ 在高性能网络服务开发中的应用展开,深入讲解 Socket 编程、多路复用机制、Reactor 模型设计原理以及线程池协作策略。内容涵盖 epoll 实现机制、内存管理优化、连接管理策略与高并发场景下的性能调优方法。通过构建高并发网络服务器实战案例,帮助开发者掌握 C++ 在底层系统与网络通信领域的核心技术。

31

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.5万人学习

Django 教程
Django 教程

共28课时 | 4.9万人学习

NumPy 教程
NumPy 教程

共44课时 | 3.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号