×
<在线客服<
描述
021-53098865


欢迎来到雅菲奥朗官网
欢迎来到雅菲奥朗官网

SRE减少琐事的学习笔记

时间 :2022-07-15 作者 :雅菲奥朗 分类 :SRE百科
琐事是与运行生产服务相关的一种工作,往往是手工的,重复的,可自动化的,战术的,没有持久价值的,并且随着服务的增长呈线性扩展。琐事是与运行生产服务相关的一种工作,往往是手工的,重复的,可自动化的,战术的,没有持久价值的,并且随着服务的增长呈线性扩展。减少琐事需要工程团队时间,需要选择以下工程开发工作,创建外部自动化(例如:服务外的脚本以及自动化工具),创建内部自动化(服务内的自动化),增强自服务等。

一、什么是琐事(Toil)?

琐事的定义 :
琐事是与运行生产服务相关的一种工作,往往是手工的,重复的,可自动化的,战术的,没有持久价值的,并且随着服务的增长呈线性扩展。--Vivek Rau, Google;


以下是琐事的一些特征 :

·   手动

·   手动或者半手动的发布

·   连接到基础架构去检查某些东西

·   经常性的密码重置

·   重复性的工作

·   一遍遍做相同的测试

·   每天早上去确认同一个错误

·   可自动化的

·   产品部署会议

·   手动开始或者重置设备或者组件

·   创建用户

·   非战术/反应式

·   已知的工作变通,例如空间不够,资源不足

·   值班响应

·   没有可持续性的价值

·   导出一些数据

·   手动扩缩容

·   手动扩缩容环境


二、什么不是琐事 ?

·    常规工作例如设置一台新的设备,开发一个新的服务告警以及移除集群等;

·    会议, 社区活动, 规划相关的事情,HR相关事情


三、为什么琐事不好 ?

琐事较多的影响

对于个人而言

对于组织来言

进程缓慢

手动工作以及救急相关工作占据了大部分时间

新功能没有办法快速发布,错过价值机会,团队人手紧张

质量差

手动的工作经常会导致错误,并且会费时间去解决,影响声誉

服务支持超过成本

职业生涯停滞

大部分的重复性工作会导致职位生涯的停滞不前,没有时间发展技能,最好的工程师干最低端的活

声誉受到伤害,不是一个好的工作地,员工离职率变高

损耗的

琐事会让人觉得无心工作

人员流动会导致额外费用和知识流失

永无止境

没有时间去找解决方法,更多的时间花在解决积压的工作上

琐事需要工程团队去解决,如果没有可用的工程团队的时间,那这个问题永远也解决不了.SLA即将被违反.

燃尽

过载工作会导致个人和健康问题

潜在的纠纷和负面宣传

总之一句话,当琐事多到一定程度;那离工程破产就不远了。

 

四、如何减少琐事?

·   减少琐事需要工程团队时间

·   需要选择以下工程开发工作

·   创建外部自动化(例如:服务外的脚本以及自动化工具)

·   创建内部自动化(服务内的自动化)

·   增强自服务