回归 IT 系统动态存在的本源,平衡质量和变化的矛盾。追溯 的源头,探讨在云计算时代大潮中,我们的业务系统稳定性建设应该何去何从。
一、Google SRE系列丛书
(1)《Google SRE运维解密》
(2)《Google SRE工作手册》
(3)《Google 系统架构解密》
二、作者对《Google SRE工作手册》的总结
1、致力于设定清晰的、量化的服务承诺;
2、通过有限的监控指标,持续地觉知,进入精确的量化管理;
3、轮值人员随时待命,确保实现所做出的服务目标承诺,同时避免过度的人工干预,谨防自动化形同虚设;
三、作者对 SRE 的核心观点
1、可共用的服务才是有价值的服务,而 SRE 的解决方案量化了这个目标,是做什么工作,和工作的优先级排序有了决策依据。
2、2008 年参加首届 O’Reilly Velocity 大会,和 Patrick Debois 相遇, 还没有问世。如果那时第一本 SRE 书已经问世了,社区里如果高举“消除琐事”的大旗的话,DevOps 这个术语甚至不会出现 。
3、对 DevOps 的定义:基于人与人之间的协同,用软件优化人的绩效和运维工作的体验。似乎这也是一个很好的对 SRE 的定义。
4、SRE 从理论到实践都是 DevOps最先进的一种实现方式。
5、认为 SRE 是运维之道是管中窥豹的看法;SRE 实践不仅支持着软件开发,也同时改变这架构、安全性、治理方式等。
6、SRE 将对幻灯片和检查单的依赖,对奢望程序总能正常运行的依赖,越来越多第移到了软件工程、现代化架构和安全理念上来。
四、《Google SRE工作手册》编著小组有话说
1、回顾第一本 SRE 书的由来和反馈。
2、阐述编写第二本 SRE 书的目标:
2.1. 为第一本书增加更多的实施细节
2.2. 打消“SRE 只能在 Google 规模 或者文化中实现”
3、如何阅读第二本书:
3.1. 和第一本书配套阅读
3.2. 第一本书着重与原理和思想,第二本讨论如何应用原理和思想
3.3. 第二本书里包含了大量的传统企业实施案例
3.4. 第二本书一开篇就补充说明和 SRE 与 DevOps 的关系
五、SRE知识体系脑图
六、《Google SRE 工作手册》系列分享之SRE 实践的知识体系梳理的直播视频回放
扫码添加小艾老师的微信,获取直播分享资料哦~
: