SRE的组织架构
第一代SRE是2016年以前Google内部的团队的,至于他们内部的组织架构是怎么样的,我们其实都不大清楚,Google也从来没有披露过,只是靠着《SRE》这本书推测是一个单独的团队。
第二代SRE就是很多大型互联网公司根据Google书中提示的,建立了一个独立的SRE团队,一般这个团队是归属于运维团队中的。
但是在实际的运行中,有一些问题是需要解决的。比如很重要的一点就是SRE需要去推一些稳定性的事情,需要跟产品和开发团队进行沟通,毕竟做了稳定性的事情后,那产品的功能迭代的事情就要减少。而且也未必很多开发团队愿意干这个事情。因为很多所谓稳定性的事情大部分都是重要但不紧急的。
这个时候需要SRE团队跟产品和开发团队进行沟通和排期。
这个时候如果公司内部各个团队沟通工作做的比较好的情况下,这些事情还是比较好推进的,比如我之前在X信的时候,因为从CTO到底层研发同学都非常关注可用性和成本,同时SRE和运维同学的水平又得到大家广泛认同,这个时候就是容易推进各项事宜的进展。这些可用性项目也是写入到CTO和各个研发负责人的OKR中的。
但是如果公司内部各个团队本来就是各自独立的,比如我在X右的时候,各个研发负责人各自维持一摊事情,就算是CEO来管也未必听。那你说这个事情应该怎么推进了。在强力推进了几个事情后,发现了这些问题,很多事情只能私下跟人好好聊聊,聊通了之后再名义上走一遍流程。但是后面发现在老板的OKR上也很少有这些事情。


