今天看啥  ›  专栏  ›  阿里云开发者

如何做好一名稳定性SRE?

阿里云开发者  · 公众号  · 科技公司  · 2020-10-27 07:58
阿里妹导读:稳定性目前不再局限于大促时的保障和平时的稳定性轮值,越来越体系化。本文基于作者在业务团队工作过程中的沉淀,以及在盒马两年SRE的实战经验,从稳定性心态、监控体系、故障应急体系、资源体系、大促保障机制、日常保障机制等几个层面,就如何做好SRE的工作进行了分享。文末福利:阿里巴巴零售云事业部全渠道团队招聘啦~前言2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫、盒马从事中间件、业务系统、架构等方面的工作,期间一直穿插着负责稳定性和大促的保障工作。我的心态,大致经历过以下几个阶段:low:完全不懂,觉得稳定性就是做 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照