今天看啥  ›  专栏  ›  三墩IT人

SRE生产演练之天罡北斗阵

三墩IT人  · 公众号  ·  · 2018-12-19 15:08
戳上方蓝字关注我们吧背    景作为一名SRE,最盼望的就是系统7*24稳定了,但是“死亡”墨菲定律往往是怕什么来什么:当你正对着业务大屏拜佛的时候,某个系统业务量突然急速下降了,高可用机制又刚好失灵,更雪上加霜的是,早先准备的预案拿出来却发现根本不可用,最后只能一通粗暴的操作——重启、切容灾等,眼睁睁看着系统和业务指标爆表。面对这种情况,有没有办法提前预知或规避呢?当然有!下面就分享一下浙江移动SRE生产演练之天罡北斗阵的“修炼秘籍”。解决方案随着微服务架构改造的完成,浙江移动业务支撑系统越来越趋向于分布式,具备独立功能的系统不下百来个,每个系统的实例个数少则几十,多则上百,业务链路的复杂度也随之呈指数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照