看啥推荐读物
专栏名称: 运维进阶部落
分享网络管理、网络运维、运维规划、运维开发、Python运维、Linux运维等知识,推广围绕DevOps理念的自动化运维、精益运维、智能运维等优秀实践,让运维工程师在这里能够得到成长。
今天看啥  ›  专栏  ›  运维进阶部落

运维加薪技术——SRE方法论

运维进阶部落  · 公众号  ·  · 2024-02-16 14:07
确保长期关注研发工作所有的产品事故都应该有总结,无论有没有触发报警。在保障服务SLO的前提下最大化迭代速度错误预算,发布策略。监控系统alert、ticket、logging。应急事件处理MTTF + MTTR预案 playbook 最佳方法变更管理:70%的生产事故来自变更而触发采用渐进式的发布机制迅速而准确地检测到问题的发生当发现问题时,安全迅速地回退变动需求预测和容量规划:自然增长 + 非自然增长必须有一个准确的自然增长需求预测模型,需求预测的时间应该超过资源获取的时间规划中必须有准备的非自然增长需求来源的统计必须有周期性的压力测试,以便准备地将系统原始资源与业务容量对应起来资源部署变更管理与容量规划的结合物。效率与性能持续的优化资源利用率,有效地降低系统的总成本根据一个预设的延迟目标部署和维护足够的容量我是一名软 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照