Zabbix与Prometheus读完本文,你将收获两者适用于多大规模的监控场景?超过5000以上监控节点时怎么办?高可用怎么解决?两者怎么解决存储问题?对于监控信息是否有历史存储和分析,能从历史信息中挖掘到哪些有价值的信息?两者怎么应对告警风暴和误报?在智能监控和自动治愈方面是否有可借鉴的实践?基于什么算法或策略?怎么进行故障预判和预处理?监控大屏是怎么设计的?自动化运维管理是两者同时使用还是二选一更合适?两者在配合使用时,应该怎么分工?怎么落地?如果已经部署了Zabbix,怎么平稳过渡到Prometheus?分布式链路的可观测性和端到端诊断怎么做?大规模场景下,两者的性能和成本哪个比较低?监控,为什么总让我们头痛监控一直都是运维工
………………………………