看啥推荐读物
专栏名称: CSDN
CSDN精彩内容每日推荐。我们关注IT产品研发背后的那些人、技术和故事。
今天看啥  ›  专栏  ›  CSDN

从年末生产故障解锁RocketMQ集群部署的最佳实践

CSDN  · 公众号  · 科技媒体  · 2021-01-04 17:52
【CSDN 编者按】因为一次生产事故,导致年终奖泡汤!在一番问题查找之后,终于找到了罪魁祸首!MQ集群中某一台物理机内存引发的故障,从而导致系统异常重启,而更关键的问题是,为什么一台Broker由于内存故障重启,10分钟后业务才恢复,即客户端才真正感知Broker宕机呢?作者 | 丁威  责编 | Geek胖丁出品 | CSDN(ID:CSDNnews)笔者比较“悲催”,临近年末笔者维护的生产MQ集群中的一台物理机内存故障导致操作系统异常重启,在10分钟内众多的应用发送客户端出现消息发送超时,事故并定性为S1,笔者的“年终奖”。。。故障描述RocketMQ 集群采取的部署架构为2主2从,其部署架构如下图所示:其部署架构中一个非常明显的特点是一台物理机上分别部署了 nameserver,brok ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照