专栏名称: 架构师

架构师云集，三高架构（高可用、高性能、高稳定）、大数据、机器学习、Java架构、系统架构、大规模分布式架构、人工智能等的架构讨论交流，以及结合互联网技术的架构调整，大规模架构实战分享。欢迎有想法、乐于分享的架构师交流学习。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Redis：大数据中如何抗住2000W的QPS

架构师 · 公众号 · · 2025-04-14 22:28

文章预览

架构师（JiaGouX）我们都是架构师！架构未来，你来不来？前言在多年的 SparkStreaming 的大数据流处理开发中，除了Kafka， Redis 是用的最多的组件。目前生产有多个redis集群，最大的32节点的集群的key已经达到40亿个，峰值2000万的QPS。 Redis在流处理开发中一共有两种应用场景: 离线更新的维表数据，用于增加流数据的维度信息应用实时更新的状态数据不管是哪种应用场景，最后在SparkStreaming中都需要与Redis进行交互，来完成get、set操作假如SparkStreaming中RDD的时间间隔为1min，那么这个窗口的数据在1min内计算完成才算是"不延迟"。当遇到计算延迟的情况时，如果不与Redis交互，增加core、memory计算资源，或者提高并行度会解决这个问题，之前开发一个1亿/min数据量的SparkStreaming应用中，发现造成计算延迟原因可能是与Redis交互耗费了太多的时间，这时候再增 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博