注册登录

看啥推荐读物

专栏名称: AI前线

InfoQ十年沉淀，为千万技术人打造的专属AI公众号。追踪技术新趋势，跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

知乎回答RSS订阅方法

知乎专栏 RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

爱可可-爱生活 · 【Prompt Fuzzer：用于强化 ...· 17 小时前

爱可可-爱生活 · 【MLC-MiniCPM：基于 ...· 16 小时前

爱可可-爱生活 · 《AI类知识文档全网合集 - 飞书云文档》 ...· 2 天前

宝玉xp · 美国芯片制造的重大失误ASML ...· 4 天前

黄建同学 · 可以关（MO）注（BAI）一下这个大神项目使 ...· 5 天前

今天看啥 › 专栏 › AI前线

如何基于Apache Pulsar和Spark进行批流一体的弹性数据处理？

AI前线 · 公众号 · AI · 2019-06-19 19:00

作者 | yjshen，Anonymitaet 编辑 | Linda 批流现状在大规模并行数据分析领域，AMPLab 的『One stack to rule them all』提出用 Apache Spark 作为统一的引擎支持批处理、流处理、交互查询和机器学习等常见的数据处理场景。 2017 年 7 月，Spark 2.2.0 版本正式推出的 Spark structured streaming 将 Spark SQL 作为流处理、批处理底层统一的执行引擎，提供对无界表（无边界的源源不断到达的流数据）和有界表（静态历史数据）的优化查询，而向用户提供 Dataset/DataFrame API 对批流数据联合处理，进一步模糊了批流数据处理的边界。另一方面，Apache Flink 在 2016 年左右进入大众视野，凭借其当时更优的流处理引擎，原生的 Watermark 支持『Exaclty Once』的数据一致性保证，和批流一体计算等各种场景 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 【Prompt Fuzzer：用于强化 GenAI 应用的开源工-20240419131851

17 小时前

爱可可-爱生活 · 【MLC-MiniCPM：基于 MLC-LLM 开发，将 Min-20240419135846

16 小时前

爱可可-爱生活 · 《AI类知识文档全网合集 - 飞书云文档》网页链接 #机器学习-20240417074500

2 天前

宝玉xp · 美国芯片制造的重大失误ASML 正在推动一项可能是当前世界上最关-20240415120106

4 天前

黄建同学 · 可以关（MO）注（BAI）一下这个大神项目使用简单、原始的 C/-20240414133922

5 天前

故事硬核 · 何伟的最后一课 | 故事硬核

2 年前

伯阳先生-段本司 · 明年姓杨的要瑟瑟发抖了-20201126151149

3 年前

粮油市场报 · 【记者专稿】福建：鼓励种粮，多种每亩奖励300元

3 年前

生信技能树 · 华为寒门博士年薪200万：读书实苦，却是你此生承受最轻的苦

4 年前

云石 · 美前官员呼吁废除中美第三公报意欲何为？

5 年前

关于移动版 · Py中国 · RSS之家 · codingpro · Code · link之家 · 卧龙AI搜索 · 藏经阁 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号