今天看啥  ›  专栏  ›  数据派THU

独家 | 寻找数据统治力:比较Spark和Flink

数据派THU  · 公众号  · 大数据  · 2019-07-10 19:00
作者:王海涛翻译:张玲校对:王雨桐本文约4700字,建议阅读15分钟。本文首先介绍了Spark和Flink的发展背景、基本架构及其设计特点,然后从数据模型、状态处理和编程模型3个角度进行比较优势和限制,最后介绍Spark和Flink的最新发展。本篇文章属于阿里巴巴Flink系列文章之一。当提及大数据时,我们无法忽视流式计算的重要性,它能够完成强大的实时分析。而说起流式计算,我们也无法忽视最强大的数据处理引擎:Spark和Flink。 Apache Spark自2014年以来迅速普及。它提供了一个适用常见数据处理场景的统一引擎,如批处理、流处理、交互式查询和机器学习。在某些情况下,它的性能是前一代Hadoop MapReduce的数百倍。凭借其高性能的处理和广泛的场景支持,它在大数据开发 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照