看啥推荐读物
专栏名称: AI前线
InfoQ十年沉淀,为千万技术人打造的专属AI公众号。追踪技术新趋势,跟踪头部科技企业发展和传统产业技术升级落地案例。囊括网站和近万人的机器学习知识交流社群。
今天看啥  ›  专栏  ›  AI前线

为什么已有Spark和Dask,阿里还要开源自研分布式科学计算引擎Mars?

AI前线  · 公众号  · AI  · 2019-09-16 18:00
作者 | 蔡芳芳 采访嘉宾 | 斯文骏 编辑 | Natalie AI 前线导读: 随着数据应用类型的愈加丰富和数据规模的不断扩大,单机早已无法满足超大规模数据计算和分析的需求,分布式才是如今大数据领域的核心关键词。作为数据分析领域非常优秀的 Python 计算库,Numpy、Scipy 能够非常高效地执行单机数值计算,但却无法支持分布式计算,难以满足对海量数据进行分析的需求。为了解决这一痛点,涌现了一批为分布式场景下大规模数据科学计算而生的新计算库 / 计算引擎,比如 Numba、Dask、谷歌开源的 JAX、阿里开源的 Mars 等。阿里的 Mars 自开源之初,就经常被拿来与 Dask 做对比,或被看作 Numpy 的替代者,那么 Mars 与 Dask 到底有何不同?Mars 的终极目标真的是要取代 Num ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照