看啥推荐读物
专栏名称: 数据分析与开发
伯乐在线旗下账号,分享数据库相关技术文章、教程和工具,另外还包括数据库相关的工作。偶尔也谈谈程序员人生 :)
今天看啥  ›  专栏  ›  数据分析与开发

美团 DB 数据同步到数据仓库的架构与实践

数据分析与开发  · 公众号  · 数据库  · 2018-12-10 20:15
(给数据分析与开发加星标,提升数据技能)来源:美团技术团队tech.meituan.com/binlog_dw.html背景在数据仓库建模中,未经任何加工处理的原始业务层数据,我们称之为ODS(Operational Data Store)数据。在互联网企业中,常见的ODS数据有业务日志数据(Log)和业务DB数据(DB)两类。对于业务DB数据来说,从MySQL等关系型数据库的业务数据进行采集,然后导入到Hive中,是进行数据仓库生产的重要环节。如何准确、高效地把MySQL数据同步到Hive中?一般常用的解决方案是批量取数并Load:直连MySQL去Select表中的数据,然后存到本地文件作为中间存储,最后把文件Load到Hive表中。这种方案的优点是实现简单,但是随着业务的发展,缺点也逐渐暴露出来:性能瓶颈:随着业务规模的增长,S ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照