今天看啥  ›  专栏  ›  阿里云开发者

我在淘宝写SQL|ODPS SQL 优化总结

阿里云开发者  · 公众号  · 科技公司  · 2024-04-29 17:15
阿里妹导读本文结合作者多年的数仓开发经验,结合ODPS平台分享数据仓库中的SQL优化经验。写在最前面ODPS(Open Data Processing Service)是一个海量数据处理平台,基于阿里巴巴自主研发的分布式操作系统(飞天)开发,是公司云计算整体解决方案中最核心的主力产品之一。本文结合作者多年的数仓开发经验,结合ODPS平台分享数据仓库中的SQL优化经验。背景数据仓库,是一个面向主题、集成的、随时间变化的、信息本身相对稳定的数据集合。数据仓库从Oracle(单机、RAC),到MPP(Green plum),到Hadoop(Hive、Tez、Sprak),再到批流一体Flink/Blink、数据湖等,SQL都是其主流的数据处理工具。海量数据下的高效数据流转,是数据同学必须直面的一个挑战。本文结合阿里自研的ODPS平台,从自身工作出发,总结SQL的一些优化技巧。基础知识1、Hive SQL的执行过程Hive SQL的编译到 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照