看啥推荐读物
专栏名称: 数据分析与开发
伯乐在线旗下账号,分享数据库相关技术文章、教程和工具,另外还包括数据库相关的工作。偶尔也谈谈程序员人生 :)
今天看啥  ›  专栏  ›  数据分析与开发

最新 Hive 的高频面试题新鲜出炉了!

数据分析与开发  · 公众号  · 数据库  · 2021-04-17 12:00
导语最近也是到了准备面试的时候了,于是整理了一些关于Hive的常问的面试题于是跟大家分享下,预祝大家新的一年升职加薪,好好把握金3银4的机会,工资涨涨涨!1、Hive的两张表关联,使用MapReduce怎么实现?         如果其中有一张表为小表,直接使用map端join的方式(map端加载小表)进行聚合。          如果两张都是大表,那么采用联合key,联合key的第一个组成部分是join on中的公共字段,第二部分是一个flag,0代表表A,1代表表B,由此让Reduce区分客户信息和订单信息;在Mapper中同时处理两张表的信息,将join on公共字段相同的数据划分到同一个分区中,进而传递到一个Reduce中,然后在Reduce中实现聚合。2、请谈一下Hive的特点,Hive和RDBMS有什么异同?       ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照