专栏名称: Python数据科学
以Python为核心语言,专攻于「数据科学」领域,文章涵盖数据分析,数据挖掘,机器学习等干货内容,分享大量数据挖掘实战项目分析和讲解,以及海量的学习资源。
目录
相关文章推荐
今天看啥  ›  专栏  ›  Python数据科学

算法人必懂的Hive知识-四道Hive面试&笔试题解析

Python数据科学  · 公众号  ·  · 2019-08-14 08:30
点击上方“Python数据科学”,选择“星标”公众号重磅干货,第一时间送达作者:石晓文转自:小小挖掘机近期在不同群里有小伙伴们提出了一些在面试和笔试中遇到的Hive SQL问题,Hive作为算法工程师的一项必备技能,在面试中也是极有可能被问到的,所以有备无患,本文将对这四道题进行详细的解析,还是有一定难度的,希望你看完本文能够有所收获。1、多列转多行第一道题目是这样的:假设现有一张Hive表,元数据格式为:字段:id stirngtim string数据格式如下:a,b,c,d 2:00,3:00,4:00,5:00f,b,c,d 1:10,2:20,3:30,4:40需要变成:a 2:00b 3:00c 4:00d 5:00这道题目是需要把多行转换成多行,有点类似python里面的zip操作。大伙应该都知道hive里有一个常用的一行转多行的函数 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照