「双非」研究生数据分析春招心路历程。
01
个人情况
基本情况
能力水平
春招情况
02
面经整理
union和union all有何不同?
使用union要满足什么条件?
有两个表,join的时候哪个表放在前面更好【小表,让小表先进内存,可以提高效率】
数据倾斜解释一下原理和解决方案【简单解释mapreduce原理,解决方案按参数设置和改写sql代码两方面讲,其中详细举例了我在实习时候遇到的问题】
衍生问题:有做过文本分析吗?貌似想问L1L2正则化的东西。【没有,爬下来的数据相当规整。至于正则化,我记得是机器学习领域的,没学过不好意思……】
二面
三面
问到自闭,非常怀疑人生……
1、简单介绍自己
2、开问概率统计
京东
(数据分析工程师)
一面
1、简单介绍自己
2、问几个Hive的问题
(2) 数据倾斜的发生原因
(3) Hive文件类型及其不同点,平时用的哪种文件
(4) Hive的常用参数
欢聚时代
(数据分析实习生,日常实习非暑期)
总结
评论