字节跳动,5面,终于拿下!
前
言
导读:没有几个工程师天赋异禀,技术的差距,是认知的差距。文笔差多包涵,希望对你有用。谢邀!
大家好,我是宝器。
看到一篇分析师友军数仓同学的面试经验,分享给大家。
主要和大家分享字节跳动-抖音的大数据数仓职位面试经验,希望对大家有用。以下是作者自述。
因前司[不知名小公司]发生人员动荡,人心惶惶,鄙人也下定决心看看外面的机会,骑驴找马,开启了一波面试。先后面了一些中小型公司,找到感觉后又面试了滴滴、美团、快手、京东、字节等“大厂”。
面试陆续用了差不多一个月,整体感觉下来面多了发现面试差不多也就那些问题。更多时候更是时运的一个碰撞,公司项目恰很缺人或和面试官对上眼缘基本能成。
单说面试字节,前前后后,历经5面(4轮技术+HR面),历时20天,终于拿下offer。感觉整个人都自信了,职级和薪酬都很满意,奥利给!
一面:
00. 自我介绍
01. 数仓痛点?为什么要做3.0?数仓3.0流程是怎样的?
02. 数据倾斜,大表join大表,如何解决有哪几种方式?
03. 数仓分工?如何迭代3.0进度,对接需求?
04. 数据质量如何保证?指标一致性如何保证?
05. 用到哪些计算组件,分别有什么异同?
06. ods全量,增量如何确定?有哪些衡量点?
07. 两道sql题,粉丝互相关注,波峰波谷
08. 一道算法题,链表反转o(1)
09. 数仓模型优化手段及方式、规范与规划
10. 数据中台的理解,极致的数仓分层?
二面:
01. MR如何自定义partition,原理讲一下
02. 数仓模型,如何是最优的?怎么衡量的?
03. 遇到的业务夸N天,如何解决的?你们公司的场景,模型怎么设计?
04. RDD特性
05. spark的运行机制,job,stage,task划分
06. spark shuffle 与 mr shuffle 不同
07. 一道sql题,行转列,
08. 一道算法题,2分查找o(0)
09. 结合项目+业务场景各种灵魂拷问,深层次追问
10. 数据治理方案、实施、权责、收益与风险点
时间:此面试为一面后第二天上午11点。
感受:二面就会从3个方向问,数仓专业知识(理论+实际场景),大数据组件,以及各种语言的摸底。
把内裤都扒出来了,最后还会问有哪些你擅长我没有问到的,就是要知道你的擅长点,好给你安排工作。
三面:
01. 主要负责哪些?会一步一步追询问
02. order by sort by 区别 ,底层原理是什么?
03. 有哪些计算引擎,你们工作中如何选取与运用?
04. presto 与 spark 区别,多方面讲解
05. 项目中有遇到复杂的场景是什么?怎么处理的?你觉得好吗?还有一次机会你会怎么处理?
06. 觉得主要擅长哪些?举例两点?
07. 主题是如何划分的?具体case
08. 抖音中如何确定学生群里用户?
09. 如何确定分区数?
10. 一道sql,千亿级uv计算
11.一道算法归并排序o(1)
时间:此面试为二面后第三天上午11点。
感受:三面就技术+架构+职责都会问一下,面上的东西也会结合实际的工作场景。
四面:
01. hdfs了解吗?整体讲一下,block的大小是多少?哪个版本?之前的是多少?用哪个参数控制?
02. 为什么block设置为128mb,之前为什么是它size一半,为什么不调大
03. 数仓主要做哪些事情,你的主要推进了什么?
04. dwd、dws 的英文是啥?各层都做了哪些事情?
05. MR阶段的kvbuffer缓冲区了解吗?它的价值体现在哪里?
06. sql如何转化为MR,整体流程讲一下
07. sql提交yarn的流程
08. 如何控制map个数
09. 写一道sql,性能最优,为什么最优,有几个job,几个mr,如果我想降低job,mr数量,怎么写
10. 讲一个你比较擅长的,把我讲通
时间:此面试为三面后第三天上午11点。
感受:这个等于前面的人面过的再问问,这面是交叉面试,所以会都问问,如果能达个大概都没有问题。要态度好点。
五面:
HR面,聊下三观、谈下理想与职业规划等;然后就是最重头戏了:谈薪酬。以前没待过大厂,所以对职级和薪资没有很好地了解,,以防要低了后面后悔。到了这一面了,属于自己的该争取的还是要奋力争取的。
整体总结
首先面试这么多家、这么多场,字节的数仓面的是最全最细致的,态度是最好的,引导式问体感很nice。
其次,就是专业度,字节的人有一说一确实都很专业,至少面试官,没有那种水平一般都很强。
然后就是个人了,没说的,干数仓要精通,知其所以然很重要,其次要技术栈丰富一些,不能仅仅停留在数仓。
最后本人是面试抖音,面试也要看专业是否对口,然后眼缘运气也会占一定程度,最后祝大家面面过,家家斩offer。希望以后有机会大家做同事。
推荐阅读
欢迎长按扫码关注「数据管道」