面了几个大厂的数据分析师岗,这次感觉有戏...

Python学习与数据挖掘

共 3196字,需浏览 7分钟

 · 2024-04-11

推荐关注↓
加入 城哥知识星球 ,解惑答疑,告别迷茫

最近,我们组织了一场数据分析岗技术&面试讨论会,邀请了一些互联网大厂同学、参加社招和校招面试的同学,针对新手如何入门数据分析岗、该如何备战、面试常考点、面经分享等热门话题进行了深入的讨论。

今天我整理后分享给大家,希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以加入我们星球。

小红书

岗位:数据分析

数据相关

  1. 项目中不平衡数据如何处理

2 .项目中数据量的大小

  1. 项目中数据的特征介绍

  2. 什么是hard样本什么是easy样本

机器学习相关

  1. Boosting 和 bagging的区别

  2. 决策树的分裂的计算(ID3, C4.5,CART)

  3. Adaboost 和 GBDT 的区别

  4. Adaboost 和 GBDT的损失函数

  5. Xgboost 和 GBDT的区别

  6. Boosting 和 Random Forest Tree 的区别

  7. 梯度下降和随机梯度下降的区别

  8. 逻辑回归,svm和树模型的区别

  9. 项目中为什么选择GBDT而不是adaboost

  10. 采用什么作为模型好坏的评判标准(accuracy, f1-macro)

  11. 降维的方法

  12. 树模型如何调参

  13. 如何检测模型是否过拟合

  14. 如何减少过拟合现象的产生

深度学习相关

  1. Attention 和 self attention的区别

  2. 介绍一下Transformer

  3. Bert提升了transformer的哪些东西

  4. BERT比RNN好在哪里

  5. RNN, LSTM, BERT的优缺点

  6. 梯度消失和梯度爆炸产生的原因

  7. 如何解决梯度消失和梯度爆炸

  8. 介绍一下推荐系统的算法(协同过滤,基于内容的推荐)

字节

岗位:数据分析

一面

  1. 自我介绍

  2. 一个数据分析的项目—要求:增长策略

1)背景是什么?

2)指标分子分母是什么

3)衡量指标是什么?

  1. 三个指标来评估抖音的发展状况

  2. 人均播放量下降,应该如何排查  --经典题

  3. 是否增加一个广告位,如何衡量正向,负向的影响

  4. 如何确定AB测试的最小样本量?公式里的具体参数

  5. 如何判断实验组是好是坏?什么指标?做什么检验

  6. 什么时候用Z检验,T检验

  7. 广告收入增长,但用户留存下降,如何判断是否上线?量化收益?

  8. LTV如何与广告收入结合?

  9. 如何计算用户LTV

  10. 如何计算LT,生命周期

  11. SQL题

  12. 自己的职业规划

  13. 觉得自己做数分最大的优势是什么?

一面对于基础知识的考察还是比较细的,面试官也比较严厉,没有反问机会

二面

  1. 之前有过实习经历吗

  2. 除了业务以外,在做数据分析还有哪些需要提升的地方   --啊?是不是被人反问的问题

  3. 抖音人均使用时长下降

  4. 同学如何评价你

  5. 你自己怎么形容你自己

  6. 头条:添加功能应该添加哪一个?

  7. 头条:去掉一个功能

  8. 预估上海有多少二手房门店的数量(多种方法)

二面的考察比较侧重业务,但是几乎没什么挖的,感觉有一点点套路化。面试官比较亲切。

三面

  1. 自我介绍

  2. 总实习的时长有多长,哪段时间最长

  3. 每个实习公司都是做什么的

  4. 从数据分析的角度来看,你认为哪个公司的环境更好

  5. 介绍一个项目

  6. 对行业的了解

  7. 从带你的人学到的东西是什么?---重点题

  8. 在学校成绩是怎么样的

  9. 对自己的未来规划是怎么样的

三面应该是大佬级别的人,很有领导范😉整体面试思路很有逻辑。

HR面

  1. 自我介绍

  2. 实习过程中最有成就感的一件事   --HR的拿手问题张口就来

  3. 有没有想要放弃的时候 --这熟悉的感觉他又来了

  4. 还投递了哪些公司?为什么会投递这个公司 

  5. 为什么投递字节?认为字节和自己有哪些相似之处

  6. 认为商业分析和数据分析有哪些区别

淘天

岗位:数据分析

一面

  1. 自我介绍

  2. 实习内容

  3. 实习团队架构

  4. map reduce原理

  5. 数据倾斜有没有遇到过?怎么解决

  6. ab实验原理、流程、如何分析

  7. 假设检验原理

  8. 口述sql题目:求连续登陆三天的用户

  9. 假设检验概率论场景题:求置信区间

  10. 常用的机器学习算法

  11. 随机森林原理

  12. 求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程)

  13. 反问

二面

  1. 自我介绍

  2. 实习深挖:项目技术难点怎么解决的?有什么效果?收获

  3. 怎么分析指标下滑

  4. spark的宽窄依赖

  5. 手撕:3道二叉树

  6. 反馈推进下一面 但是前面人太多

  7. 反问

滴滴

岗位:数据分析师

一面

  1. 自我介绍

  2. SQL题目,1-7日的留存率,就是当天登录后在接下来一周内登录过的人

  3. 异动分析,如果这个留存率增加30%,怎么分析。追问怎么判断主要因素

  4. AB,问设置的步骤,怎么确定样本量,如果实验不显著怎么办。。。

  5. py做过什么项目,提了一下模型

二面

  1. 异动分析,订单呼叫量下降怎么归因

  2. 你觉得自己做数据分析师有什么优势,为什么选择这个行业

  3. 3-5年内希望自己在这个行业成为一个什么样的人

  4. 介绍部门,问喜欢的工作氛围

  5. 实习中最有成就感的事情

三面

  1. 自我介绍

  2. 细问实习

  3. 主要是归因,指标体系、AB那些

  4. 怎么判断能不能在一个新城市开展业务

  5. 怎么估计一个新城市的业务需求量

  6. 手上offer

- EOF -

作者简介


城哥,公众号9年博主,一线互联网工作10年、公司校招和社招技术面试官,主导多个公司级实战项目(Python、数据分析挖掘、算法、AI平台、大模型等)


关注我,陪你一起成长,遇见更好的自己。

星球服务


会不定期发放知识星球优惠券,加入星球前可以添加城哥微信: dkl88191 ,咨询优惠券问题。

加入知识星球,可以享受7大福利与服务:免费获取海量技术资料、向我 1 对 1 技术咨询、求职指导,简历优化、历史文章答疑(源码+数据)、综合&专业技术交流社群、大模型技术分享、定制专属学习路线,帮你快速成长、告别迷茫。



原创不易,技术学习资料如下,星球成员可免费获取,非星球成员,添加城哥微信:dkl88191,请城哥喝杯星巴克。







浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报