京东2020届数据分析面试题合集(上)
点击上方“数据管道”,选择“置顶星标”公众号
干货福利,第一时间送达
来源:胖里的日常
整理:胖里
01篇
作者:猛汉翠西 来源:牛客网
1、实习内容,主要就是挖简历里的实习内容
2、介绍一个实习的项目
3、实习工作中遇到的最大的挑战
4、实习项目里有个异常归因,问了下。京东注册人数突然增加20%,分析原因
5、sql题,数用户最大连续购买天数
6、用python吗,主要干嘛用的。问了continue和break,append
7、会a/b吗,因为实习业务方不是产品,没怎么接触过
整体面试不难,但是sql我答得不太好,有点凉。
作者:求求来一个offer吧 来源:牛客网
一面
1. 简历项目
2. 神经网络 如何防止过拟合?dropout测试集怎么处理?神经网络层数深有哪些问题?梯度消失梯度爆炸等等解决方法?
3.python垃圾回收机制
4.手撕算法
二面
1.简历项目
2.情景题 预测广告曝光率排名之类的
3.爬虫和普通用户如何识别 问得很细很细
4.手撕算法
5.输入url网址按下回车后发生了什么(计网的经典题啊可惜本科学的都忘了 太菜了我
6.c语言和python有什么区别?
二面结束很快就凉了。。。真的被虐哭了,感觉京东的数分偏算法,没想到会考这么多计算机基础,当然还是我太菜了本科学的操作系统 网络什么的很多概念都模糊了,还得继续努力啊!发个面经为之后攒人品???
作者:只为求一offer 来源:牛客网
下午两点的面试,对面是个小哥哥,问了需不需要开视频,他说不用,他先自我介绍说是广告部的,面了快一个小时,真是快把我问崩溃了,想哭了都,可能是我太菜了,应该要凉!
1.自我介绍;
2.深挖项目,而且还提出了质疑,质疑到我都快说不出话来了;
3.共享屏幕,手撕代码,选取中位数;
4.最后发了个类似于笔试的那种编程题,说下思路,还好没让编程实现,要不然给跪了。
04篇
作者:花颜许夏 来源:牛客网
笔试4.19,4.21收到面试通知
一面:4.22 11.am面试时长30min
1、首先是自我介绍
2、然后问了实习经历,主要做过的分析,详细过程讲一下
3、你觉得数据分析师的职责是什么,应该具备哪些资质
4、从事数据分析,你的优势和劣势是什么
5、数据分析的工具会哪些,SQL会的吧?
6、数据分析的整个流程讲一下,数据分析报告是怎么写的
7、你未来的职业规划是怎样的
8、提问环节
后续看官网通知,我估计没后续了?
提问很常规,是京东金融下面支付业务的商业分析部门,感觉是强业务导向,技术方面没问问题
05篇
作者:渭城朝雨邑轻尘客舍青青柳色新 来源:牛客网
已拿offer
一面:
1.简历项目
2.简历项目相关分析迁移到京东生鲜如何分析
3.对岗位的认识
4.如何看待京东
二面:
06篇
作者:666顺利毕业 来源:牛客网
京东(数据分析工程师)(9.2)(现场)
1.Rfm模型
2.Python如何连数据库
3.system.pas(这个我可能没听清,下来查了查也不知道是啥)
4.grep是啥
5.hive的并行化操作,管道操作
6.map join
7.Python如何传参
8.漏斗模型
9.静态分区和动态分区的区别
10.问京东分为不同会员,如何从各个方面提高下单率(漏斗模型)
11.hive的字符串操作函数,窗口函数
12.一道sql问题,求出全部成绩>80的学生,可以用min(score)over(partition by sname)>80,就可以满足所有成绩>80,也可以用row_number()但是没有上面的简洁.
13.用的图表,取哪些指标,数分需要哪些核心技能,python的基础知识?
总结:小姐姐貌似不太会机器学习那些,全程问的hive的一些很基础的知识,也没问项目,这是第一个现场面,所以有点紧张,而且感觉这个很偏ETL,所以被问的很惨,基本没有答上来,数分真的太南了,要掌握这么多知识...
07篇
作者:Offer+++2019WWW 来源:牛客网
一面:时长:约40min 形式:一v一现场
1.先是聊了聊学校和专业
2.你学的这个专业,你认为对你影响最大,最大的成长或收获是什么呢?为什么?举个最近实际的例子?
3.详细问是例子中是怎么想、怎么做、怎么实现的。
4.运用数据分析,分析一下酒店的漏水情况。和面试官一来一往提出假设,具化问题, 分析讨论。
5.你有什么问题?
6.你SQL怎么样?
二面 时长:30min左右 形式:1v1现场
1.自我介绍
2.你实习的公司里,说一下xx和xx的不同,你认为谁带给你的收获更大?
3.你认为数据分析工程师应该具备怎样的素养?为什么?
4.在你提到的这几个部分,你觉的自己哪方面最好?
5.你对忠诚度怎么看?团队忠诚度。
6.你对自己最欣赏的一个点是什么?说一下你的规划?
7.如果你三年后会申请离职,你觉得最有可能的原因是什么?
8.如果你的数据分析结果业务人员不满意,你会怎么解决?
9.假设现在我们要做一个促销活动,请你从数据分析的角度给业务人员一些品类建议,你会怎么做?
10.你有什么需要改进的地方吗?
11.你觉得你昨天面试面的怎么样?如果一面面试官提了一些待改进点给你,你觉得会是什么呢?
12.说一下昨天面试聊的题目吧。
13.你有什么要问我的吗?
14.你知道拼多多吗?
15.你认为京东有必要做一个像拼多多的模块吗?为什么?
面的应该是社交电商部门,京东昨天推出了“京喜”小程序+app,对标拼多多,就是这个部门的工作和产品。感谢面试官!(*^▽^*)
HR面 时长:8min 形式:电话面试
比约定的时间晚了20多分钟,hr今天应该非常忙,感谢在午饭前打过来了。
1.自我介绍
2.看你实习过的公司,你有关注xx的秋招吗?你关注秋招时想做的工作、看重的公司是什么呢?
3.说一段你最有成就感的实习经历。
4.平时你和你的导师怎么评价你呢?
5.你的导师没有给你一些建议吗?是什么呢?
6.你觉的自己性格上有什么缺点?
7.关于此次招聘,你还有什么问题要问我吗?
问了下一步进展,说9月底前发出是否有offer的邮件通知。(☆▽☆)
08篇
作者:-offer会有的!来源:牛客网
一面:40min
首先是30分钟的笔试,六道大题。
1. Linux基础
2-4. HiveSql
5. MapReduce的步骤和作用
6. 请从以下角度介绍一个你的项目,不用写,口述即可。
面试环节10分钟左右,主要是问简历细节,每一次实习的主要工作,Python和MySQL的使用占比。
最后介绍了一下他们的部门和业务,主要工作是大数据相关的BI。
二面:40min
总体来说就是:我玄学地通过了jd的玄学二面。
1. 自我介绍。
2. 最近的一次实习,你用到了ABtest,你是怎么用的。
2.1 为什么按城市划分,有考虑到不同城市的不同情况吗
2.2 回收的结果确定能验证你的结论吗
3. 最近的一次实习,你用到了因子分析和主成分,但是做的是综合评价,这两种方***导致的指标信息损失你怎么处理?
3.1 你的结果得到了评价对象的认同吗,怎么跟他们解释你用到的方法?
3.2 如果想要一个不损失信息的办法,你怎么改进
3.2 想过用复杂模型训练,去得到更好的结果吗
4. 上一次实习,你提到了数据提取和清洗,讲一下如何提取和如何清洗的。
4.1 提取之后的数据如何储存?
4.2 对非结构化数据处理有接触吗
4.3 对自然语言和文本处理有接触吗
4.4 数据校正的过程中,你用到了几种校验结果的逻辑?
4.5 如果你用到了多种逻辑,就比如说是两种吧,请问你是串行还是并行?
4.6 如果两种逻辑,一个验证通过,说数据没问题,一个说有问题,你怎么判断?
4.7 如果业务人员现在告诉你,两种逻辑对他们来说权重一样,没差别,你怎么判断?
5. 讲一个你最熟悉的项目吧。(讲了最近实习的数据挖掘,关于广告主的)
5.1 你提到你选择了三个方面的指标,第一,你考虑客户自身的属性,请问会考虑到他自身的经营情况吗?(并没有…)
5.1.1 给你一点建议,关于客户自身经营情况的数据怎么获取。
5.2 第二个方面的指标,客户行为,只考虑他在你们这个平台的行为吗?客户在整个市场的行为是不是也会有影响?
5.2.1 继续深入客户的其他行为,会如何影响,怎样获取这些行为数据
5.3 第三个方面的指标,详述一下你怎么构建的特征。
5.3.1 如果现在让你在这方面构建更多的特征,你会想到哪些(我提到了投资回报率)
5.3.2 你提到的指标,比如ROI,属于结果指标,一般增量市场会更多地考虑结果指标,那现在客户面临一个存量市场,更应该关注过程指标,你怎么考虑他的广告效果,可以从你这个投放平台的角度来说,也可以从客户自身的角度来(这里我说了转化漏斗那些,并且最终还是提到了ROI,23333)
5.3.3 解释他为什么关注过程指标,以及他们当前的业务情况。
6. 提问环节
问了我跟这个岗位招聘需求的差距,面试官提了三个方面的建议,有一个是关于过程指标的,另一个是提到应该关注数据本身的价值。
三面:hr面,15min左右
1. 租房,有没有关系好的朋友在北京,会不会一起租房,租在公司附近比较偏能接受吗
2. 在流程中的公司,怎么选择
3. 为什么选择京东
4. 你在选择就业平台的时候,觉得平台能给你提供的哪些东西是重要的,请排序说明
5. 讲一个你性格中的缺点
09篇
作者:什么时候才能有offer啊 来源:牛客网
面的部门是人工智能的什么算法模型研究部,部门需要的是为算法工程师提供数据的数据分析工程师,通过和算法工程师沟通如何建立特征工程,用数据库语言或者python在京东底层数据库中抽取数据,进行整合、清洗巴拉巴拉的那些数据清洗工作,然后构造特征工程,最后把数据给算法工程师。说是他们部门十几个算法工程师,就一个数据工程师,现在岗位很空缺,听上去个人感觉就像人形ETL,算法工程师的提数机.........
一面内容:
1. 笔试的一些问题和自我介绍
2. 和数据分析相关的的项目有哪些
3. 简单介绍一下相关的几个项目怎么做的,数据量有多大,期间穿插问了项目中提到的技术知识(xgboost和RF的区别,追问二者并行的实现有什么区别;kmeans调参怎么确定参数),我噼里啪啦说了一大堆,没有问太多项目相关的问题了,可能项目比较菜没什么好问的?
4. 有什么要问我的
二面内容:
1. 万年不变自我介绍
2. 为什么选择数据分析不选算法
3. 介绍一下各种join和应用场景
4. 写sql:筛选出不同品牌电脑2017年销售总额、2018年销售总额以及2018年销售额增长率。
5. 单独一个数据列如何去重
6. 写python语句:
6.1 如何将一列dataframe里的字符串类型属性转化成整型
6.2 如何截取这列数据字符串的前两个字母
6.3 如何筛选出这列数据里字符串长度大于10的数据
7. 写算法题:链表、快排、递归、动态规划选一个,选了链表,如何判断两个链表是交叉链表,写出代码。
凉的透透的,9.4上午面完二面面试官让我回去等看看HR怎么通知我,我还心存侥幸,结果回来等了一天,今天中午刷新状态是复试未通过,不配做东哥的兄弟,告辞了。
10篇
作者:嘻嘻啧啧 来源:牛客网
一面:武汉 9月2日下午2:30
1.讲一个核心闪光项目,balabla讲了20min
1.1 数据预处理怎么做的
1.2 模型怎么验证好坏
1.3 有在实践中应用吗
2.两个SQL,磕磕绊绊5分钟
2.1 求各科成绩都在80分以上的学生名单,我复杂化了脑子短路了,忘了使用min函数
2.2 根据两个表和结果表还原SQL语句,这个也答得不完美,那个默认函数没用过我只说了去百度查这个功能的函数肯定有,不然就写IF THEN
3.用过哪些可视化工具
matlab R matplotlib seaborn我就对比了下这几个的异同,缺点优势
4.用过linux哪些命令,我说chmod、grep、ls、cd,又问awk,我说我没用过,她说没事,学起来上手很快
5.她说她做数据处理这块的,我就说那应该用Python、Hadoop比较多,就说了hadoop的特性和原理
6.怎样在电商运行中的各个环节增加用户留存率和交易量 从漏斗模型的各个环节说对策,线上线下,说各种营销手段
7.说说Hive
8. 问了个问题:工作中最感到挑战性的事情
一面的面试官对我挺好的的,运气太好,感恩
二面:武汉 9月3日 上午11:00
自我介绍后,这应该是一个完全业务化的面试官
1.科研项目中模型怎么验证好坏,推了几个公式,好像他不怎么懂
2.K-means用过没,我说用在POI聚类里了,刚准备画图讲算法他说别讲了,然后我就说了POI聚类的事情
3.RFM模型(面试官鸽我的一个小时刚好学习到)
4.应用问题:同一品类商品只有2个字段的性能,另一个有6个字段,怎样证明后者优于前者
5.应用问题:对于某一品类的商品的数量的健康度衡量,确定一个合适的数量。
6.你觉得这个岗位你还要在未来一年准备些啥?
二面其实答得都还可以,我太难了,所有面试进程都挂在二面!