聊聊数据分析中常问的估算问题,有方法论吗?
看了大厂数据分析面试题以及自己以前面试的过程中,发现估算题目出现的概率蛮大。面试官都喜欢问应试者这样的一些问题:
"'
估算北京租赁市场规模;
估算一个城市的加油站;
估算离你宿舍最近的食堂一天营业额是多少;
估算你的城市现在运行着多少量公交车;
"'
作为没有接触过的同学,面对这种问题就会比较懵,可能会说去搜索资料,去做实地统计调研,但是在面试这么短的时间内,其实面试官希望看到的是你的拆解逻辑,并不一定需要你去得出最后准确的答案;
虽然我们聊的是估算问题,但是这类问题常见于面试过程中,那么我们先聊聊面试,面试官问这类问题,他的考察点是啥?希望能帮助到有需要的朋友;
1. 清晰的思路:估算的每一步都需要逻辑清晰、思路明确,要把一个复杂的问题拆解成多个简单的元素,并且有效的把这些元素组合起来。
2. 清楚的表达:能把自己的想法明明白白地传达给面试官,让面试官也理解你是怎么思考和处理这个问题的。
3. 准确的计算:数据分析无法避免和数字打交道,对数字的敏感和比较强的计算能力也是必要的。当然,这些计算仅限于加减乘除。
4. 必备的常识:估算少不了假设,而假设大多基于面试者的常识。有些公司甚至会不止希望做到有常识,而是希望看到良好的“商业嗅觉”。
聊完面试,再来聊聊怎么去思考解决这类问题;
一、费米估算
首先讲一个理论:费米估算
有这样的一个故事
在一次芝加哥大学课堂上,费米问学生。芝加哥市有多少调琴师,学生们一脸茫然。费米提示把这个问题“分解成一些便于操作的小问题,然后鼓起勇气作猜测和假设”。
芝加哥有多少居民?可靠的估算是300万;平均每个家庭有多少人?4人;多少家庭有钢琴?大概三分之一,那么全市大约就有25万架钢琴;一架钢琴隔多长时间需要调音?平均5年,那么芝加哥平均每年有5万架次的钢琴需要调音;每个调音师每天能为多少架钢琴调音?4架;假设他一年工作250天,那么他每年约为1000架钢琴调音。由此,费米和学生们推测,芝加哥市大概有50位钢琴调音师。
事后有人用电话号码簿加以验证,实际统计的结果与费米的猜测十分接近。
我们面试中的常见的问题,也是跟费米问题十分接近;
费米问题中的原理:
费米估算指的是解决未知结果的估算问题,将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,如果还不能得出结果,那就继续再拆解,直到拆解后的所有部分问题变成一个常识问题或者是比较容易解决的,从而将一个未知结果的问题逐步变得清晰。
在将复杂的问题拆解成小的、可知结果的部分过程中,可能会存在估算,那么这样的估算会不会给最终结果带来很大的误差呢?
其实在费米估算过程中,我们不是只有一次估算,我们会产生一系列的估算。比如估算芝加哥有1/3家庭有钢琴,同时也会估算一架钢琴平均5年调一次音。这些估算有的过高有的过低,相乘之后会相互抵消,回归到较为准确的平均值。即是平均律;当然,费米估算有个很重要的前提,我们的估算值是有实际数据或者生活经验支撑的。
这也就是为什么费米估算法会百试百灵,准确率十分之高了!
二、总结一下
费米估算其实将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,并进行估算,后面进行验证的这么一个过程;
记住绝大多数估算的 case 都至少有两种思考方式:从 Demand Side ,或者 Supply Side 。
狭义的来说, demand side 就是从需求的角度来考虑(估算的时候认为:市场/客户的需求有多少,规模就有多大,即需求决定了量,生意是供过于求的)而 supply side 就是从供给的角度来思考(估算的时候认为:商家能供给多少,数量就有多少,由供应决定了量,是供不应求的)。
广义地来看,demand side 就是从销售发生的角度来考虑,supply side 就是从真实存在的角度来估算。这两个概念我认为并不需要分的特别清楚。而且对于一个具体问题该从哪个角度出发还是很好判断的。不过,从我个人的经验来看,80%以上的估算还都是会希望 candidate 先从 Demand Side 来出发的。
解决这类问题的步骤:
1.明确问题
2.分析是需求端问题还是供给端问题,或者两个角度都不是
3.问题拆解,列公式
4.估计计算
5.实际验证
三、案例分析
从需求和供给分别拆解,相互补充交叉验证;
今天就这样,白了个白~