讲一下数据分析思维
作者:数据管道
来源:数据管道
今天分享的主题四个字:数据思维,听上去可能有点扯淡,总觉得还不如多学一行SQL优化啥的,但细品非常重要,将借助滴滴的实际业务做分享,以下是全文内容。
让你的数据会说话
老板:“身为一名数据分析师,怎么一点数据思维都没有?”
数据分析师:“我写的分析报告、周报里不全都是数据么,这还没有数据思维?”
以上对话是在某段工作中发生的真实场景,也许也会发生各位数据新人的成长道路上,今天为了解决这个疑惑,让我们一起聊聊什么是数据思维,并用其来重新看待目前的工作,希望能够给各位同学提供一些帮助。先给结论:
数据思维 = 站在全方位的角度 + 给出精准现状描述
本文目标是帮助大家培养“数据思维”,这种思维能提升日常工作的交流效率,交流的对象可以是老板、老师or同事等。
本文主要分为两个部分,首先讲数据在工作中的作用,其次是什么是数据思维,即如何充分发挥出数据的作用。
01
数据的作用
对于业务人员而言,我认为数据的作用有两大方面,一个是了解现状,还有一个是快速信息拉齐。
了解现状在这里指的是,将未知的事物量化,从而我们能够对一个事情产生一个客观的评价。想到一个案例就是滴滴曾经和济南市政府合作,为了缓解交通拥堵,给出了“拉链车”解决方案,能够根据道路情况实时变化车道,场景见下图。
拉上拉链,城市的交通仿佛穿上了裤子,跑得更自信了
该方案能够在上班时间提供更多入城车道,下班时间提供更多出城车道,在“居住城外,工作地点城内”的场景下,理论上有效缓解交通拥堵。我们在讨论这个case的时候都觉得是不错的想法,但是网络上有些济南的同学反馈,好像当地交通不但没有好转,反而变的更堵了,这个观点和我们的理论相悖了,那这个“拉链车”到底是好还是不好呢?
在看这个解决方案之前,首先要回溯问题是什么,前文提到是为了“缓解交通拥堵”,那作为这个项目组的数据分析师,如何在事后判断交通拥堵是否被缓解了呢?肯定不能仅从逻辑推导就得出结论,我们需要一个客观的判断依据,这个时候我们可以发挥数据的“了解现状”功能。
首先找出数据指标来描述交通拥堵程度,然后通过指标的前后对比来评价方案效果,比如这里的场景,我们可以列出以下数据指标:
指标类型 | 指标名称 |
最终优化指标 | 平均通勤时间,同路线车行耗时 |
过程指标 | 特定道路车流量,特定道路平均车行速度,早晚高峰结束时间 |
相关影响指标 | 日均交通事故数、公共交通出行人数 |
在碰到其他实际场景的时候,要如何思考才能列出指标呢?这里给出“夺命三连问”,基本上只要回答了这三个问题,就能列出相关指标体系。
1、 为什么要解决这个问题?
2、 怎么解决这个问题?
3、 哪些干扰因素可能让我们做出错误判断?
这个过程实际上是对数据分析师综合能力的考查,一方面要了解业务逻辑,将项目拆解成各个环节,一方面是数据敏感度,找到各个环节中需要监测的指标,然后列出指标的同时要构思好这个指标好与坏分别代表什么业务场景。
如果发现数据指标和预期不同,那就要用业务知识指出中间差异存在的原因,然后用数据去快速验证,比如发现平均通勤时间并没有减少,那会不会是我们的“住在城外,工作在城内”假设有问题,那我们可以用一些数据指标如“早高峰时期,入城车量占总出行车量比例”去论证假设是否成立。
有了数据的严谨对比,我们就可以对“拉链车”做出一个客观的评价了,之后如果有其他同学想要了解这个项目,只需要说明背景和上述指标就能高效且客观得拉齐双方认知。这里我们又提到了数据的第二个作用“快速拉齐认知”。
认知指的是,人们主观对于客观事物的判断,比如“今天很冷”这句话就是一个认知的表达,指的是今天我周围的物理环境(客观世界)让我觉得冷(主观判断)。
人类是社会性动物,相比于生物本能带来的认知,人的认知更多和他在社会中的经历有关,由于每个人的经历都不同,因此拉齐认知是一件非常困难的事情,正如一千个人眼中有一千个哈姆雷特,同样听到一句“今天很冷”,东北同学的脑子里出现暖气片和大棉袄,广州同学的脑子中出现的却只是一件稍微厚点的夹克。
那我们为什么要拉齐认知?俞军老师在《产品方法论》中提出创造价值的路径是劳动、交易、分工、新技术、制度,其中的交易和分工都需要拉齐双方甚至多方的认知,因此拉齐认知有助于我们工作乃至社会运行的效率。
回到数据对于“快速拉齐认知”的作用,就是“明天降温”不如“明天最高温只有零下10度”更能让对方了解你想表达的客观事实,在工作中同理,“相比于上次活动,本次活动的盈利高出20%,拉新人数高出15%”会比“这次活动比上次好”更能让同事/部门/公司理解你所想要表达的观点。
02
什么是数据思维
在上文中我们提出了数据的作用是了解现状和快速拉齐信息,接下来回到开头的场景,为什么明明写的分析报告、周报里都是数据,还是老板还觉得没有数据思维呢?
其实老板的意思是,你虽然用数据描述了事情的一些属性,但这些都不是他关心的内容,比如你说最近的活动,相比于上次活动,有20%的盈利增长。
老板可能真正想知道的是:
既然活动盈利又增长了,那距离今年的盈利目标还差多少,是否需要提升活动频率,这次活动效果好的原因是什么,这种增长是否可持续,有没有办法做的更好。
而当财务看到你的这个分析报告时,他们可能更想了解的是:投入产出比(ROI)如何,你的活动预算多少,你的盈利指的是毛利还是净利。
以上这些问题对于数据新人来说可能是一种降维打击,因为这些除了要求大家有数据分析能力以外,还要求大家有同理心,要站在对方的视角看待这个活动,还需要对业务有多方面的认知。
小道消息称,高管们对于事业部日常监控的指标有好几十个,即我们在分析日常业务的时候,也要尽可能找到相关的影响指标,并且这些最好也能和高管们在看的指标有直接或间接的关系,这样方便事业部内和同事交流,一旦出现漏指标或者自己定义的“独特指标”,都可能出现对方不认可这个分析报告,从而否定你的结论的情况。
那如何给出对方关心的内容呢?最好的方式当然是沟通,互联网公司的扁平化有利于平等对话,你可以通过公司内网快速找到相关部门的同学,了解他们现在关心的项目和对应指标,一般来说无论对方的职级如何,只要有空,都愿意把这些信息同步你。
这里插入一个调研中运用数据思维的方法,大家工作中有时候需要去了解一个其他部门的日常工作内容,比如运营部想了解市场部最近在做什么,相比于问“你们最近一个月都在做什么呀,各部分时间占比是怎么样的”,不如先问“你们的考核指标都是什么呀,权重占比是怎么样的”,从结果指标开始了解,再反推对方的优化方向和工作内容,你就可以看到对方整个部门的全貌,从“做什么”到“怎么做”都有一个较为明确的概念。
总结
洋洋洒洒讲了这么多,接下来做一个总结,数据思维的表现,就是能站在多方角度,用数据来精确描述现状。这里没有写“指引下一步行动”的原因,是由于我觉得在做规划这件事情上,更多依赖对于目标的取舍和对未来的预估,数据能够的作用是描述现状和描述假设中的未来。
讲点题外话,在工作中运用数据思维,是思想上重视工作(即使用《思考,快与慢》中的系统2对待工作)的表现,但这种理性思维会让人看起来冷冰冰,在生活中对于人际交往可能并没有帮助,比如女朋友告诉你“今天好冷,我想喝热奶茶”,这里运用数据思维的正确方式,并不是去看今天几度,而是要说“几分糖,我一秒钟内出发”。
◆ ◆ ◆ ◆ ◆
长按二维码关注我们
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码: