打假!伪数据分析思维大曝光
近两年来,数字化、数据分析、大数据等概念火了,引来一帮牛鬼蛇神,把各种各样乌七八糟的东西都包装成“大数据思维”兜售。总结一下,一共八大门派,各个身怀绝技。在工作中遇到了,绝对让人苦不堪言。
01
这个派系的口头禅是:“只要拥有了大数据,就能精准预测,千人千面,大幅度拉升收入!”
听着振奋人心吧!可实际上,大数据不能帮你做到这些!用户最终买单,是因为有好的商品、便宜的价格、吸引人的设计、恰好在需要的时候看到广告等等,从来都不是因为有什么大数据。数据的作用,是在商品、价格、设计、投放的基础上做优化(如下图)。
这一派的危害在于:对数据能力有不切实际幻想。比如把增长的运气都赌在一个神乎其技的数据分析师身上,最后肯定是乘兴而来败兴而归。
02
这个派系的口头禅是:“我们要建立全链路数据模型,收集:用户信息、用户爱好、用户意向、用户情绪、用户行为、用户评价、实现全方位分析。”
听着很厉害是吧?你问他一句:“等会!这些数据你打算咋收集呀?”
他就会回答:“数据采集关我啥事!不是有开发吗!我聚焦思维就好了……”
数据思维之所以不是吹牛逼思维,就是因为它以数据为基础。而数据是需要采集的。并且,不同类数据采集的难度、成本、采集质量,相差甚远(如下图)。
这一派流毒也很广,特别在非技术出身的人群里,这帮人以为数据是天上掉下来的。导致的恶果,是“业务一张嘴,技术跑断腿”,回头他还怪你:“人家头腾阿就有,你没有是你没本事……”
(╯‵□′)╯︵┻━┻
03
这一派是“关我啥事派”的另一幅面孔,就是喜欢扯非算法类的思维模型。尤其以什么SWOT、PEST为甚。
大部分思维模型,真的只是ppt里四个格子,根本没法量化,跟数据思维一毛钱关系都没有。
但是,很多领导是SWOT派的信徒,并且尤其爱在汇报ppt里看到这种东西。所以一般面对这种领导,我们不会选择怼回去,而是用科学、复杂的方式,量化这种“模型”(如下图)。
04
从这一派开始,后边几个门派都开始讲数据了!这是个重大进步。但嘴巴上挂俩数字,并不代表就是数据思维。典型的一类错误,就是这个”十大法则”派。他们尤其喜欢在某个公司、某个业务、某支股票成功以后,洋洋洒洒列举一堆数据,然后总结出以下结论:
“十大成功法则”
“五大底层逻辑“
“九个关键因素”
……
这一派相当唬人。一来它讲的都是成功的案例,你不能直接反驳。二来它确实列举了一堆数字,看起来好有道理哦。实际上,这是典型的事后诸葛亮行为。
数据思维的核心是逻辑、而不是数字有多大。逻辑是可以从旧的数据中归纳,可以用别的场景验证,可以推测到未来。没有经过检验,只看成功个案,会混淆视听(如下图)。
这一派的最大危害,在于:引发盲目崇拜和瞎指挥。通俗的说:成功的人可能每天只睡4个小时,但你每天睡4个小时不会成功,只会累死。道理就是这么简单。
05
这一派在业务部门尤其多,特别喜欢讲数据:
“这个业务,活跃率必须做到30%以上”
“我们的服务,要在1分钟以内响应客户”
“今年的目标,要做到1个亿,才能实现腾飞”
并且标榜以上东西为:大数据思维,还尤其爱说:“这是朕在行业内沉淀十年的内功心法”
然后你问他:
为什么是30%,不是20%
为什么是1分钟,不是30秒
为什么是1个亿,1.5亿又怎样
他就回答:
“朕从业十年,数字就该是这样”
“朕认识好多人,他们也认为这样”
“朕是这个行业内专家,谁不认同我谁是傻逼”
……
这根本不是数据思维,恰恰相反,这是反数据思维的经验主义。真正的数据思维,给出标准是有逻辑、可验证的,绝不是什么“老子从业十年……”(如下图)。
这一派人在工作中引发的乱子尤其多!大部分经验主义者,并没有真正验证过自己的认知,经常在顺景中盲目自大,仗着经验乱怼人;在逆境中胡乱甩锅,自己前后言行不一,还恬不知耻,反正只要是他说的,就是对的。
06
这一派是“朕即国家”的另一幅面孔。他们也很喜欢标榜自己“精通数据思维”,然后讲的案例,都是:
“我看到街上有10张广告牌,转念一想,这要是打上广告,得赚多少钱”
“我看到销售们每人有100张名牌,转念一想,这要是打上广告,又是多少钱”
“我看到车厢里十个人有八个在看手机,转念一想,这要是……”
这根本不是数据思维,因为你会发现:拿掉里边的数字,这些故事照样成立。真正的数据思维,是把决策建立在数据的基础上,根据数据差异做判断(如下图)。
这一派的毒害,在于用无聊的数字,掩盖了真正要分析的问题。最后出了问题,他还会倒打一耙:“都是数据分析不深入,才让我决策失误的呀。”
07
这一派牛逼了,张口《机器学习》,闭口《统计学习》,总之非模型不数据。常见于刚毕业的,做技术的新人。
算法不是数据思维的全部。实际上,正如算法叫“算”法,本质上它就是个计算公式而已(如下图)。
现实问题非常复杂,需要转化以后才能用对应方法解决。比如预测销量问题,可以用时间序列预测,也能用两阶段预测,也能用回归预测。遇到问题,第一时间应该是理解业务目标,然后找合适的方法,转化为分析问题,而不是去搬书。
这一派的毒害,在于用:常常用看似科学的方式,行不懂脑子的事实。最常见的,就是胡乱塞几个指标进回归模型,然后说:就是这个因素影响业绩,因为R平方的值是0.99呀!结果自然被人怼的体无完肤。
08
这一派是“算法模型”派在业务部门的代表。近两年来,在产品领域尤甚。
很多产品经理,上版本的时候,不管目标受众,不想检验指标是啥,不考虑影响因素,不理强相关特征,不理会抽样框设计,不管控制变量……总之瞎几把做两个版本丢上去ABtest,然后逼着数据分析师用各种统计量论证结果到底有没有差异。
这就打着科学旗号反科学。最后经常沦为:逼着数据分析师用科学方法证明一个拍脑袋的结论。
09
以上八大门派,本质上违反了数据思维所要求的“从事实出发,先收集数据,再通过逻辑论证”的思路,把数据思维简单等同于几个数字,几个玄幻的概念,几个教条公式。
并且试图拿着这些来路不明的数字与书本上公式解决现实问题。可能有同学会好奇:真正的数据思维是啥样的?感兴趣的话,本篇集齐60在看,我们下一篇分享,敬请期待哦
了解陈老师的视频课程