本文为大家介绍了在【定位问题】和【确定分析思路】时,常见的坑及解决方法。
场景1:
一个业务同学急急忙忙的找到你,说活动页面的跳出率数据异常,大家觉得第一步应该做什么?
--------------10秒钟思考--------------
这是比较常见的场景,为了“确定问题”,我们首先需要明确指标的口径,尤其是有分子、分母的指标,更要清晰分子、分母的定义,否则容易导致“定义谬论”,所以答案是C。
这是笔者遇到过的真实案例,当时业务看到的“跳出率”,是“APP跳出率”,即【跳出APP的人数/页面访问人数】,但对于活动页面的场景,更常规关注的指标是“页面跳出率”,即【页面无点击行为人数/页面访问人数】。所以如果一开始指标的定义就没搞清楚,就开始启动探查和分析,很容易导致南辕北辙。又是这个业务同学,跟你哭诉:累死累活做了个活动,但是“访问支付率”(PS:支付用户数/访问用户数)竟然还下降了(如下表,非真实数据)。选A的朋友,请控制情绪;选B的朋友,请冷静下来先思考下。这个场景,其实是比较典型的辛普森悖论,是否可以根据整体指标的下降、就断定活动效果不好呢?还得按照目标人群去拆分观察,比如按活跃度拆分(非真实数据):
这就是辛普森悖论,即分组都较优的情况下、整体却反而会变差,主要原因是分组的占比相差大,占比低、表现弱势的用户群,随着占比提升、会影响整体的表现。针对这个问题本身,其实本质情况是沉默用户、新用户占比升高,这个就可以结合活动的策略及目标,判断是否是问题,再进行分析。还是这个业务同学(他的问题有点多hhh),某天突然找到你,神神秘秘地说自己有个大发现:
花卖得越多,店铺的刮胡刀、按摩椅就卖得越多,没想到卖花还能有这作用!自己准备再多卖些花。这是“相关因果谬论”,误把相关当因果,花和刮胡刀、按摩椅都卖得好,可能是跟父亲节、端午节等节日有关,而不是卖花能导致刮胡刀、按摩椅卖得好。因此分析师需要深入了解业务,才能探查现象背后的本质,避免发生相关因果谬论类的尴尬。以上是在判断问题时,几种较常见的坑,而对于分析师来说,还有一种更常见的坑,叫“乱七八糟胡乱分析”坑。之前的文章有介绍过矩阵分析、杜邦分析、交叉分析等方法,而一些分析同学在具体实践时,很容易狂堆各种维度,什么用户画像、商品画像、场景画像,噼里啪啦一堆取数,各种盲目地交叉分析,最后整了个几百M的Excel,但是啥有价值的结论也没探查出,然后开始怀疑人生......那有哪些方法可以帮助我们梳理思路,或者说明确分析框架呢?常用的思路有以下几种:1、业务流程驱动:业务流程既是了解业务的基础,也是常用的分析框架,需要清楚“结果”是由哪些“环节”导致的,且明晰各“环节”可能与结果相关的因素,就容易探查出相对本质的原因。例:某商品发生缺货,可以梳理出商品供应的关键节点,评估各个节点上可能的原因,再通过数据去论证。如缺货可能是在做销量预测时即偏低,也可能是下单环节为了控制库转、保守备货,只有梳理清楚相关节点及影响因素,才更容易得到有价值的结论。2、部门职能导向:数据分析是为了明确问题,且定位到具体执行的人或部门,这样才容易推动落地。因此在梳理分析框架时,可按照部门职能,分模块进行分析。例:活动分析场景,活动分析的维度众多,复盘活动效果最常用的思路之一,就是按活动的负责部门去分类,定位每个部门的好坏、给出相关策略建议,如下图(非真实数据):3、策略目标导向:在做业务分析、尤其是复盘时,分析师经常会遇到无法“判断好坏”,或无法找到分析切入点的情况。很多情况还是归因于“不够了解业务”,既然做分析复盘,还是需要明确业务当时的目标是什么、有哪些策略、策略的方向和目标是什么,以此为基准、确定分析方向,会更加符合客观情况,也更容易与业务达成一致。例:如下图针对促销活动的分析(非真实数据),可与业务梳理和明确活动目标、策略情况,形成自己的分析复盘的框架:这次跟大家介绍了在【定位问题】和【确定分析思路】时,常见的坑及解决方法,也希望大家遇到类似的场景时,会多些谨慎、多些思路。数据分析路漫漫,大家在做分析时有遇到什么坑吗?欢迎分享。
后续笔者也会从分析报告、数据开发等角度,多跟大家分享一些案例和方法,敬请期待哦。九条,网易严选资深数据分析师,数据分析长期学习及实践者,先后负责严选供应链计划分析、流量分析、商品分析等工作,致力挖掘与传播分析价值。
编辑:于腾凯
校对:汪雨晴