权重曲线如何辅助业务分析
共 3492字,需浏览 7分钟
·
2020-12-07 22:34
不好意思……我真的找不到合适的封面图了hhhhhh……
在上次整理完项目复盘的模板后,留言里有好几个小伙伴问我“活动前每日新增1000人,活动中每日也新增1000人,为什么说活动效果不一定差?”。
其实这里我借用了一点加权曲线的原理。
我们可以这样理解:
每日新增人数
= 自然增长基值 + 随机波动值 + 人为干扰波动值
对于电商来说,受到了工作日、寒暑假的影响,从周一到周日,从1月到12月都会呈现出不同的增长表现。想象一个电商公司:在平稳运营的过程中,不采取任何的活动措施,周日新增用户量往往大于周一。
一年365天里,每段时间的自然增长基值是不一样的。或者说,简化一下,周日和周一的自然增长基值是不一样的,可能周日的自然增长基值为1000,周一的自然增长基值为700。
周一推出了分享拉新的活动:假设极端情况下(忽略掉随机波动值的影响),周一和周日都新增了1000人,所以活动带来了300的人为干扰波动值,是有效果的。
当然了,要评估一个活动的效果,最好多看几天的数据,取平均值来对比。
我不知道你们对加权曲线是否感兴趣。
最近我在复盘加权曲线的逻辑和应用案例,整理了一份文档,有兴趣的接着看吧~看了不吃亏,也不上当(微笑)
在工作里,我借鉴了《数据化管理》中的加权曲线以及黄氏曲线,并在计算上做了简单的修改,让模型与业务的融合度更高。
有了黄氏曲线和权重曲线,我可以追踪业务线的日常销售情况,可以复盘营销活动,可以将财务目标拆解到每一个自然日上,可以进行销量的预测……
虽然有时候分析效果不尽人意,但有了这个思路逻辑的我,就像初上战场的小兵拥有了刀和剑,不至于在收到相关需求和分析任务时手忙脚乱。
不禁感慨,对我这种刚入门的小白来说,加权曲线是一个好东西……
直接上一个小小的case吧
计算权重曲线
在今天,我们很难找到一家店铺,或者说一家公司,一个行业,能够保持365天每天相差无几的销量。
抖音短视频:考虑到工作日学生上课,非学生上班,视频类APP普遍周末的活跃人数最多……
写字楼下的餐厅:考虑到写字楼中的白领往往周中上班,一定是工作日的销量更好……
迪士尼的门票:除了周末和法定节假日,游乐园一定会在寒暑假爆满……
一年365天,每天都会对一整年的业绩贡献力量。而作为数据分析师,我们需要从过往的业绩表现中寻找密码规律,权重曲线正是这一规律的体现。
▼ STEP 1 :计算日权重
(1)剔除掉特殊节假日,计算2-3年内,周一:周日的平均订单量,如下表:
星期X | 日 | 一 | 二 | 三 | 四 | 五 | 六 |
日均订单 | 1000 | 1100 | 1250 | 1450 | 1500 | 1800 | 1550 |
(2)选择最小值“星期日-100单”作为基值
当然,你也可以选择均值作为基值……主要还是根据计算出来权重曲线和业务的拟合度来选择合适的基值。
(3)对于非节假日,以日均订单/基值计算周日权重,如下表:
星期X | 日 | 一 | 二 | 三 | 四 | 五 | 六 |
日权重 | 1 | 1.1 | 1.25 | 1.45 | 1.5 | 1.8 | 1.55 |
(4)对于特殊节假日,以日订单/基值计算节假日权重,如下表:
节日标记 | 端午节前2天 | 劳动节第2天 | 清明节第1天 | 双十一活动 |
日均订单 | 1700 | 2300 | 3500 | 2900 |
日权重 | 1.7 | 2.3 | 3.5 | 2.9 |
(5)合并(3)和(4),得到365天每天对应的日权重值,如下图:
▼ STEP2:计算周权重(考虑长期波动)
在零售业、旅游业、餐饮业里,销量往往会存在季节性的波动。同样,在一个企业的快速增长期里,从年初到年末,销量也会有稳定的增长。
这时候,我们需要将周波动考虑进来,用以刻画全年的波动情况。一年有52个周,计算每个周的权重,即每个周在该年度订单中的贡献占比。
计算的逻辑和日权重相似:
(1)计算2-3年内,第1周-第52周的每周平均订单量
(2)选择最小值作为基值
(3)以周均订单量/基值计算周权重,得到365天每天对应的周权重值
就像下面这张图:
▼ STEP3 :计算考虑长期波动的每日权重
考虑长期波动的每日权重=日权重*周权重
如下图:
导出了365天每天的权重,就像……在枪里装满了备用的子弹……
监控日常销售活动
如何利用我们计算出的每日权重值,来监控日常销售活动呢?
权重体现了每日的订单波动。
将每日的实际订单量/权重后,得到每日除权订单量,将每日除权订单量连接起来,也就是我们的权重曲线。
(1)在理想情况下,实际订单严格遵循波动比例,权重曲线会是一条水平的直线。表示忽略随机影响时,每天的订单仅受到趋势波动的影响,不受人为因素的影响,当然,这种情况是不存在的……
(2)在考虑随机波动的情况下,实际订单不会严格遵循波动比例,除权订单量围绕理想水平直线上下波动,是一条看上去还算水平的线。表示每天的订单量同时受到趋势波动和随机影响,表现相对稳定,不需要额外关注。
(3)在考虑特殊事件的情况下,比如往年只在双十一当天举行促销活动,但今年拉长了预售周期,活动时间为11月9-13日。在图中,我们也看见11月9-13日的除权订单量向上增长明显,打破了情况2下随机波动的相对平稳趋势。
我们认为,在除权订单量构成的曲线中,异常的凹凸波动,可以视为人为或者突发情况的干扰,需要给予重视。
量化特殊情况影响
用权重曲线能够表示订单的人为波动影响,但是凹凸不平……不够直观,所以可以借助黄氏曲线来展示更加直观的结果。黄氏曲线展示的是:一段时间内权重曲线的均值。
我们可以理解成,权重曲线用来跟踪销售;而黄氏曲线用来事后复盘特殊情况。将上面情况(3)的权重曲线处理一下,得到了黄氏曲线:
已知:
活动前:日均除权订单904
活动中:日均除权订单1237; 权重之和为10.22
活动后:日均除权订单940
计算出:
①活动带来的增量:[1237-(904+940)/2]*10.2=3213(单)
②活动带来的订单占比:259/11375=28.2%
③促销爆发度:(1237-904)/904= 36.8%
④促销衰减度:(1237-940)/904= 32.8%
其实在面试中,很少有面试官问出如此细致的问题。但问不到,并不代表我们可以放弃这一块的知识点逻辑。
曾经我也以为,数据分析是灵活的玩转python和R,精通算法模型。在遇到各种需求的时候,从神经网络到XGBOOST尝试一遍,最后给需求方送上一份最终的结果。
实际并非如此。因为凡是有点追求的需求方,在看见结果的时候,一定会问:“这指标怎么来的?”
当你大刀阔斧,颇费口舌的解释了一通后,人家仍然一脸疑问????——不好意思没听懂
有时候业务需要的,并不是什么高大上的算法,也不是精密的模型,只是希望你能说人话,至少让他们觉得你给出的结果符合业务逻辑。
从业务中来,到业务中去,用业务能听懂的逻辑,用业务能理解的分析框架,给她们提供结论和建议,也许才是双赢的结果。
在最开始学习数分的时候,我看了很多专业技术知识书,像《统计学习方法》、《利用python进行数据分析》、《大话数据结构》……
渐渐摸清面试规律后,又开始琢磨业务知识书,像《数据化管理》、《精益数据分析》……
而工作以来,不再局限于和“数据”相关的话题,相对轻松的工作环境给了我广泛阅读的时间和精力。我开始阅读我喜欢的,心理学&经济学&行为学相结合的书,像《乌合之众》、《思考快与慢》、《反脆弱》……也恰恰是许许多多的这些书,逐渐带着我以不同的角度去分析问题,偶尔颇有打开任督六脉的感觉。
我的leader总是告诉我,数据分析师最有价值的,并不是你写出的代码,也不是你给出的分析结论,而是刻在你脑子里的,属于你自己的分析框架。所以在每一个项目结束后,在每一份报告汇报完毕后,总会鼓励我进行细致的复盘,找到不同项目之间的思维共性。
最近复盘权重曲线框架的时候,我又重读了一遍《数据化管理》。突然发现“会员价值分析”和“竞品数据分析”两个章节,和我的工作内容也有些许的交叉……也许在提示我又可以继续整理分析框架了……
有人跟我反映PDF不够清晰,我只能……给你们推实体书了。研二的时候我买了这本书,面试借用了里面的人货场理论,一路带到携程,没想到在工作中仍然发挥了余温……
推荐阅读
欢迎长按扫码关注「数据管道」