总算是把用户流失分析讲清楚了!

数据管道

共 2690字,需浏览 6分钟

 ·

2022-01-14 16:24

大家好,我是宝器!


最近做了一些用户流失、生命周期分析相关的项目(电商领域)。些许实战经验,趁周末和大家聊聊。


经常听到有人提起“用户流失”这个概念。


有时候出自老板之口,他可能参与了几场业内交流会,听到“拉一个新用户的成本是维护老用户的10倍”,亦或是对于行业流量见顶的焦虑,深感阻止用户流失刻不容缓。


有时候出自运营之口,他们觉得花了老大劲儿拉来的用户,总得做点什么,不能让用户白白流失掉。不过更多时候,是KPI没完成,想把锅甩给用户流失的大趋势。


有时候出自分析师之口,对用户做了分层/分类之后,发现其中有那么一两类用户即将流失,需要针对性做点什么动作挽回。


我发现,大家虽然聊的都是“用户流失”四个大字,但往往不在一个频道。



究其根源,不同行业,不同岗位,对“什么样的用户行为算流失”这个问题的理解,千差万别。


注:不同行业,对用户的叫法会有些差别,例如电商行业会把购买的消费者叫做客户。本文为了易于理解,统一称为用户。



用户流失的两个关键


我们聊用户流失,首先要搞清楚的是“什么样的用户行为才算是流失”


这个问题,看似很难回答,不过只要抓住两个关键点,就能从容破题。


一是“动作”,二是“时间范围”。


用户什么动作,对我们来说是关键行为?


可能是登录,可能是使用时长,在电商行业更关注的是购买。


有了动作,还需要时间范围来判断流失与否。


通常用“是否超过了某个时间范围”来判断。


如果是电商品牌,一个用户,最近一次购买我们的产品,距离今天已经超过2年了,那他大概率已经流失,再也不会购买我们的产品了。


这两个关键点都很容易确定。动作嘛,大家很容易在内部达成共识;时间范围嘛,则是很容易吵得焦头烂额。


“凭什么你觉得一个用户2年没复购算流失?能不能有点危机意识!我偏要觉得2个月没复购就算流失!”


那,怎么样通过具体的时间范围来定义用户流失状态呢?



简单粗犷地界定


对于没什么数据参考,追求快决策,或者说大家不那么重视数据的公司,拍脑袋决策永不过时。


根据所谓的行业经验,直接拍一个数字。例如超过120天未回购的用户是流失用户,或者拍一个超过1年没回购的用户是流失用户,需要一波唤醒操作。


至于为什么阈值是120天,150天,180天或是1年,答曰经验。


严谨点的会说是行业通用法则或者是参考产品消耗周期,但这么回答的,大概率是没有真正调研过行业具体情况,更没有拉过各种产品消耗周期数据的。


拍脑袋界定用户流失周期的方法,简单,粗暴,结果的可执行程度和拍脑袋人的层级有关。如果是老板拍的,那必然是蕴含了丰富的行业经验,大家也会找一些数据来佐证合理性。如果是实习生拍的,那必然要被拍一顿。


怎么用量化的方式,更科学的界定流失时间范围呢?



如何用数据科学界定流失


先聊聊个体。


因为对产品、品牌无感,或者经历了很差的购物体验,有的用户虽然最后一次购买距今只有15天,但其实已经流失了。


有的用户沉寂150多天,就是为了等下波大促囤货。


还有用户已经1年多未复购过,但是一年半后他又回来复购了。


个体视角,能刻画出非常多有趣、生动的用户购买行为。不过要做分析,还得跳脱出个体,在更宏观的层面把握整体脉络。


量化的核心逻辑,是挖掘出不同时间范围用户,在此后一段时间的回购率分布。


通过用户最近一次交易行为距离某个时间点的远近,以及对应回购的概率,来描绘分布,找到拐点(魔法数字)。


第一步,设定一个时间锚点,界定区间。


比如2021年1月1日。以此时间点为分界锚点,确定流失分析的时间区间和回购分析的时间区间。



区间的界定有一定灵活性,回购分析区间的时间要尽量覆盖锚点前用户的预期复购时间,不能太短,一般会在3个月以上。


假设案例中的品牌消耗周期较长,有大促囤货心智,所以回购分析区间长度是一年。


第二步,在流失区间内分析用户距锚点的时间差。


说起来有点拗口,通过一张图来总结就很形象了。



在流失分析区间内,我们统计出每个用户最后一次的购买时间,并计算最后一次购买时间,和时间锚点的间隔天数(距锚点的时间差)。


例如A用户,他在2021年1月1日之前购买了非常多次,但我们关注的是他最近一次购买时间2020年1月1日,这个日期距离时间锚点2021年1月1日,间隔了366天。B、C和其他用户也是一样的道理。


第三步,判断回购区间内是否回购。



A用户,虽然在流失分析区间的时间范围内,最后一次购买距离时间锚点已经间隔了366天,但是他在回购分析的区间内(2021年1月1日——2021年12月31日)又回来购买了。


这一步是在前面流失分析的基础上,判断每一个用户在回购分析区间内是否复购。


第四步,跳出个体用户视角,分析 距锚点的时间差 和 回购区间是否购买 的分布关系



有了个体用户视角的明细数据,根据距锚点的时间差回购区间内是否回购这两列数据,很容易透视得到汇总的数据:



用可视化刻画更加清晰:



结果显而易见:不同的时间差区间,回购的概率差异很大。


最近一次购买时间距离锚点30天以内的用户,在锚点之后的时间范围,回购概率高达35%。最后一次购买时间越远,其后回购的可能性也越低。


根据分布图,有两种方法可以帮助我们解决“到底几天才算是流失”的问题。


可接受阈值法:


不同的业务模式、阶段,对用户流失的容忍度是不同的。有的业务模式认为用户回购概率低于15%,就应该算流失,做相关的预警和召回动作。那从图上来看,150天是一个合适的阈值。因为一旦超过150天,用户的回购率就低于15%。


拐点法:


还有一种拐点法。


通过观察曲线拐点,我们发现211-240天之后,用户回购率有一个明显的崎岖(下拐),从11%下跌至不足7%。意味着超过240天,用户回购率有一个明显到肉眼可见的下降幅度,突破了原有的平滑趋势。


可以把240天这个突破点(拐点)作为用户是否流失的阈值。如果用户最近一次购买距今已经超过240天,那他很可能已经流失。


拐点法除了要判断拐点,在用的时候,也要结合不同区间的量级分布。



后话


时间和篇幅有限,今天主要和大家聊了如何界定用户流失这个小话题。方法有通用性和科学性,但还是需要结合实际场景,才能发挥出更大的价值。

·················END·················

推荐阅读

  1. 我在字节做了哪些事

  2. 写给所有数据人。

  3. 从留存率业务案例谈0-1的数据指标体系

  4. 数据分析师的一周

  5. 超级菜鸟如何入门数据分析?


欢迎长按扫码关注「数据管道」

浏览 47
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报