最近在做的用户留存分析,和几种方法。

浪尖聊大数据

共 3160字,需浏览 7分钟

 ·

2021-11-29 22:51

来源:数据分析不是个事儿
进入互联网下半场后,互联网流量竞争愈发激烈,各种获客手段层出不穷,但获客成本仍在不断提升。

这就是问题所在,企业不可能无限制的投入成本拉取新用户。在当前互联网存量运营的阶段,留存重要性高于获客。获客是增长的必要条件,但在大多数情况下,我们过分强调了用户拉新,而忽略了用户留存,这可能是一个致命的错误。


怎么理解留存呢?

大家读书的时候一定做过这道蓄水池的题目,有一个进水管和出水管,灌满水需要X小时,放完水需要y小时。提问如果两个管子同事打开,多久能灌满池子?
现在想想,这和我们用户的拉新和留存是不是一个逻辑?如果出水量大于进水量,那么最终水池里会一无所有。对比来看,进水管就好比获客,出水管就好比用户流失,池子中的水就是留存,用大量的成本去获客,但由于各种各样的问题,导致用户留不下来,最后白忙活一场。中国有个歇后语叫做”狗熊掰玉米,掰一个扔一个“,也可以用来形容这种场景

我们再举个例子来解释一下,曾经有个数据分析产品公司模拟过这样一个场景:

假设有2个产品A和B,每周获取的新用户数都为100,新用户的次周留存率都是60%,往后每周B产品的留存率都要比A产品高2个百分点,注意,仅仅是高2%,29周后,B产品的用户达到了1400位,而A的用户仅有700位,

这就是数据分析后的事实。对比两种情况,他们的拉新量一致,留存率仅有 2% 的区别,但是 29 周之后,用户数差了一倍。这组对比数字形象的说明了用户留存的重要性。

所以很多公司一顿操作猛如虎,各种融资,融资完就开始烧钱投放做广告,结果一看,怎么还是比不上竞品的用户数,甚至每年净利率仍是负数。




不过现在也有很多公司越来越重视留存,我认识一些产品经理和运营,一年核心的KPI就是提高2-3%的留存率,看着这个数字不高,一年后却天差地别;但话说回来,别看数字小,但想提高也并没有那么容易,这里就需要科学有效的分析,找到合适的留存分析模型。

留存分析模型




多长时间算留存,怎么样才算留存,这个因业务类型而异。就拿滴滴来说,他的用户分为B/C两端。对于B端用户,也就是司机,开车是职业,所以是一个高频的行为。留存时间窗口的选择需要短一些,次日留存,3日留存,7日留存等。而对于C端用户来说,打车只能算是一个中频行为,天天打车的用户毕竟还是少数。留存的时间窗口就可以从7日开始算,也就是7日留存,14日留存等。

留存分析模型重点在于对用户的分群,分析不同类型用户的留存情况,找到差异,定位解决问题:

模型一:新老用户同期群分析(Cohort Analysis)方法

同期群是用户分析最普遍的方法,在著名的《精益数据分析》中也被多次提到。比如用每周的新用户,观察相同时间间隔后的表现。例如图一,2019/1/1的新用户在第一周的留存率是49%,但2019/2/5的新用户在第一周的留存率是却只有40%,这就说明新用户的留存率在下降,需要重点关注。并且可以对比后续每周的表现,看是否好转。

为什么要区分新老用户呢?因为新老用户对于产品的反应是有很大差别的,一定要区分来看。比如你第一次去京东,由于不熟悉这家电商,很有可能逛逛就走了;但如果你是一个京东的老用户,登录京东后就很可能产生购物行为。通过区分新老,能够清晰的看到这两种用户的表现,便于发现到底是哪种用户发生了问题。

如果是新用户的留存下降,很可能是新用户没有快速的感受到产品的核心价值。比如物流,用户的主要诉求就是快,那么对于新用户是否能让他感受到这个价值。如果是老用户的留存率下降,也许是产品的体验在变差,或者受其他竞品的影响。



图一 新用户同期群分析



图二 老用户同期群分析

模型二:渠道同期群分析方法

企业经常采取多种渠道来获客。有线上的方式,比如百度搜索或者抖音短视频等;有新媒体的方式,比如公众号,知乎等;有线下的方式,比如线下沙龙和公众活动。各种渠道的获客都需要成本的,我们需要知道是哪种渠道的新用户留存高,留存率高说明这是高价值渠道,我们可以在这里做更多的投入。

比如图三,可以明显观察到,渠道一用户的留存率明显高于渠道二和渠道三,说明渠道一的用户和产品的契合度更高,为高质量渠道,应该在这里加大投入。



图三 渠道同期群分析

模型三:产品功能留存矩阵


一个产品一般具有很多功能,通过分析了解各个功能的价值,找到各个功能的提升空间,进而通过功能优化来整体提升用户留存。

以图四为例,矩阵的横轴是功能的留存率,表示当前功能的用户黏性;纵轴是活跃用户的数量。做出这样一个矩阵后,我们就可以看到不同的功能在矩阵中的位置分布。

1 比如橘色代表的功能就是产品的核心功能,使用率和留存率都很高,我们要保证核心功能的体验越来越好,并持续监控使用情况,防止意外发生;

2 比如绿色代表的功能,这个功能虽然使用的人数不多,但留存率非常高,说明这个功能的体验很好,我们要尽量引导用户使用这个功能;

3 而对于红色代表的功能,虽然使用的用户很多,但留存率不高。也许是这个功能有用,但体验不好;也许是这个功能本身就是鸡肋;所以我们要继续深入分析,来决定是优化功能还是直接下线



图四 产品功能留存矩阵

进行留存分析的时候,我们更多时候要学会做问题拆解,把提升留存率这样一个大目标拆解为一个个小的可执行的目标,我们就可以通过产品优化、运营调整等等方式来实现用户留存提升。






在我们常见的留存曲线中,通常会根据用户的旅程划分出不同的留存阶段。







  • 振荡阶段,我们主要关注用户激活,在这个阶段中,我们需要让用户迅速低成本地感受到产品的核心价值

  • 选择阶段,在这个阶段,用户对产品有初步了解,开始探索产品是否满足其核心需求,我们就要关注老用户的留存提升,打造好产品的核心功能,培养用户对产品的使用习惯。

  • 平稳阶段,用户已经基本养成使用习惯,我们接下来就要思考产品对用户的长期价值是什么,如何才能让用户反复体验到产品的价值。


1、分组


用户留存分析的第一步是按照不同的(时间/渠道/行为等)维度进行用户分组。比如我们在对某一个平台用户留存率进行日常的数据分析时,通常是按照单个自然日进行分组,然后对任意时间段内获取到的新用户在留存率上的表现做出个报表。


先把常用的几个用户生命周期指标给大家:





我网上找了一个某社区类APP按照用户的获取日期进行的一个用户留存情况分组图。从图中可以看到具体每一天的用户留存表现情况。比如在6月28日这天获得的用户,一天后留存率27.8%,两天后留存率是13.5%,三天后留存率是11.3%。





如果想深度地挖掘哪里出了问题才导致这款社区型app的次日留存率这么低,只有这种图是不够的,我们还需要进一步地分析用户行为分析。


2、对比


  • 拆分影响因素,排除无关因素。

在我们进行数据分析之前,要先对影响因素进行拆分,如果要对比APP的拉新效果,就要将因素拆分为访问量、点击量、注册量等等,这些被拆分出来的因素就是我们要对比的指标。



同时也要排除掉无关的因素,比如APP某几天浏览量的下降,可能是因为平台全面限流导致的,这样的因素会影响我们对数据变化的判断,不能帮助我们找到产品缺陷,因此要排除出去。


  • 多维度对比,一般分为四种。

  • 时间维度:同时期对比或者上一时期的对比,包括环比、同比。

  • 空间维度:比如不同城市的对比、不同行业的对比、不同国家的对比。

  • 计划维度:比如与计划值、平均值、中间值的对比,多为差异对比。






简单的归纳就是留存分析模型是用来做用户活跃相关的数据分析,而且更多的是需要配合对比(时间上/分组上)来进行使用,从而获取有效的信息。

浏览 105
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报