数据分析:如何预估一年后某直播平台的DAU
点击上方“数据管道”,选择“置顶星标”公众号
干货福利,第一时间送达
大家好,我是宝器!今天这篇文章主要来源是胖里做的星球前段时间的一个作业,具体可如下。
原题目
宝器直播平台现在次日留存率是60%,3日留存率是50%,7日留存率是30%,15日留存率是20%,30日留存率是10%,大概每天有10w新用户,请计算出一年后此直播平台的DAU是多少。
DAU(Daily Active User)日活跃用户数,常用于反映网站、互联网应用或网络游戏的运营情况,此指标也可用来衡量用户粘性和服务的衰退周期。因此有时会简化日活模型,粗略计算未来一段时间产品的日活,通过日活去估算一些潜在的收益或运营成本等。
有些题目可能换了个问法,但是实际上本质不变,如:
某app,按照目前的推广和留存数据,预计未来最多能够达到多少日活?
为了在半年后达到某一指定规模的日活,每天的推广应该是多少?
某app的留存需要达到什么值(级别),才能使得推广与收益打正?
分析的①个思路
日活一般会受到多种因素的影响,比如产品的迭代、运营活动的推广等,这其中的因素有的影响大,有的影响小,有的影响可以量化和预估、有的不可预估。因此在进行日活的预估时,可以选择从影响比较大的因素入手,剔除影响小的因素,通过数学建模得到一个可计算的状态。
具体可分为如下几个步骤:
1. 建立日活的数学模型
每日新增用户数和新增用户的留存率是影响日活最本质的两个因素。
某天的日活可以看成当天的新增用户数+昨天新增用户的次日留存用户+前天新增用户的二日留存用户+......,以此类推,可以将日活定义为当天新增用户和此前每天新增用户在当天的留存用户之和。因此,就可以用公式将日活表示出来:
DAU(n) = A(n)+A(n-1)R(1)+A(n-2)R(2)+...+A(1)R(n-1)
其中,DAU(n)为第n天的日活,A(n)为第n天的新增用户数,R(n-1)为第n-1天后的留存率。如果假设每天新增用户数是一个固定值A,那么上述公式就可简写为:
DAU(n) = A(1+R(1)+R(2)+...+R(n-1))
这就是一个简单的日活的数学模型,此时如果A和R都已知,则可进行对应DAU的预估。原题目中给出了固定值A=10w,是个确定值,而R只给了几日的,因此,接着需要进行留存之和的预估。
2. 预估留存
留存率是产品一个最为核心的指标,一般产品都会有对应的留存率衰减曲线,如下图所示。
从图中可以看出留存率衰减曲线与幂函数比较类似,其实业内绝大部分产品的留存衰减曲线基本都符合幂函数曲线。
在此基础上,便可以通过幂函数来近似地拟合留存率衰减曲线,从而预估出留存之和。
进行产品留存预估时,一般都会使用此产品的一些先验的数据进行,比如产品已经上线了一段时间,那么就可采用历史的数据作为基础;如果产品还未上线,那么可以将同类型产品的留存数据作为参考,毕竟不同类型的产品,其留存和衰减的速度也不太一样。
在已知某些天留存的前提下(如题目中的次留、3留、7留等),可以通过函数的拟合来预估每天的留存,以Excel的简单拟合计算为例,具体步骤为:
第一步:
已知产品次留为60%,3留为50%,7留为30%,15留为20%,30留为10%,在Excel中按照留存天数及其对应的留存率,画出散点图。
第二步:
在此散点图的基础上,添加趋势线,由于留存率衰减曲线与幂函数比较类似,所以此处在趋势线选项中,可以选择幂函数,并显示幂函数公式。
如图,其中x为天数,y为天数对应的留存率,通过此幂函数公式就能得到对应天数的留存率。
3. 预估DAU
基于上述方法,可以算出天数对应的留存,求和带入计算日活的公式中就能预估得到第n天的日活水平。
上述只是提供了一个预估日活的思路。从考虑各影响因素进行建模开始,到对日活公式中涉及到的变量进行定值或预估,从而达到计算日活的目的。因题目中给了固定的每日新增用户数和几日对应的留存,所以相对来讲比较简单。
此外,也需要注意,上述的过程存在一定误差,可能无法满足所有的场景。有的产品其生命周期是有限的,可能不一定满足在N天后还有留存,可能会完全流失,这也是使用幂函数(长尾)进行拟合的一个弊端。因此可考虑对尾部数据进行删减处理或者采取指数型函数进行留存衰减曲线的拟合等,这样应该会减少误差。
更多相关讨论(以下是其中一个,限于篇幅不全部列举出来,可自行扫码预览决定是否入圈):