数据如何赋能产品—Magic Number

共 2254字,需浏览 5分钟

 ·

2020-08-04 18:46



作者:Rian
来源:Data Science数据科学之美

一、背景 



    产品除了活跃的数据, 留存的数据也是至关重要的, 优化好了留存, 也就提升了活跃, 所以数据分析师天天会被产品问到的一个问题就是: 我们到底应该怎么去提升我们的留存, 非常烦, 你们有没有这样的感触?

    互联网思维中的一条就是用户至上, 留住用户才有故事。

    那么我们怎么通过数据去帮助产品去发现留存的关键行为呢, 去解决我们烦心的问题呢?

    我们的分析目标: 影响留存的相关的关键行为有哪些?这些行为和留存哪一个相关性是最大的?这些关键行为和留存是否存在因果关系?



    

二、分析思路 


    分析思路和方法:

    


  1. 首先是关键行为的提取, 这一步就是利用sql 从数据仓库中提取你想要的与留存相关的数据行为, 这一步是最麻烦也是最费时间的

    

    2. 利用统计学的相关性的计算方法, 可以计算第一步计算的每一个行为与留存的相关性, 相关性的系数越大就代表这个行为跟留存是越相关的, 就代表它可能就越影响留存, 比如刷抖音的次数跟留存的相关系数是 0.6, 刷抖音的时长和留存的相关系数是0.8, 就可以说明刷抖音的时间

    

    3. 然而数据分析中的相关关系不一定是因果关系, 比如很多人喜欢张杰跟他唱歌好听是相关的, 我们就不能一定说, 他唱歌好听是大家喜欢他的原因, 可能真正原因是他的颜值哈哈,  所以类似的, 我们的这些关键行为也不一定是决定留存的原因, 可能只是具有相关性, 所以我们就要去推断 a 是b 的原因, 利用的方法是granger test因果检验的方法。


    4. 当我们已经判断了XX 行为就是留存的原因, 比如你一周刷抖音的时间是你下一周是否会留存的原因, 那么接下来就是去发现到底刷抖音多长时间是留存的magic number, 这个magic number 非常神奇, 就是比如你一周刷抖音288分钟, 你下周留存的概率会大大增加, 这个"一周* 刷 * 288分钟" 就是互联网中最经典的magic number.

    抓住了magic number, 也就抓住了一个产品的留存灵魂。



    

三、关键行为特征 


    拿某直播app 作为例子, 与留存的相关的行为可以分为 登录行为, 观看行为, 弹幕行为, 付费行为, 然后在每一个大的行为分类进行小的指标的刻画, 比如去描述登录的行为我们就可以用 30天登录天数, 7天登录天数, 还可以用比率型指标, 像最近30天的登录天数和过去30天的登录的天数的比值, 这个反应了用户活跃度的变化。




四、相关性分析 


    上一步已经提取完了所有跟留存相关的行为特征, 这一步就要进行计算留存和这些特征的相关性。




留存相关最大的四大因素:


30天或者7天登录天数(cor: 0.66

30天观看品类个数(cor: 0.44)

30天观看主播数 (cor: 0.37)

30天日均观看时长(cor: 0.26)


五、因果分析 


    

    因为我们只是找出了跟留存相关的行为特征, 但我们不知道这些行为特征是否是留存的原因, 所以就要通过granger test 因果推断的方法去验证这些行为特征是否是留存的原因。


    原理:个经济变量XY之间的格兰杰因果关系定义为:若在包含了变量XY的过去信息的条件下,对变量Y的预测效果要优于只单独由Y的过去信息对Y进行的预测效果,即变量X有助于解释变量Y的将来变化,则认为变量X是引致变量Y的格兰杰原因


    原假设和是否拒绝: X Y 是不存在因果关系, 当经过格兰杰因果检验后计算出来的 p 值大于0.05 则接受原假设, 否则拒绝原假设




主要结论: 

六、Magic Number 



    发现了影响留存了原因以后, 我们就要寻找这些行为是达到一个怎么样的值以后, 会大大影响留存的概率, 所以我们计算了30天登录天数, 7天登录天数, 月日均观看时长, 30天观看主播数, 30天观看品类数和留存的关系 下面是画出来的图. 

    拿30天登录天数作为例子, 横轴就是 30天内不同登录天数, 纵轴就是留存率, 当横轴为7的时候, 留存率趋于稳定, 这时候就达到较稳定的状态也被称作 aha moment.


我们可以发现几个神奇的magic number 

月登录4天

周登录三天

月观看7个主播数

月观看4个品类数

月日均观看时长4分钟



◆ ◆ ◆  ◆ 

麟哥新书已经在当当上架了,点击下方小程序即可进入当当购买页面:




数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:


猜你喜欢

 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》

 厉害了!麟哥新书登顶京东销量排行榜!

 笑死人不偿命的知乎沙雕问题排行榜

 用Python扒出B站那些“惊为天人”的阿婆主!

 你相信逛B站也能学编程吗



点击阅读原文即可参与当当购书活动

浏览 33
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报