聊聊用户分群分析

数据管道

共 5228字,需浏览 11分钟

 ·

2022-05-20 09:25

大家好,我是宝器!今天主要分享下关于风控应用场景下客群相关的分析。
我之前说过,个体不重要,群体才重要。因为没人把你当回事,平台也不把你当回事。
做风控的目标不是为了零风险。你不能把所有存在风险的客户都拒绝掉,你也做不到这一点,因为每个人每笔交易都存在风险,程度问题。你不能说一个芝麻分600分的人,比一个800分的人差,个体符合测不准原理。但是你可以说,六百多分的这群人没有八百多分的那群人好,这是对的,群体是测得准的。
风控不关注个体,1w个人申请,你通过了3k人,不是说这3k里的每个人都是会准时还款的。实际上是,你把这1w人按风险排序分成10组,每个群组里计算收益率,风险排序足够好的话,这10组的收益率是单调的,收益率为0作为分界线,你取出了其中前3组。实操中,不必真的算收益率,逾期率好算的多,也不必用0作为分界线,取一个业务上合理的阈值就可以了。
你从来没有关注过个体,而这却是对的。所以你常常会见过,风控把一些正常行为拦截了,例如反复让你校验验证码、刷脸失败、交易被拒绝、投保被拒等。
在金融市场上,那些金融机构不管你姓什么,是谁的儿子,读过多少书,有什么意识形态,持什么政治信念,信仰什么宗教,只要你具有交易信用,有支付能力,他们就会跟你做金融交易。
对平台而言,没有个体,只有客群。你觉得你是VIP,联系客服去投诉,在他们眼里,你也就是个爱投诉的客群而已。你真觉得你是什么VVIP吗?
在金融领域,我们把对客群的理解统一称为KYC(know your customer),分客群也可以说是打标签。基于客群,我们制定差异化的策略,使得对客户的管理达到最优。
客群的概念远不仅限于金融领域,而是在几乎所有互联网业务中都扮演着举足轻重的地位。我们制定新策略、推出新产品、调整运营方案、进行战略升级、举办一些活动,都需要在了解客群的基础上进行。
数据驱动的行业更是如此,分析师们根据经验或大数据抓耳挠腮地去分析各种维度,探索客群的规律和特性,希望能找到新的盈利增长点,找到新的活跃客户和高转化客户,可以说客群分析是他们的一切。
我们先说说客群如何划分,然后对当前主流互联网业务进行展开,包括消费金融、电商、社区团购、短视频、直播,看看这些业务都在关注什么样的客群,以达到对用户最好的管理。
01
如何分客群
不同的人差别可能很大,一个模型、一条策略不能有效地适用于所有客群。这时候,把客群划分成某些类别是很有必要的,例如收入高的、收入低的。一句话概括,分客群就是把具备某种相同特性的人归结在一起,就好像我们总喜欢基于某些特性给别人打标签或者被打标签。
对于互联网业务来说,用户的背后就是数据,客群划分其实就是基于数据的分类。
我们先说可以获取的数据。
用户与平台交互产生的数据大体上讲可以分为三类:基本属性信息、行为信息和交易信息。基本属性包括用户的年龄、性别、学历、出生地、常驻地、职业、是否有车、是否有房等,这些信息有的可以从身份证、手机号上解析,有的是用户填写,有的可能需要根据其他信息推断,有的还需要授权去查询。行为信息则是用户在平台端频繁访问留下的数据,主要是浏览、点击、输入。交易信息则是用户历史的交易情况,互金的借贷和还款,电商订单,外卖订单,出行订单等都是。此外,有一些数据平台自己没有,但是又需要用,可以经过授权从行业层接入一些相关数据,如征信报告等。
要知道,互联网金融业务一般会比其他业务如搜索、广告、推荐拥有用户更精准更全面的信息,这是生意属性决定的。大数据风口上产生的一大批数据服务平台,就大多是为互金行业服务的。基于此,客群的作用在互金领域比其他场景理应都大。
我们再来说如何分客群。
客群划分可以基于单个数据维度划分,也可以基于多个数据维度复合划分。单维度可以对客群做一个类似于切面的划分,比如:职业、年龄、收入水平等;复合维度的划分则需要更多的业务理解,例如基于RFM进行用户价值分群、决策树分群、聚类分群等。
单一维度的分群很好理解,例如我们根据年龄这一个信息,可以把客户分为少年、青年、中年、中老年、老年,阈值没有严格固定的要求,但一般18岁以下的未成年人是特殊人群,65岁以上的老年人在互金领域一般也会排除在外。这种连续变量可以按照某种含义切分成类别型变量用作分群。还有一类离散变量例如性别、学历,甚至所在城市等级,本身就很适合作为分群变量。我们关注这些分群,可以深入理解业务的客群结构,从而帮助我们进行宏观决策。
单一维度分群主要根据经验确定,除上述提到的基础信息外,还可以定义许多跟所属业务相关的分群。在互金信贷领域,这样的分群包括但不限于不同收入的客群、不同活跃程度的客群、额度使用率高低的客群,甚至是不同逾期程度的客群等等。
此外,还可以对特征进行单变量分析,从中挑选出区分效果好且稳定的特征,不管是模型还是策略,都可以重点依赖这些变量决策。如果这些变量具备合适的业务含义,就可以划分等级作为分群进行持续性跟踪分析。
复合维度的分群是精细化运营的必然产物。我们刚提到的RFM模型就是很好的分群思路,它是从最近一次消费(Recency)、 消费频率(Frequency)、 消费金额(Monetary)三个维度来标记客户的特征。RFM模型是衡量客户价值和创利能力的重要工具和手段。我们可以根据RFM指标区分出不同重要级别的客户,从而为用户管理提供数据支持。

RFM只是复合分群的一个代表,实践中复合分群可以是各种维度信息的组合,可以通过聚类、决策树来自动对样本进行分类。
其实,我们做的各种模型,都可以看成复合维度的分群,风险模型就是将高维变量加工成风险评分,从而得到风险分群。活跃度模型也是得到活跃度的分群,流失预警模型是按流失可能性得到分群。
另外,除基于数据的分群外,还有一类基于经验的分群,主要是利用从业务知识中了解到的客群差异性来做分群,如不同的营销渠道上风险差异较大,那就可以关注渠道分群,新的子产品上线了,业务更下沉了,那就可以关注是否是这个子产品的用户这个分群等等。
02
消费金融
消费金融不仅仅是在平台内先享后付的金融,基本上所有的小额借贷都是用于消费,毕竟用于投资划不来。也就是说,消费金融不仅仅是花呗和白条,借呗、金条和各大银行的信用卡、消金平台的贷款产品都包括在内。
那消费金融关注哪些客群呢?
一笔消费贷款完整的周期包括借款和还款,借了不还就产生了损失,所以要做风控。风控关注点背后就两个,还款能力和还款意愿。分群本质上都跟这两点有关系。
这样的分群包括但不限于收入分群、多头分群、活跃程度分群、额度使用率分群,甚至是逾期程度分群,等等。
以收入分群为例,可以根据月收入划分档次,收入代表了客户的还款能力,还款能力越强,统计意义上信用风险会越低。收入分群一般成偏正态分布,中等收入的客群人数占比较高,极低和极高收入的两端人群较少,且收入越高风险越低。收入分群不仅可以用来做风险决策,还可以用来做额度管理,收入低的不应该给过高的额度,超出能力的提前消费会暴露较大的风险。
再例如多头等级,多头相关的信息非常多,有登录、申请、借款、还款、逾期等一系列信息,很难通过单一变量定义出高效的多头客群。可以以多头变量对风险采用决策树建模,辅以经验优化,得到组合多个变量的多头分群,如轻度多头、一般多头、严重多头。这样的多头分群就可以看作复合分群的一种。
活跃分群可以分为近半年活跃、近一年活跃、历史活跃、从不活跃等。近期活跃的用户当然今后的活跃度也会更高,这部分用户贡献了最多的余额,并且风险相对也是低的。促活的意义在于用户越用就越好,很好理解,和平台交互越多,大浪淘沙,自然越来越好。
也常常关注额度的使用情况,额度使用率变高一般风险会升高,很好理解,可以用但却不用,欺诈风险显然没有,信用风险不说绝对没有,也是很低的。最终表现出了风险大部分是产品设计问题。
逾期更不必说,未逾期的是衣食父母,轻度逾期的不用催收也可能自然回款,适当提醒还可以挽救客户关系,中度逾期扔给催收,重点逾期卖资产包吧。
获客收入高的,转化活跃低的,用户质量越来越高,信息越来越厚,平台就越开心。
以上,就是我为什么老说策略的精髓在于分群。
03
电商、社区团购
经典的“人货场”三板斧,于电商平台而言,就是三项关键工作,选品、店铺运营、用户管理。品类要分群,店铺也要分群,在这个双边市场里,我们还是关注需求方,聊一聊客群。
电商平台的运营策略差异化主要从3个角度出发:基于用户的活跃度、基于用户对不同商品的偏好、基于用户所处的决策阶段。
活跃程度分群,最经典的就是前面说的RFM模型。对于流失客户,是否要考虑采取召回策略;对于高价值用户,是否可以向其推荐更多精准的商品。
偏好分群是基于用户对不同商品的偏好,将用户区分成“美妆类”、“鞋帽类”、“数码类”、“书籍类”等不同群体,然后精准推送新品。也可以进而根据品类和购买力,将用户分为土豪、白领、蓝领、低收等客群。
基于用户决策阶段,是关注用户的关键行为,甚至是行为的路径。例如,“领取了优惠券,但是未使用”的客群,可以采取精准的推送,刺激用户的转化。例如,“提交了订单,但是未支付完成”的客群,可以去用户细查,仔细分析每个用户的操作流程,一般就能发现问题出在哪。
另外,撤单、退货、投诉等也是重要的分群。这些分群既可以用事实标签,还可以做模型预测。
以上分群在后台无时无刻不扮演着决策工具的角色。另有一类耳熟能详的分群走到了台前,例如会员等级。基于购买力和购买习惯创造出一个会员等级这样的产品,展示给用户,可以和用户建立良性交互。“我的级别没你高,我要买东西超越你。”
社区团购相比电商,更高频更必需,分群倒没什么,就是以社区为单位的客群运营。平台主要是提供好供应链、物流仓储及售后支持,出发点是流量的争夺,尤其是下沉城市用户的争夺。社区团购业务本身不做什么精细化客群运营。
平台的目标就是挖掘好的客群,并且把不好的客群运营转化成好的客群。
04
短视频、直播
短视频太“有毒”了,以至于我抵抗不了自己的意志,然后把抖音app的网络给关了。这样如果想刷,需要先去设置打开网络,这一步我的意志力能稍微负隅顽抗一下。
它是怎么做到的呢?
智能算法非常强大,根据你的观看或者评论,就能准确地推算个人爱好,接着推荐给你很多相似内容。而为了寻求极致的观看体验,推荐的视频都很精美,尤其是抖音,让观看者沉浸其中,无法自拔。
不管是快手还是抖音,营收主要都是靠广告、直播、电商,比例有所不同。视频生产者用尽手段让用户为之停留,再利用冲击力极强的戏码给足观众快感,广告主收获海量用户,平台坐收广告费,再精准推荐直播间
对广告而言,不管是借贷、游戏、交友、医美,还是之前的教育,大多都是竞价广告,点击-下载-安装的转化率算的明明白白的。投放要定向,定向就要找客群,前文提到的常用客群,照样会用在这个地方。除了根据人群标签投,还会根据CTR预估模型去投。
直播和电商更有趣,也更复杂。新手期时需要有一定的停留时长,来证明用户是喜欢你的直播间的,因为只有喜欢他才会购买,这是一个比较简单的道理。
但平台是非常关注时间的,就是每个用户能够在这个直播间里消耗多少时间。如果用户在这里消耗了很多时间,但是销售额或者说GMV不增长,平台是不喜欢的,有些带货直播间拼命憋单拉停留时间,但是GMV做不上去,这种直播间也是拿不到流量的。
因为,每个用户在APP的停留时间是有限的,他如果在你的直播间消耗了很多时间,却没有产生GMV,对平台来讲就是损失,它完全可以把这个用户分发到别的直播间去,别的直播间有能力产生GMV。
平台在电商这块真正要的是,你在较短的时间内完成成交,而且不过度消耗时间。所以,对用户的运营,不仅仅是单一目标为出发点,而不是多目标优化问题。
点击率、转化率、客单价,以及越来越重要的复购,背后都有大数据去排序、去组合,最终找到那个需要的客群。
好的客群,大多是重复的,一个人既是微信、支付宝、京东的用户,也是抖音、快手、美团的用户。故事从来不是“你好我好大家好”的关系,从来都是PK关系。客群做得好,经营到极致,本质上就是互联网业务的流量之争。
我曾经吐槽这些互联网业务,说:
消费金融:不管需不需要,让人人有钱借,人人上征信;
直播:不管哪路神仙还是妖怪,让人人都当演员,假装热爱;
社区团购:买菜买菜买菜,让后疫情时代的生活也能像疫情中一样,被投喂;
电商:下单更快,送货更快,快感也更快消亡;
短视频:凡夫俗子只关心如何打发时间,让他们更凡让他们更俗;
是的,要做到这些,就得分客群。谁分得更细,谁效率更高。
面向客群,大有作为。
·················END·················

推荐阅读

  1. 我在字节做了哪些事

  2. 写给所有数据人。

  3. 从留存率业务案例谈0-1的数据指标体系

  4. 数据分析师的一周

  5. 超级菜鸟如何入门数据分析?


欢迎长按扫码关注「数据管道」

浏览 115
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报