风控分析的三十条经验

数据管道

共 3041字,需浏览 7分钟

 · 2022-01-14

我们去读历史、读哲学、学投资,永远只有极少数人会认真研读《史记》《毛泽东选集》《巴菲特致股东的信》等,极多数人只会不求甚解,但需观其大略。

闲来无事,把之前写过的文章的核心观点总结成三十条经验。再多就多了,再少又不够数,正是时候。

这些说法要么继承要么创新,我们不追求溯源,只关心致知和致用。因为我们追求的道是“日用而不知”的道。

另外,这些经验在之前的文章里有充分的论证和解释,有印象的当然也只会是少数。

写作本文缘起于,跟领导的领导的领导汇报,过多的论证和说明反而没效用,不如精准表达的核心观点。

PART 1

1、风控的底层逻辑在于有效地衡量用户的还款能力、还款意愿和多头借贷。多头数据之所以如此重要,是因为某种层面上它能修正还款能力和还款意愿的计算。真的有钱和借来的钱,在能力和意愿上是不一样的。

2、大数据风控怎么做,本质就是大数据怎么用的问题。两个用法。简单地用,是策略规则;复杂地用,是模型。

3、风控之道在于前中后的用户生命周期管理。贷前管理避免损失,贷中管理减少损失,贷后管理回收损失。

4、风控之术是什么呢?就相当于问风险管理部门每天的工作本质上是在做什么,当然是做策略和模型。注意,策略做策略的事情,模型做模型的事情,切不可该通过策略做的事情硬要通过模型去做。

5、业务和风控的关系,就跟策略和模型类似,初期都是原则经验至上。经验的效益触顶,就要开始做精细化运营,这时候最需要大数据模型方案。

PART 2

6、用户画像简单来说,就是用户信息的标签化。一个是基础属性,一个是风控属性。基础属性的画像,重在了解你的客户;风控属性的画像,重在理解你的业务。

7、风控决策引擎本质上是一系列规则的集合,决策流程有两要素,一是规则清单,二是规则被执行的顺序。

8、模型也可以理解成一条规则,只不过它是将许许多多的弱变量组合成一个强评分。强变量用于规则,弱变量用于模型。他们的本质都是对用户分层,方便我们将用户一分为二,使其通过或拒绝。

9、业务总会不断对策略进行迭代优化,这往往导致策略体系过于庞杂,怎么样从庞杂的体系中分清轻重是策略同学的核心能力。平衡决策对通过率的影响和对风险的影响,对成本的影响和对收益的影响,是风控策略从业者需要培养的职业嗅觉。

10、我们无法说模型重要还是策略重要,这两者都很重要,没有必要分什么高下。但如果说模型思维和策略思维呢?一定是策略思维更重要,因为策略是更贴近业务的。

PART 3

11、策略的三板斧总结起来就是分群、触达、额度定价。年龄是分群,收入是分群,多头是分群,模型也是分群,是风险的分群。分群又是额度定价的关键。别忘了触达,你还要做投放、做产品优化、做用户体验。关注转化的同时还要关注风险。

12、模型开发是为业务需求服务的,高效解决业务的难点和痛点,就是模型开发的护城河,而不是所谓的算法。如何对遇到的问题设计合理的解决方案,比模型本身重要的多得多。

13、如果你只会对确定的样本、确定的特征、确定的标签,建一个所谓的大数据模型,不管这个模型是LR,是XGB,还是神经网络,还是图算法,其实都是不够的。风控是一个业务经验很重要的领域。

14、样本选择是最能体现模型开发定位和目标的,也是最吃功夫的部分。不同模型的开发,其他的有迹可循,唯有样本的选择是各有各的不同。

15、模型开发时我们总是在关心模型效果,但当模型开发完后,最重要的是稳定性。没有策略会盯着模型分的变动反复调整阈值的。有问题的信息千万不要用。

PART 4

16、策略和模型之上,要做好监控。使用没有监控的模型,就像使用没有指针的钟表,它可能在工作,但你怎么知道呢?另外,监控一切容易,响应一切困难。

17、数据分析的三板斧,看趋势、看对比、看细分。解读监控报表亦如是。光有一个数据是无意义的,比较才能使其有洞见。怎么比?和过去比,和其他的比,分开了自己比。

18、线上如果出现问题,很难直接指向模型,因为复杂性其解释权都在模型同学手上。策略同学不要听他们的解释。问题容易出在模型上面,但不是说“锅”都是模型同学的。如果模型和策略是分开的,还是配置个模型验证团队吧。

19、风控中,做一个新模型,或者一条新策略,都是要充分评估更优的。迭代的模型要跟很多东西对比,首要对比的就是想要替换的模型。策略的优化第一个要比的也是原策略。真正意义的ABTest在风控里不存在。

20、工作中,风控的节奏不如营销增长那边那么快,因为风险是后置的,无法去快速又高频地测试。

PART 5

21、芝麻信用这类产品,与消金信贷机构的A卡B卡是有很多不同的,关键在于前者要和用户交互。这意味着,构建这样的模型时要根据经验挑选覆盖各个维度的变量,并使其保持绝对的可解释性,而不光是选择区分度高的变量。因为,信用衡量的是先享后付的能力,那就是要让该享受服务的人能享受到服务。一个该一个能。该的人不能,不该的人能,是要解决的关键问题。

22、不要过于关注风险。什么都不做才没有风险。

23、有征信数据和借款人的借贷历史数据,它就是判断一个借款人还款能力和还款意愿的强数据。这些强数据就是反映一个人未来还款与否的最重要的指标,其他的大数据只能是一个补充。

24、因果关系很难,但相关关系很容易。我们从来不能很好地解释,这群人逾期的原因是什么。我们擅长计算,这群人具备这些特性,他们的逾期水平比较高。

25、模型是对简化目标的学习,简化目标就要符合你的业务目标,这跟产品的第一层是用户体验本质上是一样的。真正的模型迭代有两种,一种是在简化目标下不断提升效果,另一种是让目标简化地更精准。

PART 6

26、在信贷业务中,用到的黑名单也容易越积越多,这容易导致其失效,尤其在场景非常丰富的大厂。我们可以对其中低风险的人群清退,就像失信被执行人履约完毕后也会被退出一样。但归根结底,黑名单清退的价值没那么大。另外,黑名单清退的逻辑在于六个字的思想:不要轻视敌人。

27、对于一般公司而言,联合建模太麻烦了,往往不如直接接入标准产品。标准产品省去了联合建模的麻烦,同时还避免了建模中样本过少以及后续客群迁移导致过早失效的问题。

28、小贷公司的风控问题是,缺少自有数据,必须依靠三方数据源。结果,绝大多数小贷公司都会陷入一个困境,就是引入一个新的数据源,测试效果好好的,一上线对通过率、坏账率一点提升都没有,甚至常常出现负面影响。这是因为建模不能简单地圈定一个样本,一个数据源一个数据源往里面加去计算增益。要与时俱进,用上最新的样本,迭代整个策略,如有必要下线有问题的数据源。

29、风险不风险的,本质上都是用户管理。很多人不想做风控说风控太窄了,其实并不是风控太窄了,是他们自己把范围定义的太窄了。风控考虑的是增长和风险的平衡,它的工作的丰富度其实是更高的。

30、当你发现身边很少有比你优秀的人的时候,你就该换地方了。不要考虑例外。别以为这跟风控没有关系,这是人生的风控。

以上是历史的一些分享。

·················END·················

推荐阅读

  1. 我在字节做了哪些事

  2. 写给所有数据人。

  3. 从留存率业务案例谈0-1的数据指标体系

  4. 数据分析师的一周

  5. 超级菜鸟如何入门数据分析?


欢迎长按扫码关注「数据管道」

浏览 61
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报