十年铸一剑,乐信技术的「进化史」

雷锋网

共 7931字,需浏览 16分钟

 ·

2023-10-28 22:42

金融科技巨头们嘴上常说的数字化、精细化,背后承载的是一场有关技术的较量。” 

作者 | 胡敏
编辑 | 周蕾    
                                                                             

金融科技发展进入下半场,监管日趋规范严格,躬身入局者面临更大的获客与风险挑战,业务重心从增量转为存量经营。加强精细化运营与管理,也成了诸多老板们必备的破局之道

这就好比一套严密精巧的机器,倘若每个齿轮都有1%的转动不畅,天长日久累积下来,必然对整套系统的运行效率有不小的折损。
“精细化”三个字说来简单,但十分考验企业的技术底座是否扎实、技术能力是否足够创新,水面之下的积累决定其精耕细作的执行力度和效果。
一个典型的情景是,有时业务系统出现异常指标,主管火急火燎派人查问题,大半夜把相关的数十个人全部拉进微信群,兴师动众,一连查了几天甚至一两周才找到原因。结果已经来不及挽回损失,老板气得在办公室里一一点名批评。
“很多公司都会经历这种掉链子的时候,特别做金融方向的,0.01%的变化或许就关系着数量巨大的一笔钱。”某行业人士跟我们交流说道。
金融科技公司虽然较其他行业,更早地接触了信息化、数字化以及众多AI前沿技术,从诞生起就在构建自身技术底座,为何精细化发展阶段仍会面临种种技术问题?
他们在创业早期的目标,自然是以找到赚钱方向为主,因此业务在不断变化、试错,捕捉机会,在底层技术上也更为强调“敏捷”。
但这也给企业留下了相当庞大的技术债。不论是行业巨头,还是创业公司,技术债没有公司可以避免。
所谓技术债,类似于金融债务,软件开发就像是“贷款”,技术债务是它的“利息”,“利息”是需要未来额外的时间偿还的。技术债的债务利息是非常高的,曾经业界有一个核算,技术债的利息大概年化利率是超过 50%。
在当下阶段,企业一旦启动“精细化”的开关,首要任务就是梳理和升级技术底座。

01

翻修:给生长8年的技术系统,清理升级

乐信CTO陆勇在2021年加入乐信时,交给他的是一个已经快速生长了8年的技术系统。而他的工作就是上面所提到的问题——要对这个庞大的技术系统进行升级。

这是一个不小的挑战,就像是“翻修一栋老房子”,原有的某些结构和设计已经陈旧,不再适用于现代需求。技术系统也一样,要把积累的架构不合理、灵活性不够、数据断点多的问题,进行彻底翻新和升级。
陆勇和他的技术团队要做的事情有很多,但核心目标就一个:建设扎实稳定的技术体系 ,让乐信实现真正的数据驱动。
乐信CEO肖文杰曾表示:想要拥抱未来的AI驱动,首先必须要做到数据驱动,扎实从底层开始做好数据治理,再到模型及量化分析工具的建设,系统化工具的建设,把整个经营体系都转变成基于量化和数据驱动。
陆勇到来后,在打造数据驱动的技术体系方面下了不少功夫。尤为值得一提的,是他和技术团队主导研发上线的「黎曼(Riemann)异动归因系统」。
这个名词听起来很难懂,但从效果层面,它的应用实际是给乐信的风控增加了一个“高科技的稳定器 ”。
众所周知,金融业的故障代价很大,短短数小时,损失就可能达百万级,如果超过一天,甚至可能达到千万级。这就促使陆勇先拿这一问题“开刀”,让这些工程师们不再恐惧半夜接告警,拥有一个好睡眠,同时也减少公司损失。
据陆勇透露,海外早已有许多互联网公司在研究,但异动归因系统本身是一项壁垒极高的技术 
首先,需要对业务的数据、运营策略的配置有全面的数据感知。如果说异动归因系统相当于人的分析过程,那分析的原材料——来自眼耳鼻舌身的数据输入就是前提,需要结合业务全流程来监控。
有全面的数据感知作为基础,发现异动才成为可能。以消费金融产品的掉单率作为例子,一旦发现掉单数据超出阈值,无论是瞬时的剧变,还是长时间的阴涨阴跌,异动归因系统就会在几十毫秒之内发现问题,自动告警。如果没有系统加持,仅凭人工查看数据报表,也许半天才能发现也许根本发现不了。
定位问题之后,异动归因系统会迅速进行两类归因:计算归因,根据数据的计算血缘关系通过偏微分网络,追寻到引起变化的某个数值异动 ;或者事件归因,追寻到引起变化的某个策略配置。无论是哪种情况,定位清楚问题,解决也就成功了一半。
目前,陆勇还正带领团队实现后一半,从定位问题到解决问题的闭环:在异动归因系统之后加上自动修复系统。只要是由运营、经营策略配置引起的异动,归因系统定位后,修复系统可以自动调整策略,消除异动,让系统正常运行。这相当于给业务配置了24小时在线的护卫,有任何风吹草动都可以迅速发现,迅速调整。陆勇把技术分为两类:一类是基建类技术,可以参考标准的解决方案, 采购第三方解决方案,还有一类技术并不是可以买来的,它是必须在一个个业务场景反复打磨,让技术渗透到毛细血管,长到业务里面才能够见到生产力。
异动归因系统就属于后者,研发过程是需要花长时间、重精力。据陆勇透露,乐信在这上面投入已有两年时间。而如今,归因系统初步过了技术临界点。
“现在乐信80%技术告警异动系统能自动分析处理,余下20%的问题才需要人工辅助。”陆勇说道。

02

筑底:数据治理工作不sexy,但必须下大功夫

不论是异动归因系统,还是AB测试、QE测试,这都是长在数据之上的系统。数据完备性、及时性、准确性是影响系统能否发挥最大效能的前提。
没有数据的支撑,就像是你买了一部顶级豪车,但却发现油箱中没油一样,发动不了。
陆勇也深谙此道。他在加入乐信之前,在海外工作已有十余年,2003年,陆勇加入微软,并在其西雅图总部担任软件工程师达十年之久,其后他加入脸书(Facebook)担任高级软件工程师。2014年,陆勇回国加入新浪微博任广告部总经理,此后相继在51Talk、新浪移动和平安人寿担任首席技术官 。
陆勇加入乐信后,技术团队先是花了大力气做了乐信内部的数字化治理工作,研究清楚数据是怎么产生的,数据之间的计算关系、不同数据在业务上的意义;也要研究数据如何加工得出结果,以及加工中途一旦出现问题,怎么排查成因、确定造成的影响。
“数据的收集、清洗、加工,听起来这是一项非常不sexy、也很耗时的工作。”陆勇说,但这也是最重要的工作之一,公司一旦把存量关系梳理完后,增量关系可以“自动、快速、及时地,以非常小的代价”更新到业务模型里面来。
这就是典型的飞轮效应,一开始,你必须使很大的力气,一圈一圈反复地推,每转一圈都很费力,但是每一圈的努力都不会白费,飞轮会转动得越来越快。
不过,数据治理确实是一项庞大的工作。“我们源数据的数据量是25PB以上,我们一共有100万以上的字段。”
这个数据量还是让陆勇颇感吃惊,根据他的经验判断,这已经比较接近一个中型 To C社交平台公司的量级了。
除了数据量大之外,实际上在数据收集工作上,陆勇也表示遇到了不少难点。
因为和大多数公司一样,乐信早期数据也是跟着业务跑,等到真正要梳理时,数据基本点状式散落在各个业务部门。但这还只是第一步。弄清楚各个数据之间的血缘关系,这才是团队最核心的目的。
如果把底层数据比作一座城市,那么数据血缘就相当于城市的人口普查,厘清了整个城市的人口关系。
经过两年多的努力,乐信已经有大概40万以上的计算关系。机器可以从这40万数据计算关系里面,自动提炼金融复杂业务模型,比如说信贷业务、消费金融业务的核心模型。
据了解,现在乐信有大概近3万个计算任务,主要来源于10万张以上的数据表,服务1600多个运营指标和600多个主要的经营指标。
而今年,乐信技术团队又尝试构建了图灵(Turing)决策仿真系统。以往,外部发生变化,平台可能需要上新策略,但一旦策略不当,那整个成本是比较昂贵的。
因为有了真实世界的丰富数据血缘关系,那可以在此基础上构建一个数据仿真测试,提前模拟宏观环境、行业环境、消费者环境可能发生的变化,将这些变量“扔进”仿真系统,让业务先做一场“模拟考”,方便业务人员了解外部变化可能对业务产生的影响。例如一个撮合匹配的优化策略, 原来实际上线测试几个月可能会耗费高额的成本, 现在通过图灵仿真系统, 90秒内就可以得到置信度非常高的结果。

03

生长:10年,奔跑在技术创新路上

回头看陆勇来到乐信的这两年多时间,也是乐信朝精细化、数字化、智能化再深一步的两年:
2021年,先重点做乐信的数据治理工作,而后又启动了异动归因系统、AB测试、QE测试的研发工作;
再到2022年,在底层数据治理有一定成效后,就开始涉足业务端,将贷前、贷中、贷后的策略模型做集群,通过集群,以此达到全局最优、最大化的效率;
再到今年,又开始着手LexinGPT、决策仿真系统的研发,朝着智能2.0迈入。

这些技术不断向前迈进的背后,其实反映的是乐信一直践行的理念:用科技的力量,让金融更为普惠。
而这一理念,乐信已坚持了十年。
2013年,当时市场上有上亿的个人消费金融需求得不到满足,于是乐信CEO肖文杰下海创业,带领团队推出了分期乐。
彼时,中国的信用体系起步比较晚。线上借贷这模式在当时无疑是很冒险的。但肖文杰和团队却认为,借助技术手段,去评估一个人的信用,这是可行的。鹰眼、虫洞技术系统也都在这个时间节点诞生。
鹰眼主要是为解决传统金融机构对信用缺失人群的风控难题。当用户在分期乐商城购买一件商品时,其互联网电商行为数据、人脸识别机器指纹验证以及外部征信数据合作方提供的数据等等都主动会进入到鹰眼引擎中。有了这些大数据,运用机器学习手段,鹰眼引擎就能对该用户的还款能力、还款意愿、负债信息、稳定性、负面信息作出评估,并自动完成即时预警、拦截以及分析部署等功能。
而虫洞技术则是海量资产的匹配问题。虫洞会根据资产状况进行分级、定价,按照不同资金方的资产要求,通过规则和算法进行智能筛选、在线自动撮合,让分期乐商城生成的订单能够秒级匹配到合适的资金方,成功率在93%以上,单笔订单的IT成本降到了不到传统金融机构的十分之一。
前端资金配置和后端风控虽然都有技术支持,但乐信技术创新也并未止步于此。2016年,人工智能AlphaGo战胜世界围棋冠军李世石后,全球引爆了新一轮的AI热潮。
乐信也开始迈开了腿,探索AI在消费金融领域的应用。整个2017-2021年,AI成为了乐信技术体系中的重要关键词。
在这期间,乐信上线了人工智能实验室(AI Lab),同时也成立了乐信区块链实验室(Blockchain Lab),探索区块链在小微消费金融领域的落地应用。
2019年,乐信发布了一系列用于消费金融的AI工具“全家桶”,包括:LBS风险评估、收货地址聚类分析、用户行为序列分析、舆情分析等等。
再到今年,大模型引爆全球,引发行业大地震,乐信很快加入战局,开始思考如何将乐信技术朝着智能化2.0迈入。所谓智能化2.0,最核心的应用就是大模型,用大模型去渗透改造每一个经营环节。目前乐信的LexinGPT已经在内部工作中发挥了重要作用。
陆勇表示,LexinGPT的应用,乐信在客服、电销、私域运营和催收机器人方面显著提升了传统人工坐席的效率,同时以LexinGPT大模型为核心开始重构几乎每一个运营、研发、测试、数据分析、设计,以及后台职能环节的工作流、知识流和通讯流。

04

结语

乐信的10年技术创新之旅展现了一个企业的持续进化。从起步发展期的大数据风控和资产匹配,到深入发展期的AI和区块链技术全链条应用,再到整体技术的精细化发展,乐信在技术创新方面不断前进。
在这个过程中,乐信取得了一系列显著成就,促成了贷款总额达近10000亿元,服务了1.99亿用户。这些数字反映了技术创新所带来的实际影响,但也让我们看到了乐信10年来的不懈努力。
这十年,其实也正是金融科技从激烈厮杀,到大浪淘沙,再到稳步前行的十年。
曾有人这样总结世间的一切竞争:越适合生命生长的地方,竞争就越激烈;不适合生命生长的地方,对于自身生命力的要求就会特别高。没有绝对的优势,也没有绝对的劣势,无论何时何地,生存最大的挑战还是自己。
而在这漫长旅程里,行业沧海桑田,乐信也逐渐磨练自身,从稚嫩走向成熟,长成了新模样。
//

近期热门文章

小红书不再需要CTO


七次 CV 夺冠背后:颜水成与他的学生们


中国芯片黄埔军校的最后一批学生,为何被迫「毕业」?

浏览 12977
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报