第二期招银FinTech精英训练营夺冠之旅
共 1477字,需浏览 3分钟
·
2021-07-19 00:42
上个周末我参加了招商银行的Fintech精英训练营,也是因为之前深圳疫情的影响,训练营一直推迟到了7月份,主办方也是克服了很多困难,最终得以让训练营顺利的开展。
在本次出行路上还有一个大插曲,合肥因为雷雨的影响,航班从中午一直延误到了夜里,第二天凌晨1时我才拎包入住招银大学,也因此错过了当天晚上的破冰之旅(来自五湖四海的大家第一次互相认识,做了很多有趣的团队游戏,略有缺憾)。
在整个训练营中,有行里的领导以及技术大咖分享了很多关于前沿金融科技在招商银行里的应用,馆长以及B站up主分享了不一样的招行故事还有人力资源美眉分享了招行的人力政策,在训练营的最后一天我们还参观了招商银行总行大厦。
当然本次训练营最最核心的部分便是课题竞赛。课题竞赛是以团队的形式进行的竞赛,每个团队大致由三名数据赛道的同学以及三名产品赛道的同学组成,最终呈现出的方案为产品设计+数据模型。
课题发布于下午4点,题目为公司客户风险违约预测,是一个比较常规的风控类型的题目,给定公司基本行业信息与公司的多个财务报表信息来对后续时间内的公司客户违约进行预测,一共有四次线上评测的机会,最终选择最高一次的得分作为最终的线上得分。
拿到题目后,经过短暂的小组讨论,我查阅数据并且迅速构建了本次赛题的Baseline方案,直接来到榜单第一名的位置(看起来轻松愉快,实则背后暗流涌动)。在我和小组成员协商之后,我们在当天晚上成为了最早回去睡觉的学员(凌晨一点后)。
因为排名靠前,机会是相对比较充沛的,我便考虑是否可以通过其他思路进行模型构建, 因为同一个公司可能当年存在多个财务报表的信息,并且占比不小,把每个公司的多条数据均送入模型,最后在预测的时候取该公司数据的概率最大值作为最终的预测结果。
可惜我们队的第二次提交是一次较为失败的尝试,线上远低于线下得分,猜想可能的原因是采用分层交叉验证,泄露了公司的信息(同一个公司存在多个报表即多条数据,而同个公司这些数据label均为一致),通过分组分层交叉验证的方式应该可以回避掉该问题。
但是因为只剩两次提交机会,我们商讨后便未在采取此套建模方案,转而使用原先构建的baseline来做特征工程。
我的队友们还有金融学科背景,他们对报表数据进行解读,结合文献提出使用多个财务指标来构造相关业务特征(事实证明,业务特征对模型性能提升有着极大的帮助)。而我则从数据本身出发进行特征的构造,同样取得了不错的成效,最终锁定线上成绩第三。
除了我们做数据题的小伙伴,还有三位同学是做产品题的,他们也是非常努力并且优秀,从比赛一开始就制定了详细的方案,并且不遗余力地完成方案设计(熬了两个大夜)。
付出总有收获,在最后的课题汇报中,我们小组展现出了自信风采,恰到好处地回答了评委的提问,以总成绩第一获得了本次训练营的卓越精英团队称号。
你以为课题竞赛完成就结束了吗,最后一晚的深圳湾畅游简直把快乐值拉满了。我们在游轮上举办了训练营结营晚会,魔术师的精彩表演令人难忘,深圳湾的夜景、令人陶醉的海风、甲板上的蹦迪更是把气氛推向了高潮。
最后,感谢队友们的精诚合作以及招银伙伴们的辛勤付出,FinTech精英训练营,yyds!老肥再次强烈推荐大家参加明年的招商银行FinTech精英训练营,一起爆肝,一起哈皮!
——END——