蚂蚁金服:金融智能中台建设实践,25页PPT干货详解! | IDCF

DevOps

共 2573字,需浏览 6分钟

 ·

2021-03-11 00:24


418f18a2e3640d7018f86869886713f1.webp

内容来源:蚂蚁金服 发布:BAT架构(ID:kbcs2019)整理:安德鲁
这是之前蚂蚁金服技术专家分享的智能中台建设实践,整理出来供大家参考,ppt来自网络,如有侵权请联系删除。01 AI在蚂蚁金服的应用场景793742307a8f239501497ee063e23b3f.webp资料来源:蚂蚁金服AI在蚂蚁金服的应用场景有:
  • 智能风控。基于深度学习的风险识别与防控。
  • 智能理财。基于金融大数据提供智能、理财策略分析和决策建议。
  • 智能信贷。基于数据隐私加密共享、学习的联合放贷。
  • 智能营销。个性化智能营销决策、提升业务运营效率。
  • 智能保险。智能保险定价、定损、理赔,线上自动化流程管理。
  • 智能客服与助理。一站式金融场景机器人、智能业务决策和执行助理。
02 蚂蚁AI能力大图ba721dc07d88a7f07c0330016300aca9.webp资料来源:蚂蚁金服蚂蚁AI能力大图分成两部分:
  • 场景&行业:智能风控、智能客服助理、智能营销、智能保险、智能信贷、智能理财。 
  • 金融大脑:金融知识图谱&NLP、机器人平台、金融信息服务、生物识别、金融视觉平台、金融算法(AutoML ,图推理,隐私保护共享学习,运筹优化,无监督学习,在线学习,强化学习,模型可解释)。
03 理赔宝背后的智能6c5403999a3581fbbbd8bd11b3bee51c.webp资料来源:蚂蚁金服先来了解,理赔业务流程:用户上传->图像识别-> 实体抽取-> 实体匹配-> 系统智能核赔。理赔宝对比传统流程核赔效率提升5倍以上,主要包含三大核心平台:1)感知(金融视觉平台Computer vision)
  • 图像分类:区别病历、发票、证明等
  • OCR:支持文字、图章识别
  • 反欺诈:识别PS图片等
  • 数十个图像模型多链路融合决策
2)NLP&知识图谱(金融知识图谱平台 Financial knowledge graph)
  • 健康知识图谱:医院、疾病、科室、手术、保险产品等实体关联
  • 亿级节点和边在线实时融合推理
3)决策算法策略层
  • Algorithmic
  • decision
04 智能中台的简略框架b2567700088837b4f436dfedfb8d3720.webp资料来源:蚂蚁金服智能中台
  • 从角色上分成:算法研发、数据研发、工程研发。
  • 从架构上分成:模型、研发平台、底层技术。
05 为什么数据底座很重要d44073b22d154bb87aabb20023f671e2.webp资料来源:蚂蚁金服为什么数据底座很重要?
  • 数据处理贯穿模型迭代的始终;
  • 数据和特征决定了机器学习的上限;
  • 数据安全是金融行业生命线。
06 金融智能数据底座的挑战8d89986fbd1ee43616a704d54381d852.webp资料来源:蚂蚁金服金融智能数据底座的挑战,主要有三方面:1)效率
  • 存储分散,多次拷贝;滥用批处理;标注效率低
2)质量
  • 标注质量;数据快速refine
3)安全
  • 标注安全;训练安全
07 数据流转:打通数据闭环,提升流转效率f749bd7caee88e747cf2ab09036afa9f.webp资料来源:蚂蚁金服
  • 数据闭环主要环节包括:数据采集、数据预处理、数据标注、数据转换、模型训练、业务场景。
  • 治理的准则是:统一存储、统一格式、统一分析、统一编码。
08 数据流转:基于one ID的数据复用98cb4b358099217c834001f15ac5debe.webp资料来源:蚂蚁金服基于one ID的数据复用,过程包括:原始数据、标注数据、样本数据、模型数据。09 智能标注:模型市场赋能标注86d5fd51ce4be3d97795dd58a1bf1e01.webp资料来源:蚂蚁金服智能标接入移动、PC各端,把样本输入算法平台,通过自训练模型、通用模型进行标注,包括视频、图像、文本等媒体物料。10 数据选择:通过主动学习节省90%的标注量c9b8ab5ac0d2158848465272fb88e9b8.webp资料来源:蚂蚁金服通过主动学习节省90%的标注量。
  • 主动学习(Active Learning )是一个迭代过程,不断选择对当前模型效果提升最有效的样本,优先进行标注。
  • 分类宝case:约10%的样本达到所有数据的训练效果。
  • 能力集成到数据底座,包括基于信息熵的通用选择和算法自定义选择。
11 数据增强:解决样本少或者不均衡的问题ef1a7680f1b94e9cfa672a20a97faf9c.webp资料来源:蚂蚁金服
  • 复制、翻转、剪切、缩放
  • 高斯噪声、高斯模糊…
  • SMOTE、GAN
例如:Image Smote在具体业务场景上带来3-5%效果提升。12 智能辅标工具f188e2af6843ede802b299b3aaadafe1.webp资料来源:蚂蚁金服
  • AntLable 支持视频、图像、语音、文字、地图等内容标注;
  • 很多业务场景带来数倍的效率提升;
  • 大部分实现基于前端算法,计划开源。
13 智能辅标:倾斜校正、自动贴合+OCR6a47177d4f2f8fb4f86310b1f6edc637.webp资料来源:蚂蚁金服由于实际场景中,拍照都有角度,会造成倾斜、重合等,智能辅标:倾斜校正、自动贴合+OCR,很好的解决了这些问题。14 智能辅标:图像自动分割7854638241e637ca18bb43c36ee49b63.webp资料来源:蚂蚁金服识别图像中的目标部分,如文字、商标等,进行自动裁剪分割。15 智能辅标:视频人物跟踪fe518650b94250aa047511f7f9dbf224.webp资料来源:蚂蚁金服对视频中的特定人物进行目标跟踪。16 智能辅标:视频图像对齐88c0ae7bb396bea492962aadc266e40c.webp资料来源:蚂蚁金服视频图像的边界对齐。17 标注质量:基于数据指标的流程管控体系e7d498047e567d81602797bca9a13f3b.webp资料来源:蚂蚁金服对于巨量的标注工作,需要有一个流程管控体系。如:标注->检查-->驳回/验收-->训练。结合工具、数据、引擎。18 标注质量报表be5c7246ce24fa4e2e2e705ff90dbf23.webp资料来源:蚂蚁金服对于标准质量,有可视化的报表展示,不断提高标注质量。19 样本分析17e2003823c1f44d8ab59b11d11e78fd.webp资料来源:蚂蚁金服对样本进行深入分析。20 模型效果报表2d34524cbbf534a44fd7e7048df2febb.webp资料来源:蚂蚁金服对模型效果报表展示。21 安全要求和解决思路f489d3f8a4a67461c336b49348e7166c.webp资料来源:蚂蚁金服安全要求包括安全存储、拒绝查看。通过文件管控,如加密、分割、脱敏、水印等方法进行安全管控。通过访问控制,如不落库、鉴权、频次、时效等对访问进行管理。22 安全标注:不落数据标后即焚8dc711eb40754db5f29552cba28c8afc.webp资料来源:蚂蚁金服安全标注主要思路:数据不落库,标注后源数据销毁。23 安全标注:分割标注706e489d3155ffff17a9f259d7fa3893.webp资料来源:蚂蚁金服安全标注包括:
  • 语音、文本、图片。
  • 最小化分割。
  • 数据脱敏sdk。
24 安全训练01f78d22bd0a0faa26be6ad46f440119.webp资料来源:蚂蚁金服安全训练是通过加密标注数据、数据分割、加载到内存、解码合成、训练等流程。25 数据底座总体功能框架ba3d9c241727aa3f68fc5b1f47024b64.webp资料来源:蚂蚁金服数据底座总体框架包括:平台、产品封装、采集接入、标注、加工数据、能力组件,如上图所示。蚂蚁金服的金融智能中台,就好比企业的大脑,通过对业务数据抽取、加工、标注、输出,数据反哺业务,形成了数据业务双中台,驱动整个金融科技的发展。研究一家科技企业,就看它的核心系统建设思想,梧桐一叶而天下知秋,现在你知道蚂蚁金服,为何估值万亿了吧。16ad53047ac434445ed1bd182920cf8d.webp想要提升敏捷DevOps技能,来场DevOps黑客马拉松!想要寻找第二增长曲线实现创新增速,来场DevOps黑客马拉松!2021年4月24-25日,IDCF DevOps黑客马拉松走进天府之国-成都赶紧报名参加吧~可自己报名,也可公司组团参加哦!

e671635aee6a5bde85fff32d94a7596e.webp

浏览 127
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报