近日,由中国信通院和中关村区块链产业联盟举办的“区块链基础设施规模化发展热点技术:隐私计算”沙龙在线上举行。微众银行区块链底层平台研发负责人李辉忠受邀参加。
会上,李辉忠介绍了微众银行新近发布的多方大数据隐私计算平台WeDPR-PPC,指出该平台剑指多方大数据协作中的痛点,为数据隐私加上“安全锁”。
随着互联网爆发式地发展,最初的信息化时代演化至智能化时代,产生了越来越多的数据,它们分布在不同的场景和机构中。如何解放数据要素生产力,让数据发挥更大的价值,成为亟待解决的问题。进入数据新基建的时代,分布协同的技术成为非常重要的技术。若将分布协同的技术运用到商业场景中,新的组织方式将应运而生。以日常使用共享单车为例,其背后的技术可能用了某家的云服务,也可能集合了某电商的服务,甚至还使用了支付机构的技术。这里便是典型的多方参与形式,实现了数据的流通,而且机构之间形成了一种松散耦合、智能协作的状态。我们需要面对新的问题:如何在分布协同下如何更好地保护数据隐私?在分布式的商业场景中,数据出现自由流动,如电商的采购行为、社交平台上的交流行为以及在支付场景中的支付行为等。未来,在各个场景中,这些数据可能会被联合进行挖掘,从而释放出更大的价值。在联合挖掘的过程中,各机构参与方及用户本身都希望数据能够发挥出更大的价值,但是数据的安全问题也从一个静态的问题变成了一个动态的问题。在过去,数据主要被放在U盘或者磁盘上,那么需要关注的只是如何保护好这个U盘或磁盘。但是现在,数据在整个互联网中不断地在流动,数据安全问题也就从一个静态的安全演变成了一个动态的安全。此外,过去,大众更关注的是数据的被动防御,譬如如何不被攻破、盗取和破解等,但数据的自由流动,我们更需要主动地去构建一个安全的环境,以能够保护数据安全。同时,在合法合规的情况下,更好地去挖掘数据的价值,而且数据的原生价值在被挖掘到一定程度之后,也将产生更大的衍生价值。相关报告显示,未来两到三年,国内数据隐私保护的市场规模将会达到200亿,前景非常广泛。但是,目前的隐私保护技术仍存在一定的瓶颈,尤其在安全性和应用性方面存在不可避免的挑战,如联邦学习、安全多方计算以及基于硬件的可信计算,不同的技术都有自己的特性,也有各自独特的应用场景。对于不同的应用场景,任何单一的解决方案都可能有较大的局限性。上述背景之下,微众银行区块链研发团队投入了非常大的精力来研发多方大数据场景下的隐私计算平台WeDPR-PPC。多方大数据隐私计算平台基于场景式的隐私保护解决方案WeDPR而研发。它具有六大优势:首先是安全合规,它基于区块链的可信数据治理,全面支持国密算法;其次是全面隐私,可以做到明文数据不出库,相关密文数据用途可限,同时密文计算结果可验,并且密文协作贡献可计量;第三是功能丰富,它全面涵盖主流协作模式,不用依赖可信第三方,能够支持任意数量机构的同时参与,也可以进行恶意模型+区块链提供全流程正确性验证;第四是性能优异,5 分钟可以完成亿级数据隐私求交,3 毫秒内可以完成万次联合乘法计算;第五是易学易用,它采用模块化算法封装,高级语言和类 SQL 业务逻辑编写,可以实现可视化拖拽和即用即搭;最后是部署灵活,可以实现容器化镜像快速部署,无 TEE 硬件依赖,无平台绑定依赖,且适配小程序/APP客户端。多方大数据隐私计算平台可以在多方联合的情况下,实现联合报表、联合计算、隐私查询以及联合建模和预测。目前平台已经获得了国家权威机构认证,性能方面非常优异。多方大数据隐私计算平台有两个非常关键的技术指标,第一个是隐私求交的性能,它具有十亿级数据集处理能力。第二个是乘法联合计算的性能,实现毫秒级端到端响应,可以在几十亿级的数据上快速地满足商业场景的应用。联合建模在金融领域有着广阔的应用场景。譬如说,银行持有用户的征信数据,其他机构拥有用户的消费数据。如果银行准备给一位用户发放贷款,银行可以借助其他机构的消费数据来综合评估贷款的风险。此时,银行会选择与这些机构合作,在已有该用户征信信息的基础之上,再结合用户在其他机构各消费维度的数据,进行联合建模,并通过加密计算,最后凭借建模结果来把控风险。这背后可能就会用到像联邦学习和安全多方计算的技术。
在金融证券行业,可能还会涉及到隐私查询的应用。比如说,针对经常恶意投诉或资金操作出现风险异常的特殊用户,金融机构会将其列入黑名单。对于金融机构而言,黑名单是非常重要的数据,被视作机密。但是如果黑名单本身能够给金融机构带来价值回馈,助力金融机构给其他机构提供服务,那么金融机构就会有动力,去挖掘“黑名单”的数据价值,并追求价值的更大释放。
与此同时,这些数据也就有了开放的可能。然而,数据的开放意味着可能会引发数据泄露的风险,因而需要引入安全计算的方式。比如说密码学中经典的不经意传输协议,可以实现查询时,查询方所查询的数据对于这个数据服务方来说是保密的,数据服务方并不知道被查询的是哪个用户,但又可以把查询结果告诉给查询方。也就是说,查询方只能从数据服务方这里得到一个查询结果,而且数据服务方也无从知晓查询本身的踪迹,由此可以有效保障双方的隐私安全。整个隐私计算的开发模型是可视化编程。其依托于两项核心技术:一是在底层技术上,通过区块链核心技术,以及智能合约相关的技术体系,来构建多方分布式协作环境;二是引入了经典密码学。安全多方计算由一系列核心技术支撑,有较高深的认知门槛,所以,如何使用它对于开发者来说,是一个很大的挑战。因此,在打造平台的过程中,我们非常重要的一个投入就是,如何让用户更敏捷地实现安全多方计算场景的落地。在这个过程中,我们实现了可视化的、可拖拽的组件,帮助不同的业务、不同的角色去实现安全计算的一些尝试:比如业务部门可以对可视化的组件进行拖拽,像拼图、拼积木一样地敏捷实现搭建;数据分析的部门可以像写传统的SQL类型的语句一样,写一些基本的脚本代码就可以实现基本数据分析;开发部门要把场景完全实现,我们还可以提供高级语言的方式来编程落地整个解决方案。整体上,我们有一整套适用于不同角色,不同场景下的组件和方案,可以更好地辅助安全多方隐私计算的落地。在构建核心能力的同时,我们会将一个个技术组件进行包装,比如说数字身份,我们会包装出一些选择性披露的组件和可控匿名凭证的组件;至于决策,我们会包装出投票的组件和排名的组件;还有隐私计算,我们会包装出联合报表、联合预测的一系列组件。同时,基于这些组件去构建场景化的方案,例如基于隐私计算的组件,构建出联合报表、联合计算等的场景落地方案。未来,我们将会持续地构建隐私计算能力矩阵,让更多的人参与共建,让更多专家了解我们的核心技术。同时,不断地去升级技术本身的各项性能。此外,在给出场景技术解决方案方面,我们将实现场景之间的多方结合,以多方协作的形式落地更多应用,更好地服务整个产业的发展。