本世纪还未过半,数据「石油」就要枯竭了?
作者 | 余菲
编辑 | 周蕾
数字经济时代,数据是新的“石油”,在过去几十年催生出一大批互联网巨头,但现在,新的麻烦出现了,“石油”的开采正在变得越来越难。
一方面,各行业原有数据的价值沉淀和挖掘逐渐饱和,市场对数据深度共创共享的需求激增,但缺少好的沟通桥梁;同时,数据隐私与安全问题凸显,《数据安全法》和《个人信息保护法》等相继被推出实施,野蛮生长变得难以为继,数据“油田”进入精细化经营阶段。
在新阶段,如何认清数据市场的新形势和新规则,找准并解决数据流通的难卡点,实现数据流通与安全两者兼得?正在成为各行业企业的“必答题”。
1
五年翻七番,但隐忧已现
过去五年,我国数据市场出现爆发式增长,从106亿元到704亿元,涨幅高达约564%,近乎翻了七番。而未来五年,这一规模还将继续攀升。
据国家工业信息安全发展研究中心测算,预计“十四五”期间,我国数据要素市场规模将突破1749亿元,整体进入高速发展期。
来源:《隐私计算与区块链技术融合研究报告(2021)》
然而光明前景的背后,隐忧早已显现。
经过过去二三十年的发展,各行业企业的数据沉淀和价值挖掘已逐渐饱和,原有数据红利已被消耗殆尽。数据价值挖掘进入深度共创阶段,要求不同机构相互间尝试更多的数据共享、样本碰撞、联合建模,独守自己一亩三分的数据“油田”坐吃山空的老路,再也走不通了。
越来越多的企业思考,如何能打破数据孤岛和应用“烟囱”,在安全、可控的前提下,让数据实现跨界流动和碰撞融合,从而挖掘出更有价值的数据信息,催生出意想不到的新产业、新模式和新机会。
但这对数据安全提出了更高要求。近年来,由数据共享带来的数据滥用、盗用等不良现象层出不穷,越来越多的数据安全事件正在成为公众网络噩梦。
数字化时代,对国家、企业、个人而言,数据安全正在成为重中之重。安全事件一旦出现,往往影响大、损失重,不仅给个人隐私带来威胁,让企业面临经营损失风险,还可能会威胁国家安全。
以企业数据风险为例,IBM与Ponemon Institute对全球17个国家里经历过数据泄露的500多家企业进行调研发现,2021年企业单次的数据泄露事件平均耗费成本约为424万美元,比2020年增幅10%,创下历史新高。
来源:IBM《2021年数据泄露成本报告》
数字化的今天,数据既是基础性战略资源,又是关键性生产要素,如何既能实现数据跨界共享,又能保护数据安全与隐私,已成为新一轮产业变革的焦点和各行业企业的战略重点。
2
数据跨界流动,需解好三道题
事实上,数据多方共创、跨界流动的需求一直都在。以“低保查询”为例,一个看似简单的动作,背后是数个政务部门的通力协作。
要判断一个人是否为低保户,需要综合多维度信息,如纳税情况、不动产信息、车辆情况等,但这些数据分散于纳税局、房管局、车管局等,需要各部门参与进来,通过交互核实,产生一个新的数据,来证明该人是否为低保户。
之所以如此复杂,是因为民生数据通常涉及个人敏感隐私,数据价值极大,数据的汇总往往更容易招致攻击,出于风险考虑,这些多维度数据,只能协作而不能聚集。
而实际生活中,类似的案例还有很多。数据跨行业、跨机构流转共创已是大势所趋,但眼下,数据流通上仍有三大卡点。
除了上面提到的安全挑战外,数据确权也是拦在数据流通面前的一大障碍。
数据确权,通俗来说是要解决:这是谁的数据?数据价格是多少,怎么流转?
在著名经济学家科斯的理论中,只有当契约完备、产权清晰,市场机制才能有效运行。同理在数字经济领域,明确的数据产权是数据市场健康发展的必要条件。
事实上,关于数据有没有所有权、所有权归谁,长期以来一直存在广泛争议。数据是资产,但与物理资产有很大区别。不同于物理资产“一物一权”的产权唯一性,数据可以被轻易复制,再加上单一数据可能并不具有价值,只有在共享和规模化中才能具有价值的特点,让数据确权变得非常复杂和艰难。
更重要的是,数据产权的明晰与否也直接关系到如何在不同主体间分配数据收益、义务和责任。
确权的困难,在一定程度上也带来了数据市场上责权分配的诸多乱象。
比如,网民作为海量数据的原始提供者,却在大数据杀熟和网络电信诈骗中屡屡遭受损失;企业间数据的非法窃取、非法交易、非法利用,严重影响了企业利益和数字经济的安全发展。
不难看出,数据流通在安全、确权、责权分配三方面的风险,已成为当前数据高效安全流通的关键卡点。而这需要制度和技术的双管齐下。
着眼于这些新形势,近年来,我国不仅多次将数字经济写入政府工作报告,并先后发布了一系列鼓励数字经济发展的政策规划,更是相继推出《数据安全法》和《个人信息保护法》,加速数据产业合规发展。
但在政策法规外,如何尽快探索出相应的创新技术,让数据流通和价值挖掘在有法可依之外,还能有“技”可施,同样紧迫。
3
1+1还不行,必须原生级融合
面对多源异构的海量数据,如何在技术上既能实现数据价值的跨界流动,同时又能保护数据安全与隐私?目前业内的普遍共识是:隐私计算与区块链技术相融合是一个好方向。
概括来讲,隐私计算技术在加密状态下对数据进行计算和分析,实现数据价值的提取;区块链技术分布式记账、可追溯的特性为数据价值的转移提供了必要的基础,两者结合为数字安全高效流通和数字经济发展提供了技术基础。
技术融合的尝试出于复杂、多元的现实需求。任何单一技术都有一定的使用范围,仅靠单一技术难以满足数据可信溯源、数据安全审计、 数据权属界定和责权分配等一系列问题。只有从单一技术走向融合技术,才能满足数据安全流通的多种需求。
技术源头上,隐私计算与区块链同属密码学产物,同源异流之下具有天然互补性,因此区块链企业纷纷凭借技术积淀和业务驱动,率先探索两者融合。据中国信通院牵头撰写的《隐私计算与区块链技术融合研究报告(2021)》指出,目前国内 56 项隐私计算产品,其中 21 项出自区块链背景企业。
来源:《隐私计算与区块链技术融合研究报告(2021)》
技术融合的方向是对的。但目前行业内的通用做法是通过双系统架构将两者简单结合。在实际应用中,不仅费时费钱,还存在安全隐忧。
具体来说,客户需要采购和配置两套系统才能实现协作目标,而且在协作过程中,两套系统的适配能力和安全性也存在挑战。
在蚂蚁链技术总监闫莺看来,未来各行各业的跨界协作中,数据隐私保护将成为底层需求,区块链与隐私计算的结合不应该是一个简单的1+1组合,而要深度融合。
那什么才算是真正的深度融合?
“实现数据价值的转移需要面向数据全生命周期来思考,因此隐私计算应该直接原生在区块链网络平台上。就像当年智能手机集成电话、相机、音乐播放器等功能一样,打破技术边界,在出厂设置时,就将隐私计算和区块链一起融合到单个系统内。” 闫莺表示。
据她介绍,在这样的思路下,蚂蚁链提出了原生计算流转架构,并基于此打造了「FAIR」平台,融合多方安全计算(MPC)、可信执行环境(TEE)、联邦学习(FL)三大主流隐私计算技术,扩展区块链网络,让每一个区块链节点都成为一个隐私计算节点。
据了解,「FAIR」平台还通过深度融合软硬件技术,构建了自主安全计算硬件并获得CFCA安全认证,联合达摩院计算技术实验室和阿里安全双子座实验室等团队设计的全同态硬件加速,实现了百倍以上的性能提升。「FAIR」平台也成为国内第一个同时融合隐私计算和区块链技术的平台。
事实上,今年是“十四五”开局之年,也是落实“打造数字经济新优势”规划目标的关键之年,今年以来,各行业数字化转型进入快速成长期,数字经济处于规模化前夜。
面对数据协作共享的海量需求,只有原生级技术融合,才能支撑起大规模的产业节奏,数字技术深度融合创新已成必然趋势。
4
结语
接下来,随着大规模产业协作的数字化浪潮到来,跨行业、跨区域、跨机构的数据价值流转将会呈指数级增长,越来越多的“数据孤岛”终将连成一片“数据群岛”。
只有不断尝试融合区块链、隐私计算、人工智能、大数据、AIoT等多种技术,以及法律法规、监管治理等诸多策略,进而大规模改变数据共享、治理和使用方式,才有可能建立起一个数据安全高效流通、价值共创共享的数字社会。
而今天的隐私计算在链原生,只是数字技术相互间碰撞交融、带动新一轮科技革命与产业变革的第一步。
互联网巨头的「云」动荡
逃离 AI 赛道的投资人:做局失利、破局无力
道的投资人:做局失利、破局无力