双11过后,你的数据还好吗?

共 4154字,需浏览 9分钟

 ·

2020-11-17 16:41



又到了一年一度的双11购物盛宴,在“买买买”的全民狂欢中,大家除了需要捂好自己的钱包,还需要捂好什么?


——数据


双11要捂好数据干什么?数据与个人有什么利害关系?数据隐私风险又会对我们的生活带来哪些影响?区块链和隐私计算技术能为我们提供哪些隐私保障?


在《隐私保护周三见》第二季,我们将聚焦数据隐私保护应用场景解读。作为开篇,本期将关注数字化经济中的核心场景——在线交易,与大家一起探讨在线交易过程中产生的数据隐私风险和应对之道。


不同于使用现金的传统交易过程,在线交易进行过程中会产生大量涉及个人隐私的数据,遍布在线购物、外卖点餐、网约车等多样化的业务形态。仅以目前如火如荼的双11购物节为例,据不完全统计,2019年便有数亿人参与双11,主流网购平台处理的最大单日数据量曾达到970PB(1PB约等于1千万亿字节)。


如此海量的数据,经大数据分析后可获得大量详细的个人敏感信息及用户画像,一方面带来显著的商业价值,另一方面,若隐私数据使用和保存不当,也会带来难以估量的隐私风险


目前我国的数据隐私保护法律法规仍在逐步完善中,对于数据的权益界定和保障效力尚待明确。而作为数字经济的参与者,我们每一个人应该如何客观地评估自身的隐私风险,并进行有效地防范?新兴的区块链技术又能给在线交易中的数据隐私保护带来什么样的变革?同时需要克服什么样的技术挑战?且看本文一一分解。


隐私敏感的交易数据


谈到交易数据的内容,大家第一反应可能是发票上的“物品品类+金额”,然而实际的信息远不止这些。


这里,我们将以 “美丽”的故事为载体,解读现实世界中平常的一次在线交易所涉及的异常丰富的隐私数据。

结束了繁忙的一天,美丽决定网购犒劳自己,最终购买了一双运动鞋,提交订单并通过第三方支付平台完成本次支付。其中订单内容为:“美丽于2020年11月11日在旗舰店A购买一双价格499的运动鞋,备注:37码”。


大家应该能猜到,后面发生了什么——

美丽陆续收到了各类运动服饰、运动器材的推送广告短信,打开任何一个有广告位显示的App也都能看到类似商品的广告,甚至不时还会收到 “离你最近”的运动服饰店铺推荐。美丽甚是困扰。


可以注意到,在线交易数据中关联记录的信息,不仅仅是“运动鞋”和金额,还包括了丰富的衍生信息。



在传统线下交易过程中,这些数据一般只有直接参与交易的用户和商家才能获知,协助交易结算的银行最多只能知道消费金额和品类,而难以进一步得知消费的具体内容,以及从消费行为推导出更为丰富的衍生信息。


但随着在线交易平台的出现,单一平台汇集大量用户信息成为可能,而且这些信息可以在不同平台之间进行流转变现,由此便出现了基于隐私大数据对用户进行“精准”广告推送的现象。


随着技术发展,平台对交易信息的发掘早已不限于提取用户直接提供的数据,而更多地转向对深度衍生数据的提炼,实现了对账户实际使用人(可能是多个)和其身边人、事、物的密切观察。


例如,平台系统中的用户性别标签可以突破“非女即男”二元选择,可以有“白天男,晚上女”;年龄也可以不仅仅是一个固定的数字,可以有“工作日老年人,节假日年轻人”等等,体现了超出常人想象的隐私数据收集能力。



由此可见,哪怕是一次平常的在线交易,所产生的隐私数据并不平常,可能包含大量敏感的隐私数据


交易数据蕴含的隐私风险


技术的进步带来了令人惊叹的用户画像能力,一次次不经意的在线消费,练就了系统对于用户个体的精准认知——


甚至比用户本人还要了解用户,还有用户身边的人、事、物!


作为一把双刃剑,交易数据一方面能帮助平台和商家更好地发掘用户的偏好和需求,另一方面也暴露了用户行为模式上的弱点。出于本能的惯性,即便得知弱点被公开,作为普通人,也难以在短时间内去克服,所以一旦这些弱点被用于不法用途,将带来显著的隐私风险。


根据中国支付清算协会近年来开展的《年度移动支付用户问卷调查》,用户对数据安全的重视程度正在日渐加强,2019年的调查结果显示,超7成的受访者将个人隐私泄露列为所担心的首要问题之一。


事实上,上文美丽的遭遇在生活中并不是个例,隐私交易数据遭受泄露甚至被公然贩卖的新闻屡屡见诸报端,这些生活中的隐私风险主要由以下两类数据泄露造成:


1. 一般账号信息泄露


通常使用在线交易平台之前需要注册一个账号,并提供相关的个人信息,如用户名、邮寄地址、手机号码、银行卡账号等隐私信息。这些信息伴随着用户使用时产生的活动数据,也是用户画像的主要数据来源。一旦泄露,用户的敏感属性和弱点信息都将在法数据使用者面前一览无余,轻则个人工作生活受到骚扰(骚扰电话,垃圾短信),重则遭受精准电信诈骗,导致社会不稳定因素增加。


2. 实名认证信息泄露


相比一般的账号信息,在线交易中涉及的实名认证信息泄露更为致命。真实姓名与身份证号码是目前实名认证中的核心数据,可被用于各类金融服务账号的注册,一旦泄露,很有可能造成用户的直接经济损失。相关的生物识别数据更是关键,例如人脸识别数据泄露之后,除了整容换脸,用户基本不存在变更的可能性。



针对上述隐私风险,不同隐私偏好用户会对其严重性有不同的判断,需要在线交易平台履行告知义务,用户才有可能对自己关注的隐私风险进行有效控制


但值得注意的是,造成上述隐私风险一个重要的原因是,隐私交易数据过于集中在传统技术架构下的在线交易平台中,使这些平台成为高价值攻击目标,显著增加了隐私交易数据泄露事件的发生几率和不良影响。


区块链在交易数据隐私保护中的应用挑战


如何利用多方协作的分布式架构更好地解决上述数据隐私问题,区块链作为一项被普遍看好的前沿技术,其关键特性就是通过多方共识的分布式记账提高账本内容的可信度,对应的核心应用领域之一,便是支持交易支付场景中的记账和清结算。


回到在线交易场景,以传统线下现金交易模式为参考,我们可以梳理出在线交易场景中希望达到的数据隐私保护理想目标:
  • 隐私交易数据的最小化披露:只有直接参与交易的双方才知道所有交易上下文信息(消费偏好、住址、行为习惯等)。
  • 交易数据的分布式安全存储:控制隐私交易数据集中之后导致大量隐私数据泄露或滥用的风险。


显然,由于区块链多方共识机制需要所有节点运营方都能验证链上的数据,基础的区块链技术只支持明文记账和验证,并不能直接支持以上需求,这目前也是区块链技术在敏感数据领域推广的一个重要阻碍。


敏感的隐私交易数据不能以明文形式直接上链,所以需要考虑如何将其转化成密文进行上链,对应地需要克服如下技术挑战:
  • 密文内容正确性验证:上链的交易数据是否真的与预期的明文交易数据一一对应?
  • 密文计算功能:交易数据在密文形式下如何进行业务流程所需的计算?
  • 密文计算正确性验证:交易数据在密文计算结果的正确性如何验证?



为此,针对在线交易场景,WeDPR场景式数据隐私保护套件,提出公开可验证密文账本(Verifiable Confidential Ledger, VCL)解决方案,结合区块链、零知识证明、同态加密等前沿技术,有效攻克了上述技术挑战。


VCL不仅能够实现全密文记账,而且对交易数据支持全密文算术、逻辑运算。对于最具挑战性的密文正确性验证挑战,VCL能够在不解密隐私交易数据明文的前提下,完成对密文数据内容以及密文运算结果的验证,且其高性能实现可以满足金融级服务标准。


限于篇幅,本文重点梳理了在线交易场景中的个人数据隐私需求,如何使用VCL和其他配套的隐私保护技术为在线交易平台系统构建有效的隐私保护技术方案,将在后续的文章中进行详解。


VCL作为一项通用的账本解决方案,其应用并不限于满足个人数据隐私需求,也能满足机构之间业务数据互通互验但不可见的隐私需求。在下一话中,我们将以供应链金融为例,解析其中的数据隐私需求和业务痛点,敬请关注下回分解。


VCL核心算法和全平台SDK目前已开源,相关项目地址如下,欢迎各位体验交流。
https://github.com/WeBankBlockchain/WeDPR-Lab-Core
https://github.com/WeBankBlockchain/WeDPR-Lab-Java-SDK
https://github.com/WeBankBlockchain/WeDPR-Lab-iOS-SDK

https://github.com/WeBankBlockchain/WeDPR-Lab-Android-SDK


---END---


《隐私保护周三见》


《隐私保护周三见》第二季回归!本季将聚焦数据隐私保护应用场景,发掘并分析数据隐私保护场景需求,每双周周三,与各位共探隐私保护产业应用未来,以安全高效的方式促进数据可信流通。


本季将围绕个人数据隐私保护、机构数据隐私保护、隐私保护解决方案展开。




 往期集锦

 

第19论|数字化契约如何守护?解析聚合签名的妙用

第18论|数字化契约如何守护?解析盲签名的妙用

第17论|数字化契约如何守护?解析多方门限签名的妙用

第16论|数字化契约如何守护?解析群/环签名的妙用

第15论|数字化契约如何守护?密码学数字签名共性解析

第14论|硬件化方案坚不可摧?揭秘可信硬件TEE的是非功过

第13论|密码学原语如何应用?走近门限密码算法

第12论|密码学原语如何应用?解析密文同态性的妙用

第11论|密码学原语如何应用?解析密码学承诺的妙用

第10论|密码学原语如何应用?解析密码学特有的数据编解码

第9论|密码学原语如何应用?解析单向哈希的妙用

第8论|密钥繁多难记难管理?认识高效密钥管理体系

第7论|密码密钥傻傻分不清?认识密码学中的最高机密

第6论|密码学技术如何选型?终探量子计算通信的安全模型

第5论|密码学技术如何选型?再探工程能力边界的安全模型

第4论|密码学技术如何选型?初探理论能力边界的安全模型

第3论|密码学技术何以为信?深究背后的计算困难性理论

第2论|隐私合规风险知几何?数据合规商用需过九重关

第1论|隐私和效用不可兼得?隐私保护开辟商业新境地


上下滑动查看更多



浏览 32
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报