2020年7月和10月,我国陆续发布两部重磅级的法规草案——《数据安全法(草案)》和《个人信息保护法(草案)》。欧盟于 2018 年实施《通用数据保护条例》(GDPR),美国于 2020 年实施《加州消费者隐私法案》(CCPA),日本于2020年6月通过修订版《个人信息保护法》。随着全球数据安全法规监管的不断强化,合规性问题不得不纳入企业数据安全建设考虑范围。然而,法规对企业更高的安全要求,这给传统的数据安全防护技术与措施带来了前所未有的挑战。
在此背景下,绿盟近日发布《拥抱合规、超越合规:数据安全前沿技术研究报告》。在报告中,选取业界最为前沿与创新的十种数据安全技术,对其技术原理与应用进行全面的梳理与分析,包括处于学术前沿的差分隐私、同态加密、数据匿名;行业内炙手可热的安全多方计算、联邦学习等。这些新兴技术,为企业的数据安全建设带来新的思路与方案——助力其在满足业务需求的同时解决合规的痛点与难点。
1 简介
数据安全建设离不开具体的业务场景,数据安全技术需要从应用场景出发。根据企业的业务系统与应用、以及数据分布范围的不同,我们将数据安全建设分为三类场景:
1) 用户隐私数据安全合规;
2) 企业内部数据安全治理;
3) 企业间数据共享与计算。
如图1所示,上述三大类场景根据具体业务与功能的不同,可进一步细分一些子场景。各个子场景不仅有自身内部安全需求,也有相应的合规性要求,具体可对应到欧盟GDPR条款,以及我国已实施的《网络安全法》的数据安全相关条款。后续三个章节将从三类场景以及子场景的应用需求与合规挑战出发,研究与分析如何基于前沿技术,实现超越合规,解决安全痛点。
图1 超越合规:数据安全场景-前沿技术图谱
2 前沿技术+用户隐私数据安全合规
在该类场景中,企业需解决用户隐私数据的采集、以及数据权利请求响应的合规性问题,可引入下述创新技术:
1) 差分隐私
技术原理:差分隐私是一种基于噪声机制的隐私保护技术。在本地差分隐私模式下,每一个用户终端都会运行一个差分隐私算法,每一个终端采集的数据都会加入噪声,然后将其上传给服务器;服务器虽然无法获得某一个用户的精确数据,但通过聚合与转换可以挖掘出用户群体的行为趋势。
合规遵循:GDPR的 32条和《网络安全法》的42条。
行业应用(代表公司):Google、Apple,其中Apple通过差分隐私可挖掘到iPhone用户使用表情的频率分布,但无法获得具体某一个用户的确切隐私。
图2 iPhone差分隐私技术应用[1]
2) 知识图谱
技术原理:知识图谱最早用于搜索引擎和社交网络,它简单可以看成是一种基于图的数据结构,由节点和边组成,每个节点是一个实体,每条边是两条实体之间的关系。由于个人数据治理关键是个人数据实体识别,以及相关属性与处理流程的关联,引入知识图谱技术成为必然。通过知识图谱技术,可帮助企业了解所在敏感数据的位置,是如何被使用的,以及它的合同、法律和监管义务,达到个人信息治理与可视化作用。
合规遵循:可满足GDPR的12-22条和《网络安全法》的43条。
行业应用(代表公司):RSA 2020创新沙盒冠军Securit.ai公司,基于知识图谱技术实现了个人数据图谱应用。
图3 Securiti.ai的个人数据图谱应用[2]
3) 流程自动化
技术原理:用户数据权利请求响应是欧美等国外企业重要的隐私合规检查项。流程自动化技术可帮助企业的数据安全运营团队从繁琐重复的手工处理“请求-响应”转为自动化处理,一方面可降低人工的运营成本,另一方面可减少由于响应时间延误(GDPR规定一般为一个月)带来的违规风险。
合规遵循:GDPR的12-22条和《网络安全法》的43条。
行业应用(代表公司):Securit.ai、BigID和OneTrust等。
3 前沿技术+企业内部数据安全治理
在该类场景中,企业需解决内部敏感数据治理的安全与合规问题,可引入下述技术解决安全与合规问题,可引入下述创新技术:
1) 智能敏感数据识别
技术原理:传统基于关键词、正则匹配的敏感数据识别方法不够智能,易出现漏检(尤其是在文档等数据)。引入相似度计算、聚类、监督学习等智能方法,提升识别能力与检测效果。
合规遵循:GDPR的30条和《网络安全法》的21条。
行业应用(代表公司):Securit.ai、BigID等。
2) 数据脱敏风险评估
技术原理:数据脱敏在企业进行广泛应用,然而不同脱敏方法的安全效果不同。通过对脱敏数据集的身份标识度和隐私泄露风险进行定量地评估与刻画,实现风险管理和控制。
合规遵循:GDPR的32条和《网络安全法》的42条。
行业应用(代表公司):Privacy Analytics、绿盟等。
图4 绿盟的数据脱敏风险评估应用
3) 用户实体行为分析
技术原理:通过对用户实体持续的画像与建模,并建立正常用户行为基线,从海量收集的安全数据中发现数据泄露等异常行为。
合规遵循:GDPR的32条和《网络安全法》的42条。
行业应用(代表公司):Splunk、绿盟等。
图5 绿盟的UEBA数据安全防护方案
4 前沿技术+企业间数据共享与计算
在该类场景中,企业需解决企业之间的数据安全共享与计算的安全与合规问题,可引入下述创新技术:
1) 数据匿名
技术原理:对个人信息进行泛化和屏蔽等处理,使得对应的个人信息主体无法被识别,以达到“匿名”的效果,包括K-匿名、L-多样性和T-近似性等技术。
合规遵循:GDPR的前言26段和19条,以及《网络安全法》的42条。
行业应用(代表公司):Immuta、Privitar、 Anonos、绿盟等。
图6 绿盟的自适应匿名化算法应用
2) 同态加密
技术原理:明文数据经过同态加密后得到的密文数据,在不解密情况下仍然可执行密文数据的处理与操作。敏感数据在同态加密与计算环节处于加密状态,实现了数据的计算,同时保障了安全性。
合规遵循:GDPR的前言5条和32条,以及《网络安全法》的42条。
行业应用(代表公司):Duality 等。
图7 Duality的同态加密平台在金融数据共享应用(图引自[3])
3) 安全多方计算
技术原理:在参与方互不信任的情况下进行协同计算,在保证计算结果正确性同时不泄露任何一方输入的原始数据和状态数据。
合规遵循:GDPR的前言5条和32条,以及《网络安全法》的42条。
行业应用(代表公司):Google、蚂蚁金服等。
4) 联邦学习
技术原理:多个参与方(如企业、用户移动设备)在不交换原始数据情况下,即在隐私保护前提下,实现联合机器学习的建模、训练和模型部署。
合规遵循:GDPR的前言5条和32条,以及《网络安全法》的42条。
行业应用(代表公司):Google、Apple和微众银行等。
5 小结
随着全球数据隐私法规的密集发布,包括欧盟GDPR,美国CCPA,国内的《网络安全法》,以及今年发布的《数据安全法(草案)》、《个人信息保护法(草案)》,合规性成为了企业数据安全建设与治理的重要驱动力。在合规视角下,数据安全的内涵在合规与业务安全双重需求驱动下不断外延和扩展,数据安全的覆盖的应用场景将变得更加多样化,给传统的数据安全技术与方案带来了巨大的挑战。如何实现破局?本文简要介绍的十种新兴的数据安全技术,可为破局新场景新挑战带来一些思路与启发——助力企业在满足安全合规同时创造更大的数据价值。
为了获取更多内容,欢迎关注绿盟公众号,后台回复“数据安全报告”下载《拥抱合规、超越合规:数据安全前沿技术研究报告》。