2022年12月28日,由中国信息通信研究院、中国通信标准化协会指导,隐私计算联盟、中国通信标准化协会大数据技术标准推进委员会联合主办的“2022可信隐私计算峰会”在京召开。会上,中国信通院云计算与大数据研究所所长何宝宏发布了《隐私计算白皮书(2022年)》。
近年来,在政策驱动和市场需求同时作用下,隐私计算技术作为保障数据安全流通的有效方式,乘时乘势高速发展,已逐渐成为促进数据要素跨域流通和应用的核心技术,广泛应用于金融、通信、互联网、政务、医疗、制造、能源等诸多领域。
《隐私计算白皮书(2022年)》将全面展现行业成就及发展新态势,旨在为产业界应用隐私计算技术提供参考指导,推动隐私计算行业健康发展,在数据要素市场建设中发挥更大的价值。
以下为发布实录
《隐私计算白皮书(2022年)》由隐私计算联盟联合行业多家单位共同编制,主要涉及隐私计算概况、技术分析、应用分析、行业分析、热点问题分析以及总结展望等多个方面。
随着数字经济持续高速增长,数据流通已成为数据价值化的重要途径。而在满足数据融合需求的同时,如何增强数据要素安全防护是数据流通面临的关键问题。
隐私计算是平衡数据利用与安全的重要路径。近几年来,我国持续重视隐私计算技术的发展,特别是今年,国内多部门密集出台了一系列政策文件,提出支持隐私计算技术探索,促进数据要素市场流通,隐私计算产业迎来良好发展环境。
根据隐私计算技术、应用的不同发展特点,隐私计算的发展历程可划分为四个发展阶段,即萌芽期、探索期、增长期、稳定期。当前,隐私计算正处于产业快速增长期,即将迈入前景广阔的稳定期。在未来,随着我国数据要素市场的加速建设,隐私计算技术进一步成熟,隐私技术的行业应用规模也将稳定增长。
2022年,隐私计算在技术上迎来了一系列的创新迭代。一方面,各个主流技术路线持续迭代优化,在单点层面提升了能力上限;另一方面,为了适应现实场景,业内也开始探索通过技术融合等方式突破瓶颈。
在多方安全计算技术领域,今年行业内针对多方安全计算的性能优化与应用扩展取得了一定进展。在性能优化方面,通过对现有算法协议改造、结合硬件加速能力等方式,实现了数倍到数十倍的性能提升,提高了可用性;在应用扩展方面,各种新算法和新协议相继出现,丰富了多方安全计算的应用场景。
在联邦学习领域,今年涌现出了大量的优秀研究成果,技术处于快速发展阶段。在性能优化方面,业内持续探索高效的联邦学习算法,有效降低了异构网络、物理距离、通信数据量等因素造成的通信瓶颈影响;在安全加固方面,针对增强协议的隐私保护能力、检测并防御潜在的各类安全攻击等方向均有新技术的出现,促进联邦学习安全性持续、稳固的提升;在模型效用提升方面,更多AI新技术被引入到联邦学习中,以求更有效地发挥可用数据的价值,解决多方交集数据稀缺的问题。
在可信执行环境(TEE)领域,从硬件侧到软件侧均取得突破进展,为技术大规模落地应用提供了必要条件。在硬件侧,随着TEE技术的不断成熟,越来越多的国内外硬件厂商在各自的硬件产品中加入了TEE相关能力。在软件侧,业内推出了一系列基于TEE的库操作系统、隐私计算平台等,提高了TEE技术的易用性;同时提出了支持各类硬件的通用TEE解决方案以及异构TEE互认证机制,逐渐打破了异构TEE之间的隔离性。
为降低单一技术局限性的影响,多技术融合为解决隐私计算的各类技术瓶颈提供了有效手段。多方安全计算与联邦学习融合,可以增强对中间数据的安全保护能力,实现更加安全的联邦学习聚合算法。多方安全计算与可信执行环境融合,可以防止因硬件环境被破坏导致的数据隐私泄露,同时降低多方安全计算跨网节点的通信瓶颈影响,进而提高计算效率。联邦学习与可信执行环境融合,可以通过技术手段降低对可信第三方的信任依赖,增强整套系统的安全性。
随着数据安全重视程度不断增长,隐私计算的应用需求从联合计算逐渐扩展到了数据全生命周期,隐私计算概念逐渐外延为“广义隐私计算”技术体系,在原有基础上扩展了数据限制发布、数据失真、辅助融合等技术。广义隐私计算技术可以实现数据全生命周期的隐私保护和数据可控可计量。
目前,隐私计算在金融、通信、政务、互联网、医疗等行业中的应用广泛。通过调研分析,隐私计算的应用主要覆盖两类场景:第一类中,传统信息安全技术已被普遍应用,但仍存在安全风险,隐私计算的应用可以进一步提升安全性,称为隐私计算存量优化应用场景;第二类中,传统信息安全技术无法满足应用需求,隐私计算则提供了新的机会,拓展了数据安全流通的应用场景,称为隐私计算增量创新应用场景。
隐私计算存量优化应用场景,主要有三个特点:一是原始数据保护要求较为严格;二是在保护原始数据安全前提下,通过共享数据ID提高计算效率;三是数据集规模较大。相比于传统的方法,存量优化场景解决方案能够加固对隐私数据的安全保护,同时提升关键的业务指标。
隐私计算增量创新应用场景拓展了数据安全流通的应用场景。该类场景对原始数据的保护更为严格;在保护原始数据安全同时具有特殊的要求,如需要在保护数据ID条件下完成特定任务等。通过隐私计算技术能够满足传统数据流通技术无法支持的场景需求。两个案例表明增量创新场景能够完成特定安全要求下的数据流通任务,同时提升业务指标和计算效率。
从现有应用来看,国内隐私计算以To B市场为主,参与方类型众多。行业需求方已覆盖金融、通信、互联网、政务等对数据融合需求较强的多个行业。技术提供方实现了以多方安全计算、联邦学习、可信执行环境为主要技术路线的隐私计算平台类产品,包括隐私计算垂类企业、大数据企业、区块链公司等软件提供商以及硬件支持类企业。
目前隐私计算技术提供方的商业模式主要分为平台建设与数据运营两大类。在未来,平台建设不仅可以在现有的金融、通信、政务等核心行业的基础上继续扩大,也可以在医疗、能源、交通等创新领域进行拓展。对于数据运营而言,从传统数据集或API调用转向隐私计算模式进行升级改造将是未来的发展趋势。根据这两类商业模式的相关数据进行测算,预计到2025年我国隐私计算市场规模将达到百亿元。
今年隐私计算领域标准、论文、专利等成果依然快速增长。在标准方面,隐私计算国际标准开始向安全和互联互通进行扩展。而国内隐私计算相关标准迭代更快,已经向着各个应用场景、软硬结合、互联互通等方向逐步扩展。在论文、专利方面,隐私计算作为一种新兴的融合技术,其理论研究和技术应用产出均呈现上升趋势,也顺应了世界各国重视数据隐私安全的政策基调。
开源生态促进隐私计算行业蓬勃发展。开源作为一种新型的生产协作方式正逐渐渗入到各个技术领域,也同样有益于隐私计算行业。从隐私计算开源项目数量上来看,今年的隐私计算开源项目显著增多,开源的技术路线以多方安全计算和联邦学习为主。这些开源项目的不断涌现,既可以降低隐私计算行业门槛,为行业发展带来活力,又可以提升隐私计算平台的安全可信性。
隐私计算技术在不同行业、不同场景和不同技术路线中的安全分级是应用过程中的热点问题。根据广泛研讨,隐私计算安全分级框架思路如下:第一步,全面梳理隐私计算产品所面临的安全威胁及风险点,可参考中国信通院牵头编写的隐私计算安全标准及评测实践;第二步,定量分析各产品的数据保护程度,形成通用的数据保护程度评价体系,并结合主动攻击和定量分析的方式做到安全可验证、可度量;第三步,结合各行业的数据分类分级要求,确定各业务场景的安全基线,形成各分支技术通用且符合业务场景需求的安全分级框架。
隐私计算性能在某些计算场景中已显著增强,未来可从软件和硬件两个层面进一步优化。在软件层面,一是进行并行化处理,二是选择高效的调度算法提升网络通信效率,三是对算法本身进行合理优化。在硬件层面,使用专用的加速设备将同态加密等复杂运算转移至硬件上执行可以缩短计算耗时,提升计算性能。
探索兼容性强、开放度高的互联互通模式将成为数据流通的重要方向。然而,隐私计算互联互通需要统一规范的接口、协议等实现跨平台的数据、算法、算力的交互与协同。由于技术原理的复杂性和产品形态的多样性,需要行业多方协作共同探索可验证、可推广的互联方案,以便于在技术上形成统一的标准规范,在应用上适配业务场景,共同推动构建完善的互联互通生态网络。
随着《中华人民共和国个人信息保护法》(以下简称“个保法”)出台,隐私计算领域合规问题迎来广泛探讨。我们认为,单纯使用隐私计算技术并不能免除取得授权同意义务、达到绝对的匿名化或满足目的限制要求,它并不是为了帮助履行个保法的合规义务而设计的合规工具,而是对于增强数据处理安全性具有积极意义的技术手段。隐私计算可以通过加密、分片、不传递原始数据等方式大大降低数据泄露和被滥用的风险。
隐私计算作为数据流通的重要创新前沿技术,近几年来在技术、应用和行业层面上都得到了快速发展,下一步应在性能提升、安全分级、互联互通等方面重点突破。在未来,随着隐私技术产品的技术能力和应用模式越发成熟,隐私计算将有助于构建数据流通的基础设施,在保证安全的前提下有效持续释放数据要素价值,促进数字经济高质量发展。
本次隐私计算白皮书编写汇聚了多方力量。面对这个日新月异、快速发展的行业,我们期待与业界共同守正创新,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设过程中发挥更大的价值!
白皮书联系人
贾轩,jiaxuan@caict.ac.cn
白皮书全文下载:
隐私计算白皮书(2022年)
更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。