隐私计算在金融行业的应用和典型案例分析

通过使用隐私计算技术可以在不直接暴露客户数据的情况下进行风险评估、客户画像分析等操作,使得金融机构可以在满足合规性要求的同时进行数据价值开发利用。

隐私计算在金融行业的应用和典型案例分析
出处:隐私计算联盟、中国信通院云大所

随着数据要素流通被高度重视,隐私计算技术通过“原始数据不出域、数据可用不可见”的服务范式已逐渐成为数据安全流通的有效保障方式。近年来,隐私计算在政策和市场的双重驱动下高速发展,正处于产业快速增长期阶段。

隐私计算应用也逐渐从金融、政务、通信、互联网、医疗等传统场景扩展到能源、工业、教育、广告、跨境流通等新兴领域;同时在数据要素加速开放共享的新形势下,隐私计算也成为支撑数据要素流通平台的重要技术设施,在公共数据流通平台、数据交易平台、企业集团数据平台等模式上被广泛应用。

(一)隐私计算在金融行业的应用分析

在金融行业中,近年来隐私计算在金融场景中的应用需求和发展趋势上有一些变化。首先,金融行业涉及大量敏感和个人化的客户数据,如财务信息、信用卡数据和个人身份信息,金融机构客户数据隐私保护要求越来越高,尤其是涉及个人敏感信息的情况下。其次,金融机构也面临更为严格的合规性要求,如 GDPR(通用数据保护条例)、反洗钱(AML)等规定,要求对个人数据进行适当的保护,并限制数据的跨境传输和处理。同时,金融行业中更多的机构和部门需要共享数据以完成风险评估、反欺诈和客户洞察等任务,然而高价值的数据共享往往涉及数据安全和隐私泄露风险。

隐私计算允许不同金融机构之间在保持数据加密的同时进行计算和分析,多方可以同时参与计算,解决了数据共享和协作的痛点问题。同时,通过使用隐私计算技术可以在不直接暴露客户数据的情况下进行风险评估、客户画像分析等操作,使得金融机构可以在满足合规性要求的同时进行数据价值开发利用。此外,通过将数据隐私保护和计算分离,金融机构可以与监管机构共享有关客户的信息,同时保护客户隐私,这使得金融机构能够更好地理解客户需求、改进风险管理,并提供个性化的金融服务。

(二)隐私计算在数据流通平台中的应用分析

我国数据要素流通模式正在寻求高效有序的发展路径,需要通过规范数据供求双方、数据中间方和监管机构多方参与的数据流通体系及流通行为,构建商业价值、个人隐私和公共利益的平衡,使数据流通平台成为兼具“技术、信息安全和法律保障”的数据价值转化渠道。自 2021 年以来,我国关于各项数据权属、价值、安全、流通相关的规章制度、配套措施和业务模式加速完善。然而,在数据要素市场的业务实践中仍存在着一些痛点。

在数据安全防护方面,数据要素的流通容易泄露和遭受安全威胁,规模化存在的数据要素一旦遭到泄露,不仅会损害单个用户的隐私权益,还可能诱发大规模的公共安全事件。在数据合规方面,数据能够流通的前提是数据必须符合国家、地方的数据安全法律法规和各个行业的数据管理规范,并符合数据交易等的相关规定。在交易机制方面, 现阶段我国数据的交易机制仍以点对点模式为主,由于缺乏信息传播性和广泛参与性,难以实现大规模的数据要素市场化配置。在流通方式方面,当前数据流通主要还是采用数据包和明文接口的简单方式,主要面向可公开的较低安全层级的数据,能够挖掘的价值有限,而安全等级较高数据的交易及价值利用已日益成为市场的广泛需求,高等级数据正逐渐成为新一代交易所关注的交易对象,需要提供适合高安全等级数据交易的流通方式。

数据流通平台的核心建设目标是通过安全合规、高效运作的数据交易平台,为数据提供方和数据消费方提供一个合规合法、可面向不同数据安全等级的流通环境,从而实现数据要素为市场多方创造价值的目标。隐私计算作为隐私保护下的数据价值挖掘技术体系,可用于支撑数据流通环境实现数据在隐私要求下的安全流通。在数据流通平台的交付环境中,针对不同分类分级数据的安全合格要求,需提供对应的具备隐私保护能力的数据交易方式,隐私计算适用于无法出域的较敏感等级数据,通过联邦学习、多方安全计算等方式进行数据授权、联合统计、隐私计算任务运营、数据交付等。

同时,数据流通既是数据内容在不同主体间的传递,也是数据管理权责的主体转移与价值转换过程。隐私计算通过结合区块链、数字身份、数字钱包等技术,可以构建一套覆盖个人、企业、政府机构等参与方的流通基础平台设施,促进数据要素价值交易。例如:通过数字钱包流通平台,个人可一次性将分散在各个机构的数据进行整合,专门的数字钱包服务商将对其进行管理,个人可授权服务商进行数据收集、流通和分享,从而带来数据变现;基于数字身份构建数据资产身份体系平台,具备流通使用价值的数据要素,经过背书机构的认证后具有数据资产属性,可以被抵押、转移、交易和找回、验证。

(三)金融行业典型案例分析

案例一:全匿踪隐私计算技术在证券领域的应用

1) 案例背景

在金融集团跨主体联合风控场景中,因监管报送需要,证券总公司需要给集团定期报送子公司不同维度的各类风险信息统计汇总数据;在强监管联合营销场景中,在证券公司与特色场景方的合作投放过程中,场景互联网平台负责流量触达的曝光点击,证券端负责留资意向线索的转化。

富数科技在证券领域面临的痛点有:在联合风控场景中,证券行业合规要求是不能暴露证券客户信息。由于集团监管报送涉及联合多家单位的数据处理及汇总工作均在母公司本地进行,必然会暴露子公司客户明细,传统模式跨主体监管统计涉及数据出库汇总和用户信息暴露,产生合规风险。在联合营销场景中,联合营销双方各自控制拥有的用户画像特征数据,受合规要求不能出库共享,基于个人信息标识化特征样本集参与联邦建模,仍面临需取得大量用户授权的困难,且常用的安全求交会暴露共同客户集。

2) 解决方案

立足上述痛点,富数科技研制全匿踪系列技术 AnonymFL 包括匿踪样本对齐、匿名化特征处理、匿踪联邦训练、匿踪联邦推理等全流程解决方案。与传统隐私计算不同, AnonymFL 匿踪对齐样本集无法识别到特定自然人且不能复原,并理论上不再需要获得用户的授权同意,增加了对匿踪对齐样本集的匿名化处理,可以进行各种合规的全匿踪计算、建模和加工处理,既保留了数据高价值又满足《个人信息保护法》的合规要求。

图 4 全匿踪联邦学习原理示意图

联合风控场景中,通过匿踪查询技术,将母公司规则数据表发布成匿踪 API 接口,使得子公司可以在不泄露自身客户信息的前提下,按要求完成自身数据治理;通过全匿踪安全统计分析技术,对并表需求方数据进行加密汇总并对特定结果进行排序输出,保证整个过程各方原始数据和客户来源对各个参与方保密。

联合营销场景中,基于证券和互联网平台成功营销的客户 id 作为 y 样本,补充互联网平台用户画像数据,利用全匿踪联邦学习 lr/xgb/lookalike 算法,建立人群优化模型。参与各方无法获取有哪些样本参与了联合建模,从而避免暴露各自用户 ID 。全匿踪样本对齐算法在保持匿踪的条件下,基于秘密分享机制的 ID 碎片化处理实现了参与各方的样本对齐。全匿踪联邦学习算法在保持匿踪的条件下,进行联合建模,迭代训练直到收敛。

3) 创新性及成效

本案例解决了目前隐私计算方案中普遍存在的“缺少个人同意”、“ID 泄露”的重大法律风险问题,在保证合规性的同时也优化了计算性能。在风控场景中,证券总公司风险暴露额及授信余额汇总等 500 万条以上;非同业非集团和同业集团风险暴露总额排序前X 客户、关联客户汇总、行业粒度汇总、境外地区粒度汇总和共同/非共同客户汇总,证券子公司风控数据样本 500 万以上,客户风险暴露额、授信余额等。营销场景中,证券公司证券投资用户画像全匿名化加密数据样本 100 万,加密特征指标 50 维;特色场景用户画像全匿名化加密数据样本 100 万,加密特征指标 50 维。

案例二:基于联邦学习的外汇合规风险联合防控体系

1) 案例背景

我国外汇市场是我国对外经济交流发展的重要窗口,面对汇率的波动、国际形势的变化,外汇风险防控是维护国家金融安全的重要一环。本项目使用图联邦技术实现从外汇结汇资金到人民币转账资金的全链路追索,成功解决了隐私保护下跨币种、跨机构、跨地域风险转移途径计算问题,相关技术解决方案有着广阔的推广前景和重要的推广价值。在个人外汇业务合规风险防控过程中,仍然存在如下痛点: 防控措施存在滞后性、防控精准性不足、防控仍有盲点。

2) 解决方案

项目建立本外币一体化的客户关注指数模型,支撑合规风险精准预警。指数模型联合外汇管理局掌握的青海全省外汇、跨境业务数据, 以及工商银行客户画像、人民币交易、客户信用数据,综合、全面地反映客户结售汇风险,精准预警具有异常结售汇行为的客户,提前预判客户合规风险程度。从技术实现方面,项目基于工商银行的联邦学习平台,利用隐私计算技术,支持在安全隐私及合规的前提下,联合外管局与工行数据构建模型,并通过工商银行联邦学习平台提供用户日志监测能力,提供对相关数据和交互行为的溯源审计功能。

图 5 基于联邦学习的外汇合规风险联合防控体系

为了全面追溯结汇风险,从外管局掌握的可疑结汇账户出发,在工行不获知非工行客户,外管局不获知工行人民币资金网络图谱的情况下,计算可疑结汇账户资金转移链路,有效识别违法违规关联账户和交易实际操纵者。具体实现方案如下:

图 6 具体实现方案

外管局将高关注评分的结汇账户作为“可疑节点”,节点属性为 1.0 。工行以人民币转账客户作为节点、转账交易作为边,转出金额/ 该节点总转出金额构建人民币转账网络图。通过图联邦学习(在保护用户数据隐私的基础上,针对于图结构数据,进行联邦建模)从“可疑节点”出发,沿转账边传播 1 度风险,风险度量为:节点属性*边(资金)权重,若最终节点风险值>=一定阈值,则作为风险名单输出。

3) 创新性及成效

项目有效提升外汇合规风险防控的时效性,采用隐私求交技术,工商银行共命中 300 多个 2021 年 6 月~2022 年 6 月间的结售汇风险关注客户。此外,项目大幅提升了外汇合规风险防控的精准性和覆盖范围,本项目构建的个人结售汇关注指数模型 50% 召回率时准确率达到 96%,90% 召回率时准确率达到 63% 以上。较仅用工行数据建模 AUC 提升 60% 以上,可减少工商银行人工核查工作量 50% 以上;较仅使用外管局数据建模 AUC 提升 3 个百分点,每百人可多发现 5 个风险客户。

案例三:证券业分布式可信数据共享平台

1) 案例背景

证券行业普遍存在多方数据融合应用和隐私保护的双重需求,具体包括:协作中的自有数据隐私保护,交易中及交易后的不可篡改存证等。洞见科技在“基于‘隐私计算+区块链’的证券业分布式可信数据共享平台”项目中以上证链为基础,通过隐私计算与区块链技术的融合,构建“可信、可监管、安全、自主”的数据共享平台。

债券市场作为典型的信用市场,一笔交易往往涉及多笔关联交易执行,任一方违约都将造成整体交易链条无法执行,给其他参与方造成较为严重的交易事故。虽然债券市场参与机构整体信用较高,违约事件仍时有发生,且对交易方的违约评估数据均保存在各市场参与机构自有数据库中,“孤岛效应”明显,缺乏合适的途径相互关联聚合。因此,在技术层面,需解决数据开放共享与数据隐私安全“两难”问题,保障数据要素安全流通;在场景层面,需构建黑灰白名单共享场景应用机制,降低证券业整体信用风险;在行业层面,需提供可信可控的数据共享环境,促进证券业协同创新。

2) 解决方案

本案例以上证信息已有上证链以及洞见科技隐私计算平台洞见数智联邦平台InsightOne 为基础融合开发适配。

分布式可信数据共享平台搭建:平台由资源管理、隐私计算引擎、运维管理、可信网关及业务应用五大部分组成,具有节点管理、数据资源管理、任务管理、应用管理、审计日志等前后端功能,能够有效实现可信身份认证、可信存证管理、可信出证管理及智能合约管理。

图 7 基于隐私计算和上证链的业务系统架构

数据共享应用对接:由“点”及“面”对接证券公司、银行、政府机构等,构建证券业可信可控的数据共享环境,通过金融科技及多方数据融合价值降低证券业整体信用风险。

图 8 上证链+隐私计算

实际业务场景应用:在不暴露投资者原始信息情况下,实现行业黑灰白名单共享,各券商机构通过上证链数据共享平台完成黑灰白名单判定,实现数据可用不可见,通过该方案降低了证券行业违约风险,丰富了上证云链一体化产品服务,促进行业数字化转型。

3) 创新性及成效

本案例面向证券行业,提供安全可信的隐私计算服务和区块链服务,推动证券行业的数智化风险违约管理体系建设,实现证券期货行业各方在“安全可信任、可控可监管”的数据共享环境中进行业务协同与创新,具有行业标杆意义。

在业务营收增长方面,通过融合隐私计算技术实现对已有上证链基础设施的升级,已实现链下计算、链上存证,多方数据安全融合应用,丰富了上证链产品矩阵,拓展了上证链业务范围,业务收益增长近 500%。

在安全性、高可用性与准确性方面,通过算法容器的兼容设计、计算服务功能模块高度解耦,保障算法的安全性、提高代码的清晰度、提升算法模型的准确性,与原有模型相比,AUC 提升 15%。

本文摘编自隐私计算联盟、中国信息通信研究院云计算与大数据研究所发布的《隐私计算应用研究报告(2023年)》,全文下载:

更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。

即日起,前沿资料更新将只对数治网DTZed 正式会员开放免费下载,欢迎在注册后按下面两步加入 AIGC + X 赋能成长营,获取 AI 人才匹配、自主学习课件和数据素养基础测评三大权益:

  1. 填写开通申请
  2. 扫码获邀入群;

更多内推、热招职位征集中,还可领取入门公益宣讲和升值加薪计划福利,一起用 AI 工具打败工具人。

一条评论