为小微企业精准纾困 隐私计算在金融智能风控上大派用场

对隐私计算多方合作模式的研究,能够促进不同机构、企业在符合各项法律、法规及政策的前提下,进行顺畅高效的数据合作,解决“信息隐私”和“数据孤岛”问题,达成合作共赢。

True Nature-01
出处:隐私计算技术金融应用研究报告

2021 年 12 月,中国人民银行发布《金融科技发展规划(2022—2025 年)》(银发〔2021〕335 号文印发)明确提出从强化数据能力建设、推动数据有序共享、深化数据综合应用、做好数据安全保护方面充分释放数据要素潜能,并陆续出台了金融数据安全相关标准。金融数据安全与共享应用的重视程度与日俱增。

为推动金融业务更好地开展,推动跨机构、跨地域、跨行业数据资源有序共享,实现数据可用不可见、数据不动价值动,隐私计算技术被重点关注和推广。隐私计算技术在金融行业的实践中,已逐步实现产品化、平台化,通过规模化推广,能够在金融领域的更多业务场景、更全面的上下游供应链体系应用中,更好发挥数据价值,避免数据滥用,并产生极好的经济效益。在数据成为生产要素并推定流通的情况下,隐私计算技术及在行业的应用正在加速发展。金融机构和科技公司纷纷开始建设隐私计算平台,在精准营销、信贷风控、信息共享、反洗钱等领域进行试点。

金融行业各机构积累了高质量、高价值数据,但数据主要集中于金融领域,且受限于本机构业务范围。从需求角度来看,金融业务需要对客户情况、业务等形成全方位视图,多维度分析才能产生更大的价值。因此,金融机构对同业机构、其他行业机构有着迫切的联合计算意愿。隐私计算技术促进了更加开放的数据价值融合,充分挖掘了数据的潜在价值,既有效支撑了金融业务发展,更好地服务普惠金融、乡村振兴等国家政策,又为金融机构在运营管理、风险控制等方面提供了强有力的支撑。

银行等金融机构在对客户进行信贷风险控制时,为了得到更加精准的信用风险预测结果,利用外部数据一般采用两种方式:一种是直接购买外部信用分或欺诈分,此种方式受外部数据质量的限制,无法进一步提升效果;另一种方式为结合客户基本信息、资金流水等自有数据和外部数据联合建模,对其信用风险进行综合评估分析,数据合作涉及到多方客户数据的共享和使用,传统的技术保密方式主要依赖于数据脱敏,但数据泄露事件时有发生,未能很好地保障数据的安全。

银行拥有大量有信贷需求的用户,外部机构有海量的其他类型用户行为数据和场景数据。通过隐私计算,银行无需交换明细级原始数据即可联合其他数据源共同建立风控模型[13]。

金融机构同政务数据合作风控

案例一:贷后企业风险监测

主要应用技术:联邦学习

根据北京市大数据行动计划,为了发挥大数据在提升城市精细化管理、推动治理能力现代化等方面的重要支撑作用,北京市各委办局的政务信息已陆续汇聚在金融公共数据专区,涵盖工商、医保、社保、公积金等高价值数据,由北京金控集团的全资子公司北京金融大数据有限公司运营并统一对外提供服务。

工商银行与金控集团利用联邦学习技术,在双方数据互不出库、满足用户信息隐私保护以及数据安全的基础上,在企业贷款贷后监测场景中借助金融公共数据专区的企业不动产信息完成联合建模,打造抵押贷款客户不动产信息风险监测产品,为企业贷款业务的动态监测提供数据支持,实现企业抵押贷款贷后监测预警能力的进一步提升。

产品以企业名称和统一社会信用代码为匹配 ID,联合分行的企业贷款数据(客户贷款余额、期限、状态等)与金融公共数据专区汇聚的企业不动产数据(不动产信息、抵押情况、权利份额等),通过联邦学习平台在双方数据不可见的前提下,共同建立企业贷后监测场景风险评分卡模型,并根据该模型输出的评分转化结果将企业风险状态分为正常、关注、预警三个级别,代表企业的不同资产负债水平和风险级别,以此对抵押类贷款客户在不动产领域进行风险监测及评估。

产品上线后,在贷后管理环节除了可关注企业的经营状况、财务数据以及贷款关联的抵押标的物以外,能够更加全面准确的了解企业当下的不动产信息及抵押情况,掌握其实时资产负债水平,对于临近资不抵债状态的企业及时提示预警,在加强实体经济扶持的同时进一步确保贷款质量。

产品首批对百户存量企业进行监测,对于存在的个别关注企业已安排现场检查沟通,达到有效控制贷款业务风险的目的。工商银行北京分行也是金控集团诸多合作伙伴中,首批唯一一家运用联邦学习技术上线此类产品的单位。后续,分行将继续深化政务数据合作,推动经营管理和业务发展。

案例二:小微贷款类产品风控

主要应用技术:联邦学习

随着数据挖掘应用深入,金融机构开始引入外部数据拓展和提升数据挖掘的应用范围及使用效果。一方面银企合作升温、外部数据需求增加,另一方面,数据隐私保护已成为很多行业的发展趋势,我国也正推动立法规范数据的留存、使用和流通。在此背景下,民生银行主动拥抱监管要求,在“外部数据价值挖掘”和“数据隐私保护”二者的平衡中,借助联邦学习技术,与其他机构开展小微信贷风控领域的联合建模探索。

本方案如图 4-1 所示,主要包含数据准备、联合建模和解决方案三部分。数据准备阶段,应用隐私求交技术,民生银行与合作企业分别取出各自用户相同但是特征不完全相同的数据,为后续建模做准备;联合建模阶段,选用纵向联邦学习的 XGB 算法进行模型的训练,通过特征维度的增加助力小微风控模型泛化能力的提升;通过不断的调优迭代,最终形成了民生银行小微贷款类产品的风控解决方案。

图4-1 解决方案示意

新冠疫情爆发以来,小微企业面临了严峻的经营甚至生存挑战,民生银行通过应用前沿的联邦学习技术,在保护数据隐私的前提下,探索针对小微贷款类产品的风控解决方案,更高效地为小微企业纾困,助力我国疫情防控稳步向好。

金融机构间数据合作风控

案例一:小微企业新户贷后违约预测

主要应用技术:联邦学习

中国银联是中国银行卡联合组织,通过银联跨行交易清算系统,实现商业银行系统间的互联互通和资源共享,保证银行卡跨行、跨地区和跨境的使用。中国银联已与境内外数百家机构展开广泛合作,银联网络遍布中国城乡,并已延伸至亚洲、欧洲、美洲、大洋洲、非洲等 160 个国家和地区[14]。

招商银行为快速确认中小微企业新户的基本情况,对中小微企业风险进行高可靠性动态监测,使用银联数据完善企业主模型,用于丰富中小微企业用户画像。通过利用隐私计算技术,评估客户消费能力、信用能力等信息,解决机构无法准确全面了解客户真实能力的痛点,在数据不出本地的监管要求下,双方构建联邦模型,实时匹配。整个建模过程中,机构交互中间参数且不会泄露原始信息,最终构建一个全量模型,助力数据增值,保证数据安全,实现数据真正的流通。模型主要应用在信贷风控、精准营销等场景,帮助机构提升客户服务水平。

招行在行内已有风控模型入模特征基础上进行筛选,同时增加银联 C 端和 B 端的个人行为数据进行补充构建离线联邦模型,主要沉淀企业主能力模型,用于映射到企业的风控场景,和存量企业客户违约预测。

该案例利用银联全国性数据,扩展银行风控模型入模特征,提升银行现有风控模型效果;利用银联的数据优势,降低企业的获客成本及客户经营风险,提升经济效益,直接、安全并具有可控性。

案例二:小微企业贷前信审

主要应用技术:联邦学习

通过联邦数据网络进行信贷风控增强,从风险源头切入,帮助信贷公司过滤信贷黑名单或明显没有转化的贷款客户,进一步降低贷款审批流程后期的信审成本[15]。

为响应中央“六稳、六保”,支持小微企业信贷,微众银行以普惠为目标,希望服务更多缺少传统金融服务的小微企业,但因小微企业信贷评审数据稀缺、不全面、历史信息沉淀不足等问题,小微企业信贷业务难实现大规模增长,因此微众银行与中国银联合作,基于联邦学习框架,在双方数据均不出库的情况下使用中国银联交易流数据进行联合建模。联邦形式扩充了数据维度,为信贷决策提供了更有力的支持,促进了业务增长。整体结果表明:采用联邦特征工程对银联数据进行特征筛选,模型效果更好,更稳定,更具解释性。

案例三:排查多头借贷、超额借贷

主要应用技术:多方安全计算-联合统计

某小额贷款公司向个人提供小额贷款服务。当客户向小额贷款公司提出贷款申请时,小额贷公司需要评估借贷风险,排查用户多头借贷及超额借贷的风险。小额贷公司将联合市场上多家有同类服务的借贷公司对用户已借贷的公司数量、贷款总额进行调查。由于客户信息对于贷款公司是宝贵资源,贷款公司需要保护客户隐私不被泄露。

因此基于隐私安全考虑,小额贷公司联合多家同行在腾讯云隐私安全计算平台上,基于安全多方计算技术,在贷前对用户各借贷公司的贷款总额进行联合安全统计。小额贷公司收到联合统计结果后,决定是否向用户发放贷款。

联合安全统计的原理框架,如图 4-2 所示:

图 4-2 联合统计原理框架

联合统计采用安全求和的方法,隐藏各方真实数据保护各方数据安全,安全求和的全局过程为环形通信。

基于腾讯云的隐私安全计算平台,小额贷公司可以排查多头借贷和超额借贷的情况,对于高风险用户,可以得到来自平台的高风险报警。因此,小额贷公司可以在防范风险的同时避免各方信息泄漏。

金融机构同运营商数据合作风控

案例一:征信白户增信

主要应用技术:联邦学习

以某银行个人消费贷款申请评分模型为例,该产品的特点是全线上、无抵押,用于满足客户装修、购车、旅游、留学等多方面的用款需求。在风控审批中,该银行可用的数据有:客户在行内留存的个人信息以及客户的信用分数据,但如果客户为银行新户时,则没有足够的行内数据可以参考,或客户属于征信白户,即从未办理过贷款业务,也从未申请过信用卡,对于此类客户,很难对其信用水平进行准确评估。针对这类情况,可以引入外部公司数据进行联合建模,本项目利用运营商通话标签数据为客户增信,提升模型的预测能力。如下图 4-3 所示,在进行联合建模前,首先需要找到银行与外部公司的交集客户,例如双方共同的手机号码,通过 PSI 技术保证双方均无法知道合作方的差集客
户。

图4-3 PSI技术匹配交集客户

建模时,银行拥有标签数据和征信分数据,运营商拥有通话标签数据,模型训练完成时,双方仅可获得各自对应变量的系数,模型效果相较仅使用自有信用分数据有了显著提高,结果表明,基于联合建模的 AUC 提高了约 10%。利用联邦建模,不仅解决了征信数据来源单一的问题,提高了模型效果,同时也更好地保护了客户隐私,进而帮助银行满足合规要求的前提下,实现了智能风控升级。

金融机构同互联网公司数据合作风控

案例一:信用卡业务反欺诈

主要应用技术:联邦学习

银行信用卡反欺诈一直是业界热点场景,对于黑产数据的沉淀是银行的弱势,而大型互联网公司在欺诈的黑产数据上有较长期的沉淀。工商银行软件开发中心大数据与人工智能实验室与腾讯集团运用联邦学习技术,在双方数据互不出库、满足用户信息隐私保护以及数据安全的基础上,利用隐私求交技术得有效样本量 4 万多条,通过联邦特征工具加工工行特征数 6 条,腾讯方有效欺诈客户特征特征数 126 条。随后,利用双方特征和联邦树算法进行联合建模训练,得到联邦模型。同时,通过构建本地的三个模型—工行数据模型、腾讯数据模型、工行与腾讯数据联合模型,来验对方数据的可靠性以及联邦学习的稳定性。借助联邦学习技术合规地引入外部数据源,可以获得更真实完整的客户画
像,从而大大提高反欺诈预测模型的上限,并完善银行的反欺诈体系,进一步提高银行的风险管理能力。

案例二:长尾客户小额信贷风控

主要应用技术:联邦学习

开放银行作为银行业发展的未来趋势,对银行的数据管理能力、业务创新能力、系统科技水平、风险管理效果都提出了极大的挑战。

先进的信用风险预测模型需要大量数据来提升算法性能,金融行业需要更全面、真实的数据,不仅数据隐私性更高,且各机构间互不信任导致单家机构无法利用大量数据进行模型训练。长尾用户由于缺少信用记录或信用记录较少(例如,申请信用卡、消费贷款等),无法进行有效的风险判断。这一类客户能够获取的金融服务是有限的,但他们往往是亟需金融服务的人群。

在线上业务自主风控管理体系构建过程中,银行主要面临两方面的挑战:一方面是数据采集范围局限:传统的信贷数据主要基于人行征信数据,在与各合作方开展线上业务合作过程中,可用于线上审批模型及审批策略的基础数据来源较为单一,对于互联网生态环境下的多态数据获取及应用存在较大局限性。另一方面是隐私保护的要求:如何在确保数据隐私的前提下,达成与合作方的数据融合、数据挖掘。

为了解决以上挑战,浦发银行和蚂蚁针对联合贷款业务开发风控模型。双方充分挖掘各自不同的数据价值,提升自主风控能力。多方安全计算技术运用了秘密分享、同态加密等密码学技术,使得数据可用不可见,解决和数据合作中的安全隐私合规痛点。

建立更为精准的风控体系,实现差异化风控策略,为长尾客户等提供优质的信贷服务。同时基于模型对业务开展动态管理,有利于快速调整信贷额度,满足用户需求,加速普惠金融的实现。

特别地,对于小微企业开展信贷的时候,由于数据不全,企业经营风险大等原因,小微企业在信贷中往往处于很弱势的位置,在整个信贷领域中,小微企业的信贷占比很小,且还具有融资成本高的问题。但是从国民经济健康发展角度,小微企业是促进就业和市场活力的重要引擎,小微企业对资金流动性具有更高要求,因此该技术对小微企业精准画像,促进小微企业更简单融资,有着巨大意义。

以上摘自《隐私计算技术金融应用研究报告》:

本报告通过对隐私计算技术的研究及应用场景的探索,能够对隐私计算在金融行业的应用提供参考和指导。对隐私计算多方合作模式的研究,能够促进不同机构、企业在符合各项法律、法规及政策的前提下,进行顺畅高效的数据合作,解决“信息隐私”和“数据孤岛”问题,达成合作共赢。本报告围绕隐私计算,展开政策法规、标准、技术、场景调研,对应用场景进行探索实验,形成解决方案,并发布技术研究报告。

本报告一共分为五章,组织结构如下:

第一章是整体概况,介绍了本报告的研究内容与意义。

第二章介绍了隐私计算的关键技术、隐私计算与其他前沿技术的结合以及隐私计算技术的对比总结。

第三章是金融行业隐私计算背景,介绍了与隐私计算相关的政策、法律法规及标准。

第四章列举了金融行业隐私计算的应用场景与案例实践,涉及风控、营销、运营、匿踪查询、供应链金融、反洗钱等诸多业务领域。

第五章分析了金融行业推进隐私计算发展所面临的风险与挑战,并从行业政策、标准化、技术发展和产业发展的角度提出了相关建议。

更多智能营销、智能运营、隐私信息检索、供应链金融、反洗钱等方向的应用案例,下载报告:

来源:北京金融科技产业联盟