大数据产业峰会回顾 | 金融外部数据管理思考(附相关下载)

在6月29日的数据资产分论坛上,中国信通院云大所大数据与区块链部工程师侯宁就金融机构外部数据的话题介绍了近期的相关业务和思考。

金融外部数据管理思考-侯宁
出处:数据资产管理联盟IDA

为进一步加速推动我国数据智能转型进程,推动“十四五”期间数据智能产业交流与合作,由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的2022大数据产业峰会于6月28日在京召开。

在6月29日的数据资产分论坛上,中国信通院云大所大数据与区块链部工程师侯宁就金融机构外部数据的话题介绍了近期的相关业务和思考。

以下为演讲实录

首先需要明确为什么越来越多的机构引入外部数据,尤其是金融行业。一方面,对于金融和其他所有行业,降低运营风险是业务健康持续发展的保障,而金融业是典型的经营风险的行业,其对于风险管理的水平直接决定了经营能力的高低,而风险管理的背后核心就来源于数据。所以对于金融机构而言,数据是核心生产要素,数据越丰富,对提升银行的经营能力的作用就越大,因此,从内部、外部获取尽可能多的数据一直是金融机构的刚需。另一方面,若金融机构单单只依靠内部数据,来源过于单一,数据的描述维度过于片面,无法满足日益增长的运营诉求,所以随着现在互联网时代的发展,数据爆炸式增长,金融机构开始陆续拥抱大数据。这在很大程度上可以解决数据获取来源的局限性问题,并且,外部数据引入和内部数据的融合,会出现倍增效应,使得数据产生更大的利用价值。这些价值就是通过全面的用户画像以及企业画像来体现,一是对个人和企业的风险管控,二是对个人和企业的精准营销。

当前可以大抵将金融机构外部数据管理划分为四个阶段。首先是初级阶段,即分散管理阶段,这个阶段机构内通常尚未制定统一的外数管理标准,外部数据会由各业务部门根据需求自行管理,显而易见会出现外部数据重复引入、共享受限、数据应用方式单一等问题。为解决这些问题,在平台管理阶段,机构会逐渐开始组建外部数据管理团队,部署外部数据管理平台,但由于缺乏经验,这个阶段仅会有部分的外数管理工作实现线上化,大部分的管理流程没有被统筹,依赖人工操作,并且,平台功能还无法满足所有业务需求,外部数据源的准入标准、采购需求和质量仍处于一个不稳定的状态。之后,随着不断吸收外部数据管理经验,机构内逐渐提高对于外数管理重要性的认识,机构开始归口外部数据管理部门,授权归口部门对外部数据进行全流程集中管理,本阶段也会开始建立自上而下的外数管理制度和细则,逐步提高外数管理的线上化程度,加强外部数据资源的集约化管理,逐渐形成一套较为完整的体系化管理机制。再之后,机构会进入持续提升阶段,这个阶段重点是提升外部数据精细化管理能力,根据外部环境的发展不断优化自身管理模式和流程,推进外部数据的价值量化,进一步明确和释放外部数据的内在价值。

云大所大数据与区块链部自2020年开始,就联合包括建设银行、工商银行、邮储银行、浦发银行、交通银行、中原银行、蚂蚁集团等在内的数十家金融机构和外数厂商围绕外部数据展开了多项内容的研究。包括从甲方视角探索外部数据管理实践经验,编制《金融机构可信外部数据源评估要求》以及《金融机构外部数据管理实践白皮书》,从乙方视角编制《外部数据管理平台技术要求》,并计划在今年建立《外部数据管理能力成熟度模型》。

白皮书下载附后,相关新闻访问:发布!《金融机构外部数据管理实践白皮书》正式发布

首先《金融机构外部数据管理实践白皮书》由云大所联合多家外部数据管理先行先试的代表金融机构共同编写,主要是通过对金融机构外部数据全生命周期的现状梳理,寻找行业内共识性的解决方案,为业内提供管理实践模板和最佳实践参考。《白皮书》认为金融机构外部数据是指为实现金融机构特定业务目标,通过采购、合作、自主采集等方式,由金融机构外部引入的数据,在此基础上对金融机构外数管理的概念、原则和模式进行讨论,并针对当前的主流模式统一集中模式展开详细描述。

其次,云大所大数据与区块链部联合多家银行以及厂商共同制定外部数据管理平台技术要求的标准,标准主要规定了外部数据管理平台技术产品的基础能力要求,包含外部数据统一接入、外部数据集中管控、外部数据服务管理、数据平台统一配置四个能力域,共有32个测试项,包括19个必选项和13和可选项。标准适用于外部数据管理平台产品的研发,平台基础能力测试、评估、验收以及采购选型,该标准评测工作已经开通。

此外,云大所计划于今年下半年联合多家机构从第三方的视角共同建立《外部数据管理能力成熟度模型》,各方位、全链路分析机构在外部数据管理能力水平。现在模型初步将外数管理能力细化为5个主要能力,第一个是管理保障能力,从外部数据制度建设、流程规范、组织架构、人员管理四个维度评估机构对于外部数据的总体支撑力度和效果。第二个是数据治理能力,具体包括数据标准、数据质量和问题管理模块。第三个是数据处理能力,覆盖数据引入到销毁、评估整个应用流程展开能力评价。第四个是数据安全能力,包括外部数据的分级分类、异议处理、合规管理、监控审计、应急处理以及安全事件等一些必要的安全管控能力。最后一个是风险管控能力,主要包括风险管理以及合作方管理。另外,参考国家其他的一些相关模型方法论初步考虑将外数能力的成熟度分为5个等级,分别是初始级、管理级、稳健级、优化级和引领级,并为所有的能力域定义达到各级别所需要具备的条件。当前模型编制工作还在征集单位阶段,7月份模型编制工作会正式开始,编写完成也会启动测评工作,有意向的单位可以发送邮件至houning@caict.ac.cn。

未来,将会有四个要素影响金融机构外部数据管理的发展,分别是机构外部的数据源和技术以及机构内部的管理和流程。其中最基本的就是数据源,机构需要掌握外部数据市场的动态,持续更新以及优化自身的外部数据资源库,针对资源分布开展研究工作,建立数据源评价体系,确认权威数据,拓展数据价值挖掘的广度。然后是技术应用能力,数据在分析应用的过程中需要兼顾应用深度和安全合规,这时候就需要尝试通过技术方案来解决两者的矛盾点。再然后是内部管理,需要明确相关组织架构,明确管理角色和职责并对齐管理目标,并且不断探索先进的外部数据管理与应用模式。最后是管理需要最终实现大范围的在线化流程,使外部数据可以无阻碍触达前、中、后台业务系统,更有利于将上述的所有管控措施进行在线配置,从而达到更全面和统一的管理效果。