一文全解当前金融业数据应用三大特点与数据治理体系(附下载)

本报告从金融业数据要素价值体系、数据能力建设运营、技术现状与安全防护等对大数据应用提升金融创新发展进行了阐述。

金融业数据应用发展报告-头图
出处:北京金融科技产业联盟

随着金融业务逐步场景化和线上化,快速响应客户需求成为大数据应用的发展目标。围绕“以客户为中心”的发展原则,金融企业需要从企业级视角结合业务需求对数据应用进行统筹规划,制定统一标准、完善并精简流程、建设底层基础设施、构建一体化服务平台、提升服务能力、质量和速度,实现对数据服务的高效共享和低成本复用,充分发挥企业核心能力,更好地为客户提供优质服务。

为了应对新形势下的挑战,金融业纷纷加强数据多元融合、数据资产化、数据安全合规等方面建设,为业务场景提供智能化、实时化、 产品化和平台化的数据服务,并不断沉淀提升平台基础能力,助力推进数字化转型任务。下面从数据要素化、数据服务化、能力平台化三个方面对金融业大数据应用发展特点展开介绍。

特点一:数据价值要素化

(1) 数据多元化

金融业大数据应用呈现多元融合态势,形成金融数据应用融合新格局。一方面,数据要素展现出多元化特点。在数据类型方面,数据应用需求从传统的关系型数据表等结构化数据,逐步扩展到用户埋点等半结构化数据和图像语音等非结构化数据,有力支撑了人工智能(AI)、 商业智能(BI)等金融智能应用场景;在数据来源渠道方面,数据应用场景不但涉及金融机构内部多元化数据,更广泛涉及银证保等不同细分领域及工商、海关、税务、电力乃至医疗系统等不同行业的外部数据,面临不同行业及领域数据多 样化、差异化的挑战。

另一方面,数据应用呈现出融合化趋 势。通过对多元化数据源进行拼接、汇总、关联分析,能够形成更全面的客户、机构、产品统一视图,能够有效贯通多种类型、多种渠道数据应用壁垒,金融业大数据应用迈入多元融合新阶段。

(2) 数据资产化

数据通常是指对客观事物进行记录、未被加工的原始素材,是基础生产资料。互联网时代下,具有价值的数据通常具有数据量大、类型多样、更新频繁、价值密度低等特点。随着金融企业数据化战略的推进,数据被运用在众多业务条线,但同时也面临着落地链路长、重复建设、口径差异大等问题,造成了效率低下、资源浪费且很难将数据价值充分发挥出来。

为了充分利用数据的价值,企业内部本着业务需求统筹、数据加工路径明确、加工流程准确、数据更新快等原则,从企业级视角出发,协同业务和技术,共同构建企业级数据资产,如辅助企业经营的指标体系、描述客户画像的标签体系、用于多维度分析的多维数据模型、用于关联分析的知识图谱等。数据资产化能够提升数据的价值密度,提高数据共享复用能力,从而能更好地服务公司自身经营决策、优化业务流程,提升公司运营效能,还能形成对外服务的数据商品。

(3) 数据要素化

大数据应用在金融领域的蓬勃发展,给数据安全治理带来了前所未有的挑战。首先,大数据应用安全重要性越来越高。2020 年 4 月 10 日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》中, 首次将数据定位为新型生产要素,与土地、劳动力、资本、技术并列;2021 年 6 月 10 日,《中华人民共和国数据安全法》的颁布,标志我国在数据安全领域有法可依。各种法规、行业标准的密集出台,给大数据应用安全治理提出了越来越高的要求。

其次,大数据应用安全风险越来越高。由于大数据应用的特点,数据存储更为集中,价值密度更高,更易被作为攻击对象。此外由于应用形式更多样化,容易造成数据的误用、滥用,甚至泄漏关键敏感数据。

再次,大数据应用安全涉及面越来越广。内容和工具方面,从对传统结构化数据的保护,到对非结构化数据的保护,从关系型数据库到各式各样的非关系型数据库,保护的数据形态和数据工具范围在逐渐扩展;流程方面,对数据安全的设计从系统设计阶段,逐渐前移到需求研制阶段,从源头对数据进行分级分类,按需保护。

最后,对个人信息的隐私保护越来越完善。保护范围从直接采集的个人数据,逐步拓展到由推断性信息生成的“数字化人格”,此外“隐私计算”等多方安全计算技术的发展,可以对个人隐私提供更完善的保护。

特点二:数据运营服务化

(1) 服务智能化

在传统 BI 应用的基础上,人工智能技术在金融业有广泛的应用,赋能金融业智能风控、智能营销、智能客服、智能投顾等多个领域,实现领域应用的产品创新、突出成效以及服务升级。

  • 智能风控领域,运用流计算、知识图谱、OCR 与设备指纹等多种人工智能技术,结合信贷、反欺诈与异常交易监测等业务领域,支撑线上信贷风险防控、贷后实时风险监测与智能反欺诈等场景,全面提升风控的效率与精度;
  • 智能营销领域,基于用户画像,利用强化学习、深度学习等算法进行模型构建,对客户推出千人千面的精准化营销,从而帮助金融机构与渠道、人员、产品、客户等多个环节互联互通,为平台的消费者提供精准化、个性化的营销推荐服务;
  • 智能客服领域,通过自然语言处理、智能化搜索引擎、OCR 与生物识别技术等多项人工智能技术的融合,使用文本、语音及机器人反馈动作等方式向客户传递信息,构建基于知识图谱的知识管理体系,为客户提供自然、高效的交互体验方式;
  • 智能投顾领域,运用人工智能相关技术,从投资期限、风险偏好以及回报预期等多个维度为客户推出个性化的资产配置方案,同时结合营销咨询、 资讯推送等增值服务,有效降低交易成本并提升服务体验。

(2) 服务实时化

随着互联网的普及和 5G 时代的到来,在线业务和相关应用场景呈现井喷式发展,客户需求瞬息万变、对服务的响应速度更为敏感,常规的离线系统已经无法满足业务发展的需求,金融企业应主动变革去提供优质的实时化服务。

目前,金融企业正在逐步推进服务实时化。如:在线业务中,系统能够实时地获取用户的行为,并根据当前的情况推荐最契合用户需求的服务;在风控场景中,系统能够实时地感知用户自身和周边环境的变化,实时地进行交易反欺诈、智能反洗钱、信贷风险监控、信用卡逾期预警等风控措施。

而这背后依赖实时数据服务系统的支撑,该系统主要包含实时的数据采集技术、多源异构数据的接入方法、灵活敏捷的数据处理流程、低代码甚至无代码的开发模式、简捷的数据发布方式,极大地缩短数据流转链路,提高了数据服务速度,为提供实时服务提供有力保障。实时化服务是快速响应客户需求的关键能力,是金融企业需具备的基础能力。

(3) 服务产品化

数据服务发展历程中易出现数据孤岛、难于升级、重复建设、标准混乱的服务应用难题。为了解决以上这些问题,业界目前主流的做法分为两类,一类是构建领域模板应用,另一类是构建基于组件化数据服务的低代码平台,其中前者可以视作后者的初级实现形态。领域模板应用解决的是领域内的数据标准统一、数据服务组件场景化的问题,即通过一个典型数据产品将领域内的数据进行聚合,形成数据标准;结合一定场景,完成适用于该领域公共场景的组件封装和数据服务整合,实现从数据、服务、到产品前端展示的整体化服务,使不具备业务含义的数据服务得到深层次的组合加工,降低数据服务使用门槛,使所服务的用户和产品“拿来即用”。

当领域模板应用建设到一定程度,所服务的其他数据产品越来越多时,将面临着数据服务模式扩展的问题,即“好的数据服务”如何共享的问题,因而基于组件化数据服务的低代码平台应运而生。低代码平台的特 征为微服务、组件化、租户化,通过微服务提供动态缩放的运行环境、通过组件化提供标准化的数据和数据服务、通过租户化便于开发的个性化拓展。以开放的低代码应用建设平台,扩大数据标准的建设,扩大组件的范围,使数据服务的共享不局限于某一个业务领域。

(4) 服务中台化

当前,客户需求呈类型多样、更新频率高、数量大等特点,金融企业面临着无法迅速响应客户快速变化的不确定需求的难题。为了能够低成本、高实效地将企业的核心能力发挥出来,企业需要构建快速低成本的进行业务创新的企业架构,对不同层级的通用能力进行沉淀, 并对外能力开放。服务中台化是实现这一目标的有效途径。

目前,众多互联网化企业都在构建中台,如:业务中台、数据中台,形成服务中台化。其中,业务中台将企业的核心能力以数字化形式沉淀为各种服务中心;数据中台可将海量数据聚合、治理成数据资产,提供机器学习、深度学习等基本组件,形成数据技术一体化的服务平台,可以便捷地复用中台积累的数据和技术,更迅捷地向客户提供高效服务。

数据中台为业务中台提供数据服务,业务中台为客户提供服务并产生新的数据又回流到数据中台,进而更新数据资产,形成“业务数据化、数据业务化”的可持续发展闭环。服务中台化可以实现对企业内部资源高效整合、将业务数据化、数据业务进行有机统一、将企业的核心能力高效输出,是为客户提供优质服务的重要保障。

特点三:技术能力平台化

(1) 平台交付敏捷化

大部分金融企业的数据平台建设到数据中台阶段,如何更快捷的交付数据产品和服务,是金融企业当前亟待解决的问题。下面,从方法论层面和技术层面对平台交付敏捷化建设展开介绍。在方法论层面,拥抱敏捷。一方面,企业推动平台 DevOps 转型,透过自动化“软件交付”和“架构变更”的流程,应用 CI/CD 流水线进行持续集成和持续发布,使得软件的开发、测试、生产和发布流程标准化、自动化,进而实现平台软件的交付敏捷化。

另一方面,在全面开展数据开发运营的同时,通过串联各项数据活动,构建标准化的数据服务流水线,探索 DataOps 的落地实践方法,以此提高数据分析的质量,并缩短数据分析的周期,实现数据服务的交付敏捷化;在技术层面,借助云计算。积极推动在云基础架构上运行大数据系统,如在云原生架构下构建数据中台,以容器化的方式部署大数据的基础组件和大数据应用,借助云计算易于配置和部署、弹性扩展、资源隔离等技术优势,实现大数据与云原生架构的融合。

各技术平台通过微服务+容器技术,推进数据加工和服务能力的整体上云,通过 Severless 等技术实现灵活编排,支撑动态扩展、快速交付和方便运维。

(2) 平台能力开放化

数据业务化是数据中台战略的核心目标,专业团队专门维护数据仓库产品的模式无法满足业务快速的变化与大量长尾需求,这要求数据中台在业务化的过程中保持最大程度的开放。

目前来看,数据中台通过构建能力开放平台将数据、模型、标签通过 API 形式暴露,来解决后端数据向前端业务应用开放的难题。在数据开放层面,数据业务化的过程涉及到数据采集、数据治理、数据聚合、数据服务、运行监控等环节。

数据中台为数据开发各环节开发自动化工具,实现数据能力的抽象、共享、复用。同时,借助多租户架构隔离计算与存储资源、控制数据权限,保障各应用租户独立性、严格数据安全管控。

最终各要素整合为数据集成开发环境,帮助应用租户自助式的创建数据服务API 满足业务化需求;在模型开放层面,模型业务化的过程涉及到模型训练、发布、反馈迭代三个过程,数据中台向应用租户提供了集成化模型训练平台、统一的模型资产管理服务、MLOps 服务、后评价服务,支撑各类人工智能模型发布为 API;在标签开放层面,用户标签是业务强相关数据,数据中台通过轻量化标签开发模式支持业务部门自助式进行用户标签的创建、维护,并通过 API 系统将标签资产开放给其他业务应用系统。

(3) 平台自主可控化

金融业数据应用离不开数字化信息系统的支撑,金融信息系统作为国家关键核心信息基础 设施,其自主可控能力是保障社会经济稳定发展与国家金融安全的关键因素。信创产业从国家战略层面,为金融业数据应用信息系统实现自主可控指明了方向,成为金融业数字化转型的创新引擎,金融机构目前在积极推动信息系统的自主可控化。

平台自主可控化,主要指基础硬件、基础软件、应用软件、信息安全软硬件的自主可控,其中:

  • 基础硬件包括芯片、服务器、存储、交换机、路由器等;
  • 基础软件包括操作系统、数据库及各类中间件;
  • 应用软件包括办公软件、政务应用、流版签软件等;
  • 信息安全软硬件包括各类终端安全及边界安全软硬件产品。

实现金融数据应用全栈国产化替代,重塑金融大数据应用体系,保证金融大数据应用自主、安全、可控,是当前金融业务发展的必然趋势,也是强化金融数据应用能力的必然选择。

数据治理体系

金融业数据治理是指金融机构通过建立组织架构,明确 董事会、监事会、高级管理层及内设部门等职责分工,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。金融机 构应当将数据治理纳入公司治理范畴,建立自上而下、协调 一致的数据治理体系。

1.1. 基本原则

  • 全覆盖原则。数据治理应当覆盖数据的全生命周期,覆 盖业务经营、风险管理和内部控制流程中的全部数据,覆盖 内部数据和外部数据,覆盖监管数据,覆盖所有分支机构和 附属机构。
  • 匹配性原则。数据治理应当与管理模式、业务规模、风 险状况等相适应,并根据情况变化进行调整。
  • 持续性原则。数据治理应当持续开展,建立长效机制。有效性原则。数据治理应当推动数据真实准确客观反映金融机构实际情况,并有效应用于经营管理。
  • 合规性原则。数据治理应当符合国家、行业法律法规和 金融机构自身的内部规章制度中对数据的相关要求。

1.2. 组织架构

有效的组织架构是数据治理成功与否的有力保证,数据治理组织架构包括董事会、监事会、高级管理层、数据治理归口管理部门、各业务部门等在数据治理工作中的定位与分 工。

1.3. 数据管理

数据管理是指通过制定和实施系统化的制度、流程和方法,对数据进行管理,包括但不限于数据规范、数据架构、 数据需求、数据质量、元数据、数据安全、数据变更、数据生命周期、数据档案和资料管理等工作。

1.4. 数据质量控制

数据质量控制是指确立数据质量管理目标,通过建立控 制机制,确保数据的真实性、准确性、连续性、完整性和及时性。

1.5. 数据价值实现

数据价值实现是指围绕风险管理、业务经营、内部控制 等经营管理目标,加强数据应用,实现数据驱动,提高管理精细化程度,发挥数据价值。

2.1 数据治理的组织架构

金融机构应当建立组织架构健全、职责边界清晰的数据治理架构,明确董事会、监事会、高级管理层和相关部门的职责分工,建立多层次、相互衔接的运行机制。

金融机构董事会应当制定数据战略,审批或授权审批与数据治理相关的重大事项,督促高级管理层提升数据治理有效性,对数据治理承担最终责任。

金融机构监事会负责对董事会和高级管理层在数据治理方面的履职尽责情况进行监督评价。

金融机构高级管理层负责建立数据治理体系,确保数据治理资源配置,制定和实施问责和激励机制,建立数据质量控制机制,组织评估数据治理的有效性和执行情况,并定期向董事会报告。

金融机构应当确定并授权归口管理部门牵头负责实施数据治理体系建设,协调落实数据管理运行机制,组织推动数据在经营管理流程中发挥作用,负责监管数据相关工作,设置监管数据相关工作专职岗位。

业务部门应当负责本业务领域的数据治理,管理业务条线数据源,确保准确记录和及时维护,落实数据质量控制机制,执行监管数据相关工作要求,加强数据应用,实现数据价值。

金融机构应当在数据治理归口管理部门设立满足工作需要的专职岗位,在其他相关业务部门设置专职或兼职岗位。

2.2 数据治理的制度建设

制度建设是数据管理和数据应用各项工作有序开展的基础,是数据治理的依据。金融机构应当制定全面科学有效的数据治理制度,及时发布并定期评价和更新。

构建金融机构数据治理制度体系,首先应符合监管要求 和本机构的数据战略,其次应充分结合数据治理组织架构与管理现状,体现、贯彻和落实数据治理顶层设计要求,逐步将数据治理体系纳入本机构的管理实践中。

根据数据治理相关制度的定位、重要程度、管理范围,可分为基本规章、专业管理办法、操作规程。

数据治理基本规章是最高层次的数据治理政策,是指对数据治理活动做出原则性、导向性、纲领性规范要求或提出标准的制度,具有普遍约束性,是其他数据治理类制度的制定依据。

数据治理专业管理办法指对数据治理某一专业领域活动的管理流程、管理方式、职责分工、风险控制等进行规范的制度。

数据治理操作规程指对数据治理某个系统运行、某项处 理流程及管理活动的具体操作进行规范的制度,是对某项数据治理专业管理办法的进一步细化。

2.3 数据治理的发展方向

金融机构要充分认识数据治理工作的难度和挑战,从企业级视角进行顶层设计,从组织架构和数据规范、质量、安全、价值挖掘、共享应用、保障机制等方面提升数据治理能力和数据价值创造能力,通过普及数据文化培养员工数据素养,建立一套强有力的推进机制,夯实数据这一关键生产要素基础,实现数据对数字化转型的赋能。

  • 扎实推动数据治理,保障数字化转型。
  • 制定数据标准规范,持续提升数据质量。
  • 搭建企业级数据复用和智能分析创新平台,促进机构 内外数据融合共享。
  • 构建快捷、易用、多样的数据服务能力。
  • 推动数据资产管理能力建设。
  • 制定数据安全策略,强化数据风险管控。
  • 提升数据思维能力,普及数据文化。

2021 年 12 月,中国人民银行印发《金融科技发展规划(2022-2025 年)》,指出以深化金融数据要素应用为基础,以支撑金融供给侧结构性改革为目标,以加快推进金融机构数字化转型为主线,将数字元素注入金融服务全流程,将数字思维贯穿业务运营全链条,注重金融创新的科技驱动和数据赋能。

为实现数字化转型,金融业采取和落实了一系列措施,主要包括:优化组织架构、打造数据文化与创新基因、强化产学研合作、打造数字化能力等。本次编制的金融业数据应用发展报告即在此背景下展开,一方面介绍近年金融业在数据应用方面的主要工作和成果,另一方面希望通过本报告为金融业后续的数据应用发展提供参考和支撑。

本报告基于大数据、云计算、人工智能技术与金融业务深度融合的金融科技时代背景,从金融业数据要素价值体系、数据能力建设运营、技术现状与安全防护、风险挑战和发展展望等视角出发,结合金融行业先进实践对大数据应用提升金融业务效能、优化资源配置效率、强化风险控制能力、促进金融创新发展等角度进行了阐述。

文末点击文件下载,注册会员后扫码添加老邪企业微信,提供微信名、手机号和用户名绑定,即可入群每周领取高质量纯净资料,还可参与投票、调研获取更多自测题数。

如何利用学习保持领先?从评估数字化技能水平,确定学习路径开始。点击填写个人团队的详细信息,不到万元即可获取10人以内数字团队或多达20项技能组合的数治信创——数小信会员全年服务。

报告全文下载: