随着金融监管要求的日益严格和业务复杂性的增加,传统的数据治理模式已难以满足高效、精准的管理需求。实现数据治理智能化管理,成为银行金融机构兼顾提升数据质量、保障数据安全、实现数据价值最大化的必由之路。
通过强化源头数据治理、构建全方位的数据安全体系,运用人工智能、大数据等智能技术,多措并举,商业银行才能够在满足监管合规要求的同时,提升数据治理效率,为业务创新和风险管理提供坚实的保障和支撑,为促进金融高质量发展注入新动力。
01 重视数据安全防护
国家陆续出台了数据安全法、个人信息保护法、网络数据安全管理条例等法律法规,国家金融监督管理局也发布了《银行保险机构数据安全管理办法》(金规〔2024〕24 号),随着国家数据安全领域的法律法规逐步完善与监管要求逐步趋严,银行持续升级数据安全防护体系,提高数据安全保护意识和水平,增强防范化解风险的能力。
图 1 《银行保险机构数据安全管理办法》
商业银行应建立数据安全管理框架,包括建立健全数据安全治理体系,构建数据安全管理体系,提升数据安全技术能力,开展数据安全风险监测,加强风险预警以及应急处置,保障数据开发利用活动安全稳健开展。
一是数据安全治理方面,构建完善的数据安全管理组织架构,明确党委、董事会、高级管理层和执行层职责、职权,形成从上至下的数据安全责任制。明确数据安全体系建设规划,定期向党委、董事会汇报。加强数据安全考核,推动数据安全管理要求落地。
二是数据分类分级方面,数据分类分级是数据安全管理的基础,整体以信息系统为维度梳理数据资产,根据监管相关分级标准,通过自动化工具进行初步打标,并组织数据所有者、安全专家等构成的审核团队,对分类分级结果审核,确保准确性和合理性,形成数据分级打标结果,明确系统前后端字段、库表的敏感等级。
同时,对敏感级及以上数据实施差异化管控。例如:针对核心数据,采用多重加密、严格访问权限控制等最高级别的安全防护;重要数据存于高可靠存储介质,进行重点监控,并且访问需审批;敏感数据需进行加密传输与存储,限制访问范围,确保数据全生命周期安全。
三是数据安全管理方面,根据《银行保险机构数据安全管理办法》要求,从策略、制度、细则等层面构建数据安全制度体系,明确数据生命周期安全管理要求,持续夯实优化制度体系建设。压降重点领域风险,建立数据出行出境管控专项机制,联合业务、风险、合规开展数据安全评估,防范数据泄露等安全隐患。建立常态化数据安全检查、培训机制,加强数据安全意识,推进数据安全要求落 实。
图 2 数据安全制度体系
四是数据安全技术与风险监测方面,建立多层次数据安全保障体系,在终端、应用、系统、网络等各个层面部署针对性的安全管控措施及工具,从数据全生命周期角度明确数据安全技术控制要求,将数据安全保护要求纳入信息系统开发生命周期框架,实现数据安全保护措施与信息系统的同步规划、同步建设、同步使用,保障信息系统开发生命周期过程中的数据安全。
建设一体化的数据安全管理平台,将数据分类分级、数据流转可视可控、数据安全风险监测、事件处置、评估审查等内容统一纳入平台进行管理,实现精细化管理并助力管理决策达成高效管理。
02 强化源头数据治理
由于早期缺乏统一的数据标准和数据质量管控,各家银行积累了大量的历史数据质量问题。在治理过程中,普遍存在历史数据清理难度大、成本高的问题。为降低数据治理成本,避免新增数据质量问题的重复发生,各家银行高度重视源头数据治理。
近年来,各类监管文件中明确提出源头数据治理重要性及工作要求。2022年,原中国银保监会发布的《关于银行业保险业数字化转型指导意见》要求“加强数据源头管理,形成以数据认责为基础的数据质量管控机制”。
2024年,中国人民银行发布的《关于金融源头数据质量核查的指导意见》要求“建立源头数据质量责任机制,规范源头数据管理,把好金融统计源头数据质量关”,以及《关于深入学习贯彻落实<中华人民共和国统计法>的通知》要求“扎实开展金融统计源头数据质量核查,落实源头数据质量主体责任,确保金融统计数据质量基础”。
在数据治理领域,商业银行基于已建立的数据治理体系,进一步聚焦明确数据责任主体、加大数据标准执行范围、部署全链路数据质量监控等工作,有助于进一步强化对源头数据质量管控。
1.明确数据责任主体
根据《银行业金融机构数据治理指引》“业务部门应当负责本业务领域的数据治理,管理业务条线数据源”基本要求。为确保数据治理的规范性、高效化,商业银行普遍按照“谁的业务谁负责,谁的系统谁管理”为基本原则进行认责,建立清晰的责任体系。
业务部门作为数据生产者,负责管理本业务领域数据源,明确相关业务制度及数据规范,将数据质量管理嵌入业务流程中;科技部门作为技术支持者,在信息系统建设中落实数据治理要求,保障数据在存储、传输与处理的数据质量。通过明确主体责任,杜绝责任不清导致的数据管理漏洞。
2.执行企业级数据标准
在信息系统建设生命周期中落实数据标准是确保数据一致性、准确性和完整性的关键举措。在需求阶段,信息系统需求明确贯标范围,提出数据标准化和数据质量需求;在设计阶段,科技部门依据企业级数据标准设计数据库表;在开发、测试、投产阶段,科技部门参照企业级数据标准落实字段的数据类型、长度、代码等要求。
针对新增系统或存量信息系统重大改造,结合智能化的贯标工具和人工复核,通过数据标准检查后,才允许系统投产上线。同时,各银行结合企业级数据字典建设,逐步实现覆盖范围更全面的数据标准体系。
3.加强数据质量监控
各商业银行逐步构建企业级数据质量监控体系,运用技术手段实现数据质量动态监测,及时发现和处理数据质量问题,为高质量数据保驾护航。监控范围方面,应覆盖数据全生命周期,借助数据血缘,应从监管报送数据进行溯源,加强对数据平台、核心业务系统、主数据系统、源头数据产生系统等全链路的数据质量监控。
监控内容方面,充分考虑监管报送、内控合规、业务经营等需求,从完整性、规范性、有效性、准确性、唯一性、一致性、及时性等维度,全面制定和部署数据质量监控规则。结果展示方面,可以结合数字大屏和报表,实时动态展示数据质量监测统计结果。借助数据质量监控机制,持续对数据质量进行监测、分析、反馈和纠正,全面提升数据质量管理水平。
03 加强智能技术运用
商业银行基本已构建独立的数据治理平台,包含数据质量监控、数据资源目录等功能,用于支撑数据治理和数据安全管理活动。近年来,积极运用人工智能、知识图谱、大数据分析等技术,应用于数据治理各领域,提升自动化、智能化和精细化水平,数据治理的效率显著提高。
图 3 智能技术在数据治理领域的应用
1.数据安全场景
- 数据分级打标:基于大模型的语义分析和意图理解能力,对数据的内容、用途和重要性进行深度分析,精准识别数据的类型和级别,实现高准确率的数据分类分级,满足合规与安全管理需求。
- 异常行为监测:通过对历史数据和正常行为模式的学习,大模型能够实时监测数据访问、使用和传输中的异常行为(如异常流量、不合规访问请求、异常数据修改等),并及时发出预警。
- 恶意攻击识别:利用深度学习技术,大模型能够从海量数据中自动学习并识别恶意攻击的特征与模式(如网络攻击、数据泄露、恶意软件入侵等),提前预警并防范潜在攻击,提升数据安全防护能力。
- 个人隐私保护:大模型结合差分隐私技术,在数据分析和处理过程中,通过添加适当的噪声来保护数据的隐私性,同时又保证数据的可用性和分析结果的准确性。
- 数据脱敏处理:基于大模型的智能分析能力,根据数据的敏感程度和业务需求,自动选择最优脱敏策略(如替换、屏蔽、加密等),对姓名、身份证号、银行卡号等敏感信息进行实时脱敏处理,确保数据使用和共享过程中的安全性。
- 策略制定与调整:通过大模型的语义理解和关联分析能力,根据业务需求、数据特点和安全风险,自动制定和动态优化数据安全策略(如访问控制、数据加密、备份恢复等)。
2.数据质量场景
- 异常数据清洗:通过自然语言处理、机器学习等大模型技术,识别地址等不规范的异常数据,并进行标准化清洗。
- 数据标准检查:通过自然语言处理与规则引擎技术结合,自动完成数据标准与数据库字段的映射,提高数据标准贯标准确性。
- 数据字典编制:建立 AI 驱动的同义词库,自动识别“存款余额”“账户结余”等语意相近词汇,实现数据项去重合并,自动生成业务定义,提高企业级数据字典编制效率。
- 数据质量报告:基于 DeepSeek 等大模型技术,对数据监测结果进行分析,自动生成数据质量评估报告。
3.数据资产场景
- 数据资产盘点:通过自然语言处理技术、图像识别等技术,提取非结构化数据中关键实体(如客户 ID、交易类型),与结构化数据关联,形成全行级数据资产目录。
- 元数据血缘:通过知识图谱技术,实现字段、系统、业务三个层级的深度关联与穿透,构建元数据血缘关系,并支持血缘关系的可视化展示,提升元数据管理的透明度和可追溯性。
- 数据价值评估:结合模糊综合评价法与层次分析法,利用大模型技术构建基于成本法和收益法的数据资产价值评估模型,通过多维度优化评估过程,确保评估结果的科学性与可执行性。
- 数据资产问答:基于 DeepSeek 等大模型技术,支持快速查询数据含义,数据质量规则,数据管理相关制度,解答在数据分析等过程中“找数难”的问题,提高数据使用的效率。
04 实践案例
浦发银行以企业级数据标准为依据,数据质量监控为抓手,数据质量考核为导向,落实“事前预防、事中控制、事后整改”的全链路数据质量管控机制,持续提升数据资产质量。
- 事前预防
浦发银行制定并发布企业级数据标准,为保障数据标准执行到位,将数据标准嵌入需求、开发、投产各环节中。同时,开展“三层”检查,包括信息系统开发团队自查、信息系统开发部门专设数据质量控制团队审核、数据治理归口部门进行抽查,把好源头治理第一关。
- 事中控制
浦发银行从监管报送系统溯源至源头系统,实现源头信息系统、数据平台、监管报送系统全链路的数据质量监控。为实现数据质量监控的“统一部署,规范实施”,制定发布《数据质量监控技术规范》。
截至2024年底,已累计部署3万余条监控规则,如监控发现数据质量问题,将自动发送邮件至业务和技术人员,并通过数据质量监控大屏动态展示监控情况。
- 事后整改
近几年,浦发银行陆续开展存量信息系统数据贯标整改、数据一致性、乱码数据清理等源头专项数据治理工作,持续提升基础数据质量。定期开展《数据质量典型问题》的案例分享和主题培训,加强数据质量防控意识和解决能力。
每月开展信息系统数据质量和贯标检查,对全行性重要问题进行督办和通报,并发布《数据治理工作月报》、《信息系统数据标准及质量检查报告》等,确保各项问题整改到位。
免费领取你的数智第一课
数治网院iDigi此前已推出《银行保险机构数据安全实务入门不迷茫 我们公开课上见!》,通过建立覆盖全员的数据安全组织架构、建立数据分类分级制度、梳理数据全生命周期安全要求等措施,金融机构可以确保数据安全与业务发展的双向促进,如《超实用!银行保险机构数据安全合规要点和问题一文解析》提到。
同时在《当人人3分钟手搓可视化网页 你需要数据+AI 素养的进化》一文中推出《数据 + AI 素养双效提升》体系课程:《利用 AI 优化业务流程综合指南》、《AI 工具职场应用与效能提升指南》、《职场 AI 进化:从工具人到 AI 指挥官》等,深入解读《AI 商业进化论》的核心思想,结合 AI 技术的应用趋势、数据驱动的决策方法、全场景的实现路径以及职场 AI 进化的策略等。
- 通过学习《利用 AI 优化业务流程综合指南》这门课程,你将系统掌握 AI 在业务流程中的应用,全面了解 AI 如何优化每个环节,解决实际业务痛点,推动智能化转型。
- 《AI 工具职场应用与效能提升指南》聚焦 AI 工具在企业中的全场景深度应用,从运营管理到人力资源,你将全面了解 AI 工具如何提升企业效能,推动企业从经验向数据驱动的决策模式转变。
- 而《职场 AI 进化:从工具人到 AI 指挥官》这门课程,以数据思维与 AI 素养为核心,培养人机协作时代的 AI 指挥官能力。通过多维度教学组合,从方法到实践全面掌握AI驱动业务增长的关键路径。
升级你的职业“防护盾”,扫码申请素养测评,即可15分钟AI适配搭建微学习、微专业,开启“一人一表”“一人一课”。即日起只需¥199开卡体验单课时即赠《AI 商业进化论》一本,激活完成自主学习、预约导师开讲、Q小治答疑、实操练习、分享心得等任务,参与评选“学习显眼包”赢数治Pro学习卡、盲盒!
来源:本文摘编自《商业银行数据经营管理实践报告》,浦发银行。图片:Obi Pixel8propix,Unsplash