全国数据资源调查给出的五大发现和典型做法(附下载)

我国数据资源“产-存-算”规模优势基本形成,数据“供给-流通-应用”主体逐渐丰富,海量数据和丰富场景优势潜力亟需释放,数据资源管理和利用整体处于起步阶段。

全国数据资源调查给出的五大发现和典型做法(附下载)
出处:全国数据资源调查报告(2023年)

随着《关于构建数据基础制度更好发挥数据要素作用的意见》的发布和国家数据局组建,《“数据要素×”三年行动计划(2024-2026年)》等10余项政策文件陆续印发,我国数据要素化进入新阶段。数据感知采集出现新技术、数据基础设施产生标准化新需求、数据交易机构打开新局面、公共数据启动授权运营、数据开发利用涌现新模式、数据服务商形成新业态、数字化转型大规模铺开,数据生产存储、流通交易、开发利用的各个环节产生新变化,亟需构建一套新的调查方法和指标体系,来全面摸底我国数据资源发展情况。

2024年2月,国家数据局联合中央网信办、工业和信息化部、公安部组织开展全国数据资源调查,国家工业信息安全发展研究中心承担调查实施工作。在前期工作基础上,此次调查扩大调查范围、扩展调查对象、增设调查指标,通过全量测算和抽样调查等方式,调查全国关键数据资源情况,为政府施策、产业发展提供参考。

调查发现,我国数据资源“产-存-算”规模优势基本形成,数据“供给-流通-应用”主体逐渐丰富,海量数据和丰富场景优势潜力亟需释放,数据资源管理和利用整体处于起步阶段。我国数据产量、存量、算力规模大,数据流通、交易变化快,公共数据开放共享授权运营加快探索,企业数据多场景落地,为构建数据要素市场提供了坚实基础。

1. 数据生产:规模大,范围广,增长快

我国数据生产规模持续扩大。2023年数据生产总量达到32.85泽字节(ZB),同比增长22.44%,非结构数据爆发式增长。随着5G、AI技术的快速发展及智能设备的规模应用,内容创作、影像视听等非结构数据对我国数据总规模增长贡献较大,消费民生领域新业态不断涌现,满足了人们不断增长的文化娱乐消费需求。

智慧城市扩大物联感知范围。公共数据获取范围不断扩大,设施物联传感数据占比超40%。城市各种基础设施、资源、服务等加速数字化、网络化、智能化升级,摄像头、传感器、无线设备等相互连接形成城市的“神经脉络”,实时捕捉城市交通、人流等各种信息,推动海量数据从大街小巷汇入城市大脑。

智能应用推动数据产量提速。随着技术的创新突破以及硬件的迭代更新,生产生活的数字化应用逐渐增加,推动我国数据产量快速增长。在生活方面,智能网联车驱动车、路、网、云数据快速交换,出行数据同比增幅达到49%。在生产方面,老旧生产设备的升级改造以及智能边缘设备、工业机器人、数控机床等智能设备的推广应用,推动生产制造数据同比增幅达到20%。

2. 数据存储:空间合理,产存转化待提升

存储总空间基本满足存储需求。2023年我国累计数据存储总量为1.73泽字节(ZB),存储空间利用率为59%。其中政府和行业重点企业存储空间利用率均为70%左右。数据服务商对存储空间提前布局,存储空间利用率为35.29%。随着企业算力的不断提升,对数据存储除性能要求外,更需高扩展性来为海量数据“矿产”的挖掘做准备。

数据终端存储高于云存储。数据云存储占比11约超过40%,其中,行业重点企业云存储占比12为23.49%。云存储高灵活性和高便捷性优势有效支撑了业务协同带来的数据交互需求。行业重点企业数据终端存储占比超七成,海量数据被分散存储,数据互联、复用难度较大,但边缘智能化一定程度上能促进数据从存向用转化。

数据产存转化率较低。2023年新增数据存储量为0.95泽字节(ZB),与年数据生产总量相比,占比为2.9%,数据价值潜力有待进一步挖掘。一方面海量数据复用价值较低,大部分过程类数据产生后即被丢弃、覆盖。另一方面大模型、训练工具等支撑能力不足,海量数据开发利用价值低于存储成本,部分高价值数据在“大浪淘沙”过程中被遗弃。

3. 数据流通:方式多元,交互提升,供需不均衡

消费领域数据交互活跃度较高。2023年,四大运营商数据显示全国数据总流量较去年同期增长7.6%,数据流量保持稳步增长。随着汽车、家居、穿戴等智能终端品类不断丰富和声像视听数据交互需求持续增加,移动互联网数据流通活跃度不断增加。

平台和央企数据流通量远超其他企业。中央企业和平台企业成为行业领域的数据枢纽,在各自领域探索交互机制。平台企业是行业领域的数据枢纽。本次调查中,平台企业平均数据交互量14为行业重点企业的249倍,各行业数据正逐渐向平台聚拢。SaaS服务模式日益成熟,平台提供数据产品中SaaS化产品占比超五成,订阅式交易占比逐年增多。中央企业成为产业链数据枢纽。本次调查中,中央企业平均数据交互量为行业重点企业的42倍。链主企业正在通过产业链协同赋能上下游企业,汇聚全产业链数据。

交易机构加快建设,场内交易吸引力不足。全国各地交易所快速铺开,19个省市建立数据交易机构。上海、浙江、深圳、海南等地数据交易机构“百花齐放”,交易模式、数商生态、技术底座各具特色。交易机构在标准、规则方面尚未达成共识,场内交易吸引力不足。

数据交易机构供给水平难以满足旺盛的数据需求。数据需求快速增长,制造业、信息服务、批发零售等行业数据需求量较大。与此同时,交易机构数据产品成交率不高。27家交易所上架数据产品中仅有17.9%实现交易,数据场内交易活跃度较低。例如,消费民生领域数据产品购买方数量是供给方的2.4倍,但产品成交率不足一成,存在供需不匹配的现象。

4. 公共数据:开放共享初见成效,授权运营起步探索

公共数据体系完善,数据汇聚能力不断提升。截至2023年12月底,全国一体化政务数据枢纽接入53个国家部门、31个省/自治区/直辖市和新疆生产建设兵团数据,挂接资源达2.06万个,实现累计调用5361.35亿次服务。

公共数据开放共享提升政务服务水平。国家行业主管部门、地方省级政府开放数据量比上年增长16%、18.5%。高频政务服务事项实现“一网通办”“跨省通办”,逐步向标准化服务发展,电子证照、身份识别等已实现数据全国协同。公共数据共享满足率仅在少数应用场景得到满足,但大多数需求场景暂不明确的领域,与应用解耦的基础类数据,还需进一步提升数据共享效率。

公共数据授权运营机制正初步探索。人力资源和社会保障部、文化和旅游部、国家市场监督管理总局、国家卫生健康委等国家部委开展了公共数据授权运营。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索公共数据授权运营机制。公共数据应用场景主要为公共服务和社会管理。

公共数据与企业数据加深融合应用。公共数据在数据开发利用、流通交易中占比较大。平台企业、数据分析企业对公共数据需求高涨。本次调查中,有18.6% 的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。工商、气象、交通、地理等公共数据广泛应用于数据开发利用中,成为释放数据价值的催化剂。

5、数据应用:提质增效,外溢效应仍不足

数字化转型沉淀海量数据,数据应用场景加速落地。随着数字化转型深入推进,企业获取数据的能力显著提升。企业积极开展数据应用,海量数据加速融入生产运营各类场景。本次调查中,96%的行业重点企业已实现数据场景化应用,其中超8成行业重点企业已经运用数据辅助运营管理优化,半数企业在生产环节实现数据驱动。

数据管理和复用水平较低,多主体数据协同难度大。企业普遍重数据设施和项目建设、轻数据资源管理,本次调查中,21.9%的大企业尚未建设数据管理系 统,大多数中小企业数字化转型产生的数据未实现复用。数据多场景、多主体协同难度大。本次调查中,开展产业链协同应用的企业占比不足20%,通过产业链数据实现风险预测的应用占比约为10%。

企业数字化投入较高,数据价值外溢效应尚不明显。我国企业数字化投入积极性较高。本次调查中,2023年有数字化投入的行业重点企业占比超8成。企业对数据价值认识和判断不足,数据增值的投入和能力有限,开展数字化转型的大型行业重点企业中,仅有8.3%实现了数据复用增值,数据价值有待进一步释放。

6. 典型做法举例

6.1 以产业思维推动数据流通交易高质量发展

以湖南大数据交易所为载体,以产业场景数据为抓手,加强数据安全保障,充分释放数据要素价值,探索出一条以产业思维推动数据流通交易的创新路子。

以产业思维,建好湖南数交所,形成“产业园区赋能、行业龙头带动、市州共建共赢” 的湖南方案。一方面以园区为土壤赋能数据交易场所运营发展。另一方面以行业头部企业带动“数据四要素”集聚。上线数据交易母平台1.0版,在交易牌照基础上,完成省市两级数据登记资质。截至目前,数交所发展数商会员单位433家,上架数据产品3859个,交易额突破12亿元。

以产业场景应用为导向,加快重点行业数据有序流通交易,有效释放数据要素价值。对典型应用场景进行需求开发,促进形成新的区域产业增长极。

在数据要素x“文化+科技”领域,马栏山承接了全网80%头部综艺节目及全国30%的3D动画制作,其建设的“云、网、算”统一服务平台,将超高清视频处理速度提升100倍, 推动影视内容制作全链条产品升级换代,助力湖南以“内容数据”为核心的音视频产业成为世界一流,并产生多项领先技术标准。

在数据要素x工业制造领域,建立数据可信流通体系,促进数据在龙头企业和上下游企业间安全流通,实现以数据提升整个产业链的生产效率。中科云谷打造的端对端数字化协同平台,有效支撑企业研发周期缩短30天,生产效率提升20%,供应商交付准时率提升10%,设备使用效率提升10%,运营成本降低10%。

在数据要素x现代农业领域,通过搭建农业产业数字化服务平台,实时采集超4500万用户、4250多种农产品类目,对累计52+亿条源数据的交易数据进行分析挖掘,打造以电商数据为主的“惠农大数据”,为政府、高校、企业等上千家单位提供数据产品或数据服务, 带动农产品交易540多亿元。

6.2 金保信公共数据授权运营案例

基金保信社保卡科技有限公司负责全国社保卡服务平台的建设、运维、运营和提供用户服务,目前在优化公共服务和推动创新发展方面取得了一定成效。

在优化公共服务方面,一是建设和运营全国社保卡服务平台,形成以电子社保卡为依托的社保卡线上可信身份认证体系、支付服务体系和数据融合服务体系。截至2024年一季度末,电子社保卡已上线百项全国服务、千余项属地服务,全国累计9.86亿人领用电子社保卡,累计服务近500亿次,实现“数据多跑路,群众少跑腿”。

二是打造全国性一站式求职招聘平台“就业在线”,建立全国求职招聘的总枢纽、总门户。通过“智能推荐”算法模型,实现“千人千面”的人岗匹配;通过“简历核验”和“企业验真”,打造真实、可靠的求职招聘环境;通过“直播带岗”和“视频面试”,实现高效的屏对屏实时沟通效果;通过“劳务对接” 和“就业见习”系统,实现重点就业人群在全国范围的协调流动。

在推动社会创新方面。一是面向普惠金融、保险、人力资源服务机构,以数据模型、核验评分等方式提供50余项数据服务产品,包括身份认证、模型评分、个人参保信息核验、单位信息查验、个人养老待遇测算服务等,已接入银行、消费金融、商业保险及头部互联网公司等多家机构,助力机构防范业务风险,实现数据赋能。

二是进一步整合电子社保卡、就业在线等服务能力,研发金保信“HR在线”,面向中小微企业提供招聘、履历核验、考勤、薪酬绩效、电子劳动合同等一体化SaaS平台服务,已有千余家中小微企业注册使用,帮助企业降本增效,提升运营效率,推进数字化转型。

全国数据资源调查工作验证了我国发展数字经济具备超大规模市场、海量数据资源和丰富应用场景优势。未来,随着数据技术不断进步,基础制度持续完善,数据生产规模将保持高速增长,存储计算将向按需调度发展,数据流通将向规范有序、多元协同发展,数据开发利用将向需求牵引、智能驱动发展。

本文摘编自全国数据资源调查工作组(国家工业信息安全发展研究中心)发布的《全国数据资源调查报告(2023年)》,全文下载:

在此声明以上观点和内容,仅代表原作者和出处,与数治网DTZed 无关,如有出错或侵害到相关合法权益,请通过电邮与我们联系:cs@dtzed.com。

在文末扫码关注官方微信公众号“idtzed”,回复“入”直通相关数治x行业共建群、AIGC+X成长营,@老邪 每周免费领取法规、标准、图谱等工具包。

欢迎先注册登录后即可下载检索公共数据等相关标准、白皮书及报告。更多高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”。