智能网联汽车数据分类和流通场景一文概述

智能网联汽车通常具有多源数据实时采集传输能力,数据不仅可以用于车辆状态监测、远程控制升级等新型智能化服务,还可以用于后处理分析及产品功能研发。

智能网联汽车数据分类和流通场景一文概览
出处:信息通信技术与政策

近年来,我国数字技术与经济快速发展,数据要素的重要性日益凸显。2014—2019年,我国政府对大数据的关注度逐步提高并实施了多项大数据发展政策。2019年10月,《中国共产党第十九届中央委员会第四次全体会议公报》将数据明确纳入生产要素,体现了数据在推动经济高质量发展中的价值。

2023年12月,国家数据局会同有关部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,旨在充分发挥数据要素乘数效应,赋能经济社会发展,“数据要素×交通运输”是重点行动方向之一,明确提出要推进数据要素赋能智能网联汽车创新发展,打通不同主体间的数据壁垒,促进道路基础设施数据、交通流量数据、驾驶行为数据等多源数据融合应用。

智能网联汽车通常具有更开放集成的电子电器架构、更强大的多源数据实时采集传输能力,数据不仅可以用于车辆状态监测、远程控制升级等新型智能化服务,还可以用于后处理分析及产品功能研发。此外,路侧网联汽车基础设施采集的交通状态和车辆驾驶数据同样可以面向汽车提供信息服务和研发数据支持。数据要素在智能网联汽车研发生产、运行服务、售后维保、报废回收等全生命周期中发挥着重要的赋能和驱动作用。

1  数据要素流通范式

1.1  数据要素流通模式

数据要素流通模式主要包括数据开放、数据共享、数据交易3类[1]

数据开放是指提供方无偿提供数据,需求方免费获取数据,没有货币媒介参与的数据单向流通形式[1]。政府通常通过数据开放平台来开放脱敏和非密的公共数据。截至2023年8月,我国337个城市(含直辖市、副省级与地级行政区)中,目前已经有60.53%的城市上线了公共数据开放平台[2]。企业开放数据通常服务于政府和科研工作者,例如高德地理信息数据开放平台和百度阿波罗(Apollo)自动驾驶开放平台,向科研工作者无偿提供高质量数据,促进新技术新业态创新研发。

数据共享是指互为供需双方、相互提供数据,没有货币媒介参与的数据双向流通形式[1]。企业之间的数据共享可以充分发挥数据的价值,提高资源利用效率,例如汽车制造商与零部件供应商之间共享供应链数据,高效匹配双方的需求和能力。

数据交易是指提供方有偿提供数据,需求方支付获取费用,主要以货币作为交换媒介的数据单向流通形式[1]。数据交易模式正从传统的点对点模式逐步发展为交易机构撮合模式,以解决交易效率低、缺乏监管等问题。目前,我国各地方政府正大力推进大数据交易所的建设。例如,北京国际大数据交易所的交易联盟涵盖了国有企业、金融机构、互联网企业、科研院所等单位,基于其IDeX数据交易平台提供多种数据类型的交易服务。以亚马逊云为代表的科技公司构建的数据交易平台[3]则是基于其强大的数据获取和处理能力以应用程序编程接口(Application Programming Interface,API)、数据集等形式进行数据交易。

1.2  数据要素流通关键技术

在数据流通过程中,需要综合应用数据安全技术、隐私计算技术、计算处理技术、存证溯源技术[4]等,以实现主权保护、安全保护、隐私保护。

数据安全技术主要用以保障数据提供者和数据使用者的权益以及系统的安全,包括身份认证、数字签名、数据脱敏等安全技术。其中,身份认证管理系统从独立身份认证管理和联邦身份认证管理发展到了基于区块链技术的身份管理系统[5],在提高数据透明性和安全性的同时也提高了身份认证效率[6];数字签名技术已经从1978年的RSA数字签名发展到当今面向区块链的多重签名、环签名[7],提高了信息传输的完整性和安全性;数据脱敏技术则首先需要对敏感数据进行识别,进而对数据进行分类分级并打标签,随后通过无效化、随机值、数据替换、对称加密等静态或者动态脱敏的方式对数据进行脱敏处理[8]。此外,还有文件加密技术[9]以及相应的数据安全传输协议等数据安全技术。

隐私计算技术可以加强对流通数据的保护、降低数据泄露的风险及危害。隐私计算技术一般分为算法层和环境层技术[10]。在算法层上,以同态加密为首的现代密码学方式常被用于保障数据的安全性和实现安全多方计算的隐私保护功能[11],但该方法还存在缺乏统一模型性能评价标准、缺乏全流程隐私保护等问题[12];联邦学习技术通过人工智能进行建模以达到加密的目的,可被用于在政企之间建立完整的信用体系以推进智慧城市的数据交换[13]。环境层则通常采用基于可信硬件的隐私计算技术,即通过软硬件结合的方法在中央处理器(Central Processing Unit,CPU)中构建出一个安全区,保证在其内部加载的程序和数据的安全性,与算法层的各技术和协议互相支撑,进一步保障数据提供者和使用者的隐私[14-15]

计算处理技术主要包括数据预处理技术、数据存储与管理技术、数据分析与挖掘技术等。数据预处理技术包括通过数据清洗来处理缺失值和不一致性等问题、通过数据整合来集成多个数据库或文件、通过数据转换来进行归一化和标准化处理、通过数据减少来提取特征化数据。数据存储与管理技术不断向满足结构化、半结构化和非结构化数据的存储和处理需求[16]发展,云存储和数据湖在促进数据处理技术性能提升的同时也降低了数据的存储成本。数据分析与挖掘技术分为批处理、实时处理、混合计算3类,Casado和Younas认为在机器学习的赋能下以Lambda架构为基础的混合计算方法将进一步赋能数据的流通[17]

存证溯源技术可以为数据的流通过程提供可追溯和可监管的保障,解决数据主权和权责认定的问题。电子数据存证技术由传统的可信时间戳等技术发展到了基于区块链的数据存证技术[18],依托区块链去中心化和不可篡改的特性有效地保证了数据的真实性和完整性。同样,传统的数据溯源技术基于标识法[19]和逆查询法[20]进行多种溯源模型的构建[21]。随着技术的不断发展,基于区块链的数据溯源模型增强了溯源结果的可信性[22]

2  智能网联汽车数据分类

智能网联汽车相关数据可以按照数据来源分为3类,分别是用户数据、车辆自有数据以及外部来源数据。表1基于《智能网联汽车数据分类分级实践指南》,在对数据的流通价值进行初步筛选后总结了智能网联汽车的数据分类和来源,并给出了其潜在流通价值、流通场景及对应的流通模式。

表1   智能网联汽车数据分类及潜在流通场景

640-13

图1    ETSI定义的面向车联网的MEC架构

基于以上分类,下文将进一步分析智能网联汽车的数据流通价值场景。

3  智能网联汽车数据流通场景

3.1  汽车生产供应链数据流通

智能网联汽车的生产环节中存在多种数据流通场景,包括为解决车辆及零部件生产研发需求的数据流通、为实现供应链追溯目标的数据流通和为满足碳足迹追溯与碳排放监管的数据流通。

基于以上3类数据流通场景,汽车生产供应链数据流通模式如图1所示。当汽车制造商和零部件供应商同时以数据提供者和数据使用者的身份进行数据流通时,汽车制造商可以获取供应商的零部件产品性能规格、库存等数据,零部件供应商能得到汽车制造商的需求和排产计划等数据。

汽车制造商、零部件供应商、汽车行业监管部门和金融机构可以利用供应链数据高效实现供应链追溯的目标,进而进行零部件故障溯源、产品质量评估等分析。碳排放监管部门在该数据流通场景中,依据供应链数据为数据使用者进行碳排放计算、合规性评估等相关分析。数据可以点对点的方式进行流通,也可基于数据流通平台进行共享。

640-37

图1   汽车生产供应链数据流通模式

目前,汽车生产供应链的数据流通模式正从点对点的模式朝着基于平台的模式发展。宝马公司在德国发起的Catena-X联盟于2020年成立,得到了欧盟和德国联邦经济事务和气候行动部的资助,建立了汽车领域数据空间并发布了相关标准。Catena-X公司在2023年底已经可以为超过170个成员组织提供包括供应链管理、数字孪生、需求和产能管理在内的10项服务,为成员组织之间的数据交易和数据共享提供了很大的便利[23]

此外,还有以“奔驰+微软”“现代+亚马逊云”为例的大型汽车制造商和互联网头部企业合作建立的供应链管理平台。我国工业和信息化部装备工业发展中心也于2022年建立了汽车产业链供应链畅通协调平台,支持汽车制造商以填报需求的模式来提出诉求以解决供应链中存在的问题,一定程度上解决了复工复产时供应链信息流通不畅的问题。

目前国内汽车生产供应链数据流通场景,仍以企业根据自身需求主导的点对点流通模式为主,基于行业平台开展数据流通的验证仍处于初期发展阶段。在汽车生产供应链数字化转型、行业碳足迹追溯监管等新发展要求下,依托行业性平台或数据空间基础设施进行汽车生产研发环节数据流通有望成为未来发展趋势。

3.2  道路交通信息数据流通

道路交通信息能够有效支撑车辆智能驾驶功能的实现。车辆对及时准确的道路交通信号灯数据、道路管控数据、道路交通流量数据、道路交通事故数据等存在流通需求,可以为车辆驾驶员提供驾驶辅助服务,甚至可与车辆自身感知信息融合以支撑智能驾驶功能的实现。此外,导航软件等服务商也对道路信控设施状态等道路交通数据存在流通需求。

基于以上数据流通场景,道路交通信息流通模式如图2所示。当数据在地图及导航服务商与交通部门之间流通时,通常以数据共享的模式进行信号灯配时、道路拥堵状况数据的交换,用来支持导航软件中交通信号灯倒计时等功能的实现,交通部门则能依据路况数据更好地掌握道路状况。

当数据以共享的模式在车端用户与地图及导航服务商之间流通时,车端用户将车辆行驶速度、定位等信息提供给地图及导航服务商并接收其反馈的道路交通信息。当数据在车端用户与交通部门之间流通时,交通部门通常以数据开放的形式将道路拥堵指数、出行预测等信息发布在数据开放平台上供用户使用。

640-38

图2   道路交通信息流通模式

当前道路交通信息流通仍然存在由于道路交通数据管理部门、各地交通信息服务运营商、地图及导航服务商、车端用户平台数据接口不统一导致的数据共享流通难等问题。伴随数据要素有关政策的推进,以及全国车联网新型基础设施建设的普及,交通部门、车辆、地图及导航服务商等主体间全面高效的数据流通有望加快实现。

3.3  自动驾驶算法训练数据流通

车企和自动驾驶方案供应商在自动驾驶系统研发过程中需要海量数据进行算法训练。在数据资源积累不足时,企业存在车端采集自动驾驶训练数据流通需求。此外,部分地区网联汽车路侧设施采集的海量感知数据可以经处理后服务于车端自动驾驶算法研发,存在路侧设施企业向研发企业流通数据的场景。

基于以上两类数据流通场景,自动驾驶算法训练数据流通模式如图3所示。车端感知数据在各车企及自动驾驶企业之间流通时,潜在的流通模式为数据交易或共享,可以帮助需求方补齐训练数据短板,加快自动驾驶训练算法的成熟。在网联汽车路侧运营企业与车企及自动驾驶企业之间数据流通时,流通模式主要以数据交易形式存在,由路侧运营企业将原始数据或处理后的数据提供给汽车制造商及自动驾驶企业等数据使用者,帮助需求方丰富自动驾驶训练场景库和数据集。对于图商来说,则是以数据共享或交易的模式与汽车制造商及自动驾驶企业进行数据流通。

640-39

图3   自动驾驶算法训练数据流通模式

目前,在企业间流通车端采集训练数据时,存在各汽车制造商由于传感器布置位置不同、图像分辨率不同导致的数据可用性问题,以及数据安全、品牌竞争等问题,车端采集自动驾驶算法训练数据的企业间流通活动较少。在路侧设施采集数据向车端算法研发企业流通场景下,仍然面临视场角转换复杂、价值场景自动筛选效率低、数据连续覆盖度不足等数据处理技术难题,成熟案例仍较少。随着数据流通需求的增加和有关数据处理技术的完善,车端和路侧采集的自动驾驶训练数据有望形成成熟的流通模式。

本文节选自洪启安, 于润东, 于胜波, 等. 智能网联汽车数据要素流通综述[J]. 信息通信技术与政策, 2024, 50(3): 27-34.

相关内容推荐和下载:

数治长文:智能网联汽车数据分类分级与全生命周期保护
以合规为主要导向,明确智能网联汽车数据分类分级的方法论,及对应不同等级的数据,在其不同生命周期,给出通用的安全措施,为实现数据安全治理落实。

在此声明以上观点和内容,仅代表原作者和出处,与数治网DTZed 无关,如有出错或侵害到相关合法权益,请通过电邮与我们联系:cs@dtzed.com。

在文末扫码关注官方微信公众号“idtzed”,回复“入”直通相关数治x行业共建群,@老邪 每周免费领取法规、标准、图谱等工具包。

欢迎先注册登录后即可下载检索智能网联汽车等相关标准、白皮书及报告。更多高质量纯净资料下载,进入公众号菜单“治库”。