为紧跟“数据要素×”行动步伐,先前已从数治入门到 300+ 前沿资料盘点梳理,希冀我们2024 在数据要素x路上一起淬炼成金。作为重点行动中的汽车产业,核心竞争力正经历从“改变能源供给模式”向“改变车辆驾驶主导权”演进,智能网联促使汽车产品升级为新型智能终端,推进汽车、信息通信、交通运输跨产业链融合变革以及数字经济新价值链构建。以数据要素价值为锚点,梳理“业务贯通-数智决策-流通赋能”的多次多维车联网数据要素类型及应用场景,总结凝练保障“人-车-路- 云”数据要素价值安全释放的技术手段与管理运营举措。
以智能网联汽车为核心载体产生的数据要素资产迅速增长,其中不仅包含了车辆运行状态、驾驶员行为习惯,还包括了道路交通、城市情况等众多方面信息,数据已经成为汽车、交通创新发展的基础要素。充分发挥数据要素的乘数效应,不仅可为汽车产品优化和交通效率提升提供有力支撑,还是赋能汽车、交通产业变革和数字时代新经济发展的必然选择。
一、多次多维挖掘车联网数据要素价值
图 5 车联网数据的三次价值释放 来源:中国信息通信研究院整理
随着汽车智能网联化升级、道路智能化改造以及城市智慧化治理,摄像头、毫米波雷达、激光雷达、高精定位等各类感知设备在车辆和路侧大量部署,感知并收集到海量车联网数据,如车辆端的运行状态、驾驶行为和轨迹等数据;道路端的信号灯状态、目标轨迹、交通流量等数据;云端的路网地图、交通事件等数据。
车联网数据具有地域特征、多源异构、数据量大、多层价值特点。
- 地域特征是指行车和路侧采集的数据因为各地交通环境、路网特点、交通参与者组成的差异而呈现出不同的特点,如山区城市复杂的高架路网环境、快速路为主的中大型城市交通系统,与地面平交信控为主的小城交通系统相比较,行车和管理模式均有较大区别,不同的特征对数据模型的适应性提出了较高的要求。
- 多源异构特征是指车联网数据来源广泛且数据结构复杂。来自于车、路、互联网、个人终端的视频、雷达、激光点云、定位和轨迹、气候、交通管理等异构数据,给数据的汇聚和融合处理带来了一定的挑战。
- 数据量大是指城市与车辆实时产生的数据量巨大,例如一辆普通的智能网联汽车每天能产生 TB 级别的数据,成都交通运行协调中心日均新增 6 亿条数据,总数据量超过 3100 亿条,大体量的数据对数据治理和处理工具提出要求。
- 价值差异大是指数据对不同主体的价值存在较大差异,如车辆采集的雷达点云和接管数据对于自动驾驶训练更具价值,而路侧感知数据则对车联网和城市管理更具价值,数据价值的差异也促使行业探索可信数据流通模式和交易机制的形成。
依据中国信息通信研究院《数据要素白皮书(2022 年)》,数据要素投入生产的途径可概括为三次不同的价值释放过程。具体到车联网的数据领域来说,如图 5 所示。
- 一次价值体现在业务贯通层面,通过实体的数字化、数据的标准化和车路云的全方位连接,实现汽车、路侧、云端的全线业务贯通;
- 二次价值体现在数智决策层面,通过对各类数据的深度挖掘和分析,产生超出原始数据以外的新信息,提升车辆和交通的各类决策的效率及科学;
- 三次价值则是体现在数据流通层面,通过数据在主体之间的流动,让数据流通到需要的行业和企业,实现数据要素价值更大释放。
数据贯通,车路云典型应用规模化推广。数据的业务贯通价值是指通过数据实现车辆、路侧与云端的业务打通,达到车路云系统内部各主体的贯通,从而实现各类车联网典型应用。
- 车与路的业务贯通,数据承载着信号灯信息、交通感知信息,由路侧通信系统下发给网联车辆,使车辆能及时获取相关的信息,从而实现各类安全、效率类应用,如无锡、重庆等地运行的路侧信号灯和盲区预警应用。
- 车与云的业务贯通,车辆数据承载着车辆状态信息、位置信息、图像信息等,通过网联系统上传至云端后,使云端平台可以实时掌握车辆状态,实现车辆状态的监控,如合肥、南京等地对道路测试车辆的监控系统,通过车载终端实时上传的车辆数据,监控车辆运行状态;同时,云平台可将调度数据、地图数据等通过无线通信传输给车辆,实现远程调度、导航等应用,如长沙的定制公交应用,通过将乘客预定信息下发给公交车辆,实现公交的远程调度。
- 路与云的业务贯通,路侧设备将感知数据和设备状态数据上传给云平台,实现设备的远程监控,降低运维成本,如无锡、重庆等各地云平台的通过路侧设备的心跳数据来监控路侧设备状态;同时,云平台可将配置数据下发给路侧设备,实现设备的远程控制,如远程调整监控设备的角度,也可以将感知算法推动给路侧 MEC,实现远程升级。
数智决策,支撑汽车与交通智能化能力升级。通过对数据的加工、分析和建模,提取大量数据中蕴含的深层关系和规律,从而产生新的价值和信息,推动智能网联汽车产品和智慧交通服务升级。
- 汽车厂商依托汽车电气架构和远程升级功能,在售卖产品后持续收集用户使用和反馈数据,快速迭代车辆各类功能。如小鹏汽车基于车主市场调研需求,可以在汽车使用环节推出车内空调“高温抑菌” 功能。
- 互联网企业基于数据挖掘开发新功能,服务个人和行业。高德、百度通过对导航数据进行挖掘学习,为个人用户提供信号灯下倒计时服务,同时形成出行大数据报告,为地方交通规划提供决策支撑。
- 路侧运营企业深入挖掘交通数据,赋能智慧交通,助力“双碳”实现。深圳、无锡、襄阳等地通过对路侧采集的交通流数据分析,形成信号灯配时优化方案,可自动化调整路口配时,有效提升交通效率。中信科智联通过接入路侧融合感知设施数据,挖掘出精细化的车速、车型、道路流量等排放相关数据,并结合出行区域数据转化为碳排放数据,为后续“双碳”目标提供支撑。
但是车端数据和路侧数据的汇聚和分析,也对企业的数据挖掘、模型分析、数据筛选等能力提出了更高的要求,产生的应用相比一次价值释放更为聚焦和专业。
数据流通,赋能跨行业协同共建产业新生态。数据异质性使得相同数据在不同使用者和不同场景下存在较大价值差别,通过有效的数据流通和交易手段,在前两次基础上可以进一步释放数据价值。
- 车端方面,供应链数据流通降低生产阶段管理成本。德国由宝马、博世等企业牵头成立的 Catena-X 数据空间,用于各供应链企业间数据安全流通交换,实现碳足迹追踪(图 6)、零部件质量管理等应用,提升了整个汽车供应链的协作水平。
- 路端方面,路侧感知数据多维赋能多个行业。百度联合清华,发布了基于路侧感知数据的DAIR-V2X 车路协同数据集,为自动驾驶和车路协同解决方案商提供车路协同模型的研发和训练;德清城市运营主体利用路侧的感知数据,为交警、企业等提供道路事件监控等服务,并成功上线大数据交易所。
- 云端方面,车联网数据与交通云、交管云、城管云等融合,在交通管理、城市治理等方面拓展应用。广州市车城网平台通过对接交通车辆管理平台、城管数据中心等平台,通过对车辆闯红灯、逆行、道路遗撒、车斗未封闭等交通事件以及事故进行识别, 实现对重点车辆可追溯、自动化监管。
图 6 Catena-X 的碳足迹追踪应用示例 来源:中国信息通信研究院整理
虽然产业各方针对车联网数据要素释放开展了许多有益探索, 但目前仍存在路侧数据采集质量差异较大、可信数据流通架构和新型基础设施尚未建成、数据运营和交易机制尚不完善、安全合规准线尚不明晰等方面的问题,影响数据流通和应用的发展,制约数据价值的进一步释放。
二、新技术促进车联网数据要素价值释放
数据要素价值释放的全生命周期包括数据生产、数据流通和数据应用三个环节,数据安全保障则贯穿全生命周期。
数据生产层完成数据采集、筛选、处理和分析,实现原始数据向数据服务、数据资产的转变。
数据采集与汇聚方面,人工智能识别、时序时空数据库等技术持续提升数据采集的效率和准确性。人工智能识别有助于筛选潜在价值场景,有效节省数据传输和存储成本、提升训练效率,如百度阿波罗基于人工智能识别,可对感知数据进行关键信息提取,可对自动驾驶模型进行针对性训练。
时空时序数据库技术能有效的汇聚海量的感知、定位、授时、地图数据,形成具备时空、时序属性的自动驾驶场景集和交通统计数据,为后续挖掘和使用奠定基础。百度推出的天工时序时空数据库能存储实时采集的每辆车自动驾驶时的运行状态,借助高精定位技术和基础地理数据,可在数据库中还原车辆的运行轨迹和场景,实现高效数据分析和算法迭代。
不断提高的数据采集精度和效率要求,促进采集技术向更加智能化、动态化的方向发展。针对具体需求选择更有价值的数据,同时基于大模型,未来数据筛选流程有望部署在车/ 路的边缘侧,进一步提高数据采集效率。
数据处理与分析方面,自动化标注、交通大数据模型等技术持续提升数据处理分析效率。特斯拉的Auto-Labeling、商汤科技的商汤明眸等自动标注技术,能自动对图像和视频中的交通参与者、车道线、标志等信息进行标注,极大提升标注效率,降低数据处理成本。
交通大数据模型可对交通及车辆流量信息等进行统计分析,实现区域信号优化、交通态势预测等应用。如深圳基于交通感知数据实现在线动态交通仿真和路网状态精准预测,并从中还原出交通出行量表、路径等关键信息,支撑信控优化方案选择。
数据价值释放依赖于专业数据治理工具和数据处理模型,针对非结构化、多源数据关键信息提取的高效治理工具将会成为数据商品化、资产化的关键。同时,面向自动驾驶场景提取、场景泛化以及智慧交通优化、决策的相关模型的迭代一定程度上会影响数据的价值。
数据流通层通过数据控制、交易等实现数据价值可信流通及融合应用。一方面,以数据连接器为代表的技术通过数据加密、使用规则附加等功能确保数据主权。如 Catena-X 数据空间中的数据连接器能在对数据加密的同时,实现数据跨域的删除、锁定、撤回等操作;华为推出的数据胶囊产品,可将加密后的数据、使用策略、描述信息以及校验信息等封装成数据胶囊,实现阅后即焚、定时访问、定点访问、定量访问等功能。
另一方面,以可信数据空间为代表的数据流通基础设施快速发展。华为、数鑫科技等企业推出了基于可信数据空间架构的数据交换解决方案,可以在数据主权可控、数据分布式存储的前提下,实现各主体间数据的安全流通和共享。
目前,车联网领域数据流通的基础设施还在起步阶段。产业各方对于数据空间形态、数据流通模式、组织形式仍未形成共识,行业级的数据空间平台和组织还未形成。面向未来车联网数据流通的需求,仍需探索非结构化、高敏感性、高度定制化的数据流通技术和解决方案, 推动标准化的数据流通中间件研发和行业级的身份及数据认证平台建设,打造行业化的可信数据流通平台。
隐私保护、数据脱敏、数据溯源多方面保障数据安全合规。隐私保护方面,利用同态加密、联邦学习、安全多方计算等技术,探索大模型联合训练,为车联网数据流通过程中隐私保护提供了新的思路。信安世纪、360 数科、安恒信息、腾讯等企业建立可信隐私计算平台,并通过“可信隐私计算评测”,解决数据共享过程中的安全、信任和隐私保护问题。
数据脱敏方面,利用人工智能等技术对车外人脸、车牌数据进行脱敏处理,防止敏感信息泄露,如信长城、格尔软件等推出人脸、车牌快速脱敏算法,助力企业满足信息保护要求。
数据溯源方面,基于区块链、数字水印等技术保障数据不可篡改、可溯源。如宝马开发的 PartChain 区块链项目,通过对零部件企业数据上链,在数据流通时确保零部件来源可溯;中汽协以区块链为底层架构开发汽车大数据区块链交互平台,将企业脱敏数据的标签上链,保证数据的确权和不可篡改,实现数据资产的线上交易和线下交割。
数据水印技术将标识信息隐藏在结构化数据中,使数据在流通和使用过程中具备可识别分发者、分发对象、分发时间、分发目的等特点。如京东安全通过在图片中插入水印信息,实现敏感图片不被轻易转发。
目前,针对图像和视频中的人脸、车牌等敏感信息的脱敏技术已经相对成熟,能够满足小批量数据场景下敏感信息保护需求;但面向大数据场景的信息挖掘和处理技术还未成熟,同时针对车联网数据的分类分级方法、不同等级的安全应对体系还在持续探索,区块链、隐私计算及联邦学习等技术也将持续与车联网数据应用场景结合,更好的保障车联网数据的安全应用。
三、车联网数据交易逐步落地完善
数据交易所探索交易服务新范式,企业数据交易变现推动数据资产入表。根据“数据二十条”对数据交易所的规划,可分为国家级数据交易场所、区域性数据交易场所和行业性数据交易平台等。从职能来看,交易所主要提供数据确权登记、交易存证、交易撮合等公共服务,支撑主体间数据或数据服务交易,实现数据要素价值释放和数据资产入表。
车联网运营企业积极探索车联网数据交易,柳州、德清、苏州等地已落地车联网数据交易。柳州市东城集团东科智慧公司与中信科智联,成功完成柳州市车联网先导区首单车联网数据产品交易,北部湾大数据交易中心为此次数据交易进行了数据(产品)的登记和数据交易的存证服务,并为交易双方颁布凭证。
德清市基于车联网产业研发的 8 个数据产品正式上线浙江大数据交易服务平台,覆盖企业服务、交通地理、城市治理等业务领域,其中自动驾驶仿真场景库产品,通过对真实交通场景数据的脱敏和转换,形成适配自动驾驶企业仿真模拟训练所需的场景,吸引了大众集团、毫末智行等企业使用。
苏州实施全国首例车联网路侧数据资产化服务,由路侧设备运营商、数据加工商、数据产品开发商合作开发路侧数据产品,并通过苏州大数据交易所与检测机构、主机厂、自动驾驶公司等企业完成交易,首批分类场景达 20 类,首期产生有效数据生产量 500TB,签约额度 1000 万元14。
数据交易所为数据要素价值释放提供了一条可行路径,车联网运营企业可充分挖掘自身数据资源,结合产业需求针对性推出数据产品和服务,从而实现企业资产增值。未来,数据交易所的服务范围和流程将逐步明确,车联网运营企业则会持续推出车联网数据服务,并逐步探索形成标准化的数据产品,形成车联网数据运营的新模式。
本文摘编自中国信息通信研究院发布的《车联网白皮书(2023年)》,全文下载:
车联网白皮书(2023年)
更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。
加入数治网院iDigi AIGC+X 赋能成长计划,人均选用育留支出有望降低 20%-40%,技能升级 40%-60% !5人组团开课,¥999 /人起开启数据治理、安全以及合规等自主学习、素养测评、实践认证一体升值通道,扫码添加老邪企业微信,入群预约 AI 共创导师: