AI 大模型对整车软件发展趋势和技术路线的影响

AI 大模型正加速应用，一方面通过对软件工程等辅助开发，提升研发效率和质量；另外一方面则通过在自动驾驶、智能座舱等控制器的端侧部署，为用户带来全新体验。

AI 大模型以其卓越的计算能力、深度学习能力以及广泛的应用场景，正在重新定义整车软件的架构和功能，加速整个行业向更智能、更高效和个性化方向迈进。AI 大模型正加速应用，一方面通过对软件工程等辅助开发，提升研发效率和质量；另外一方面则通过在自动驾驶、智能座舱等控制器的端侧部署，为用户带来全新体验，这些也对目前的软件架构带来了新的挑战。

从上一篇《解锁大模型和AI Agent 在车端的革新应用和落地方法》可以了解到，大模型在智能座舱、智能驾驶和智能车控等车端应用和落地方法，以及AI Agent 基础服务的功能实现。在本篇中，我们来一起探讨 AI 大模型对整车软件发展趋势和技术路线的诸多方面影响，探索 AI 大模型的更多可能。

01 算法、算料、算力与场景

AI 大模型的训练和升级，算法、算料（数据）、算力和场景缺一不可。在探索 AI 大模型对整车软件发展趋势和技术路线影响之前，先考虑 AI 大模型本身的发展对资源的需求：

1. 算法模型对计算、存储需求增加

大模型可以作为模块化端到端中的一个模块发挥作用。大模型也可以与模块化端到端算法配合，例如理想与清华共同提出的 “快慢系统” 架构（如图 1-1 所示），或者小鹏汽车的XNet+XPlanner+Xbrain架构。在车端侧部署的模型通常经过轻量化处理，但基于功能性、准确性、安全性的考量，模型参数规模仍然达到几十亿以上。

对于端到端驾驶任务，为了避免累积误差和信息丢失，模型模块之间或者模型之间以多维特征空间中的多维数组或矩阵传递。这一种数据量更大且连续的数据形式，对数据的存储和传输效率（如零拷贝方式）要求很高。虽然感知、规控等算法业务内部传输的数据形式几经优化，但域之间、智能体之间、智能体内插件或工具库之间仍不乏人为数据的发布订阅，所需内存达到十几 GB，甚至几十GB。如果采用多智能体的架构，对系统资源分配会有更高要求。

图1-1 理想与清华提出的“快慢系统”架构

2. 芯片和工具链设计需支持算法快速迭代

当前的端到端算法和大模型大多基于 Transformer（一种广泛应用于自然语言处理中的深度学习模型）架构，相比过去卷积网络中以 4D 为主的比较小的张量，大模型结构中张量的维度更加多变，维度操作更加复杂，张量显著变大。为应对这个问题，需要芯片的多级缓存、带宽，AI 编译器中的前端优化、后端优化同时 runtime 库的设计思路也要有所调整。

另一方面，大模型的部署中使用到了诸如 KV Cache、线程管理、draft 技术等技巧，一些通用的算法技巧会被集成到模型部署的 runtime 库或部署框架中。现在各厂商团队的方案大多仍是大模型使用一套部署框架，其他模型使用过去通行的部署框架，然后通过某种通信机制协同工作。对于 AI 芯片厂商来说，想要自己的芯片参与大模型的异构计算，要么兼容现有的框架，要么提供面向大模型的新的部署框架，因此还会有更多与算法相关的资源调度管理方法出现。

3. 丰富的信息输入与交互

早期自动驾驶领域的 AI 模型输入的数据主要是图像数据、激光雷达数据、毫米波雷达数据，此外 GNSS（全球导航卫星系统）、IMU（惯性测量单元）、高精地图、车身状态等数据则主要是在基于规则的算法中被用到。如图 1-2 丰富的信息输入与交互所示，现在自动驾驶算法中要求 IMU、车身状态等数据经过预处理输入模型参与融合计算。

当大模型应用到自动驾驶任务之后，模型数据来源可能会来自于智驾域、座舱域、互联网，语音、文字、图像数据、外部知识库以及长期记忆都会成为模型输入，可以预见汽车电气电子架构从域控制器，到域融合，到中央计算，最后到车云协同的发展趋势。

图1-2 丰富的信息输入与交互

4. 数据处理管道构建

AI 大模型训练依赖于数据质量、多样性和完整性，有效地构建和管理数据集，准确反映实际应用场景中的复杂性和多样性。在自动驾驶领域有来自摄像头、激光雷达、毫米波雷达以及 GPS（全球定位系统）等多种传感器数据，高效的数据处理管道通常包括数据收集、整合、同步、预处理、特征提取、标签化和版本控制等。AI 大模型训练和推理根据需求动态调整计算资源，需要高效的资源管理和调度策略。容器化技术和容器编排工具支持模型训练的自动化和规模化。

5. 模型迭代管理与优化

模型迭代需要跟踪和管理不同版本的模型，便于模型的更新和回滚。分布式训练、模型压缩、模型量化等技术能够提高训练效率，减少模型的计算负担，使得 AI 模型能够更快地部署到生产环境中。通过模型剪枝和量化技术，可以显著减小模型大小，降低推理阶段的计算成本，这对于车端设备上的实时推理尤其重要。

6. 边缘计算与云端大数据层协同

边缘计算通过在网络的边缘位置部署计算资源，能够更快地响应本地数据，减少数据传输至云端的延迟和带宽消耗。在自动驾驶等场景中，大量的数据处理能够在车辆本地完成，车载计算机可以即时处理来自摄像头、雷达和激光雷达等传感器的数据，进行实时的环境感知和决策制定。云端拥有更强大的计算能力和存储容量，可以处理来自全球各地的海量数据，以及模型训练和优化任务。这种边缘计算与云端大数据层的协同工作模式，不仅能够提高系统的响应速度和可靠性，还能更好地保护用户隐私。

02 整车软件开发方法的变革

1. 数据驱动而非规则驱动

传统软件开发方法论往往依赖于明确的规则和逻辑，开发者需要预先编写详细的程序指令来指导软件的行为。在 AI 大模型的背景下，软件开发的方式从规则驱动转向数据驱动。数据驱动的方法适用于整个软件开发生命周期，包括需求分析、设计、测试和部署等阶段。过去基于规则的自动驾驶算法通过人工设置的条件判断和参数，控制车辆在特定场景下的特定行动，但是道路场景是千变万化的，通过人工预设难以穷尽所有场景。

在数据驱动的开发模式下，AI 通过对海量数据的学习来优化模型参数，而不依赖于预设的硬编码规则，灵活性和适应性更高，能更快地响应场景变化。在自动驾驶领域通过收集大量的驾驶数据来训练大模型，由于大模型的规模和复杂性，需要充分挖掘硬件性能，优化算法逻辑和部署策略。

2. 仿真测试效率与覆盖度提升

仿真测试是确保软件质量和可靠性的关键手段。基于 AI 的仿真环境通过大量的实车数据训练，相比传统仿真方法，能够利用机器学习算法（如深度学习）自动学习复杂系统的动态行为，无需显式编程就能模拟现实世界场景；能够根据输入数据和系统状态的变化自动调整模型参数，无需重新建模；可以处理更多维度的数据和更复杂的非线性关系，能够捕捉到细微模式；利用高性能计算平台和优化算法，能够实现即时或接近实时的仿真及反馈；可以通过添加更多的训练数据和微调模型来适应新的场景，更容易扩展和维护。

基于 AI 的仿真环境能在汽车基础软件开发的早期阶段就发现潜在的问题，提供详细的错误报告，高精度定位错误，积累与优化测试策略方法，给出改进建议，主动式反馈机制加速修复流程，预防潜在的缺陷。AI 仿真环境以其优异的智能化水平、自适应能力、复杂度处理能力、实时性、可扩展性，敏捷且无限数量的生成真实或高度接近真实场景，覆盖极端或罕见的边界条件，降低测试成本，使系统的评估变得更加高效和全面。

3. 人类、AI 与三方工具紧密协作

如图 1-3 人类、AI 与三方工具的协作所示，人类工程师收集挖掘汽车基础软件原始需求信息，而 AI 通过智能分析来辅助需求的细化和理解。标准代码库通常包含大量的功能和模块，有些功能并非全部适用于项目，通过 AI 对代码库进行智能分析，识别项目所需的特定功能和模块，按需自动生成 ARXML 文件或脚本，精简代码。

自动调整配置文件能提高代码的可读性和可维护性，减少不必要的依赖，降低复杂度与出现兼容性问题的风险。生成的ARXML 文件被导入到第三方工具中，用于系统设计、代码生成或测试用例的自动化、智能化生成，生成、执行测试用例，人类工程师参与设计、编码、测试规则定义和输出评审，确保软件质量及其稳定性。

图1-3 人类、AI与三方工具的协作

4. 基于大模型的仿真训练

端到端的自动驾驶要求 4D 的标注数据，人工标注成本大，功效低。基于大模型的生成算法可以为仿真训练生成大量逼真 corner case（极端情况）。当配备影子模式的车辆在道路上行驶的时候，一旦自身算法的规划控制与驾驶员的操作不一致，汽车会将当时的场景上报到云端，服务器中心通过多模态大模型分析上报的场景，生成类似场景，并执行仿真训练，然后自动化测试反馈，最后更新算法模型。相较于人工修改代码，或者重新采集标注数据，这种监督、上报、仿真的方式将大幅提升训练效率。

5. 整车协作开发更加重要

以往，不同域控制器和云端的开发是相互独立的。大模型或多智能体应用于全驾驶流程，要求以整车的视角协调不同功能模块的部署和协作。开发团队首先需要清晰定义不同的软件模块的优先级，哪些对实时性要求高，哪些对确定性要求高，哪些是更加灵活随机的。需要清楚大模型或智能体在规划汽车行为的时候，车上所有模块如何做好隔离和联动。

6. 生成式软件架构方法

相比传统的软件架构，生成式软件架构不必从顶层到底层逐步分解，层层定义算法、逻辑、数据、输入输出详细接口、交互流程、状态机等，只需要给出系统和软件需求，较为抽象的目标定义，AI 自动完成架构设计，自然保持设计与实现的一致性、需求到交付的一致性。通过模型训练和新创新数据训练，获得最优软件架构，自带继承性和创新性。

03 整车软件技术的演进方向

1. AI Agent 为核心

随着 AI 技术的不断进步，未来 OS 体系可能会演变成以大模型为核心的集群 OS 架构。AI 大模型将推动汽车软件向 AI Agent 模式转变，这种软件架构模式更加灵活和模块化。每个 Agent 是一个小型的智能体，它可以根据自己的任务需求进行定制化开发，能够自主学习、决策和优化，根据实际运行情况和环境变化做出快速反应，完成特定的智能任务，如自动驾驶、座舱交互等，还能与其他Agent进行协作，共同完成复杂的任务，从而实现更加高效和个性化的服务。

由于每个Agent 都是独立的，当某个 Agent 出现问题时，其他 Agent 仍然可以正常运行，大大提高系统的稳定性和可靠性。自动驾驶 Agent 能够实时分析路况信息，做出安全行驶的决策；座舱交互 Agent 则可以理解乘客的需求，提供个性化的娱乐和信息服务。

2. 云 – 边 – 端一体化

随着 AI 大模型的应用，未来的车辆软件架构将更加注重云、边缘计算和终端设备之间的协同工作。这种云 – 边 – 端一体化的架构能够充分发挥各自的优势，形成高效的数据处理和响应机制。在该架构中，云端负责处理大量数据的存储、备份和复杂的计算任务，而边缘计算设备专注于实时数据处理和决策制定，终端设备则负责执行具体的任务。在自动驾驶场景中，车辆收集到的大量传感器数据首先会在边缘计算设备上进行初步处理和分析，然后将关键信息上传至云端进行进一步的深度学习和优化。

云端通过 AI 大模型对数据进行分析后，将决策结果返回给边缘计算设备，后者再将指令发送给车辆的执行系统，实现快速响应。这种架构不仅能够减少数据传输的延迟，即使在网络连接不稳定时，车辆也能做出及时的决策。通过将计算任务合理地分布在云端、边缘和终端设备之间，还可以有效地降低功耗和成本，提高系统的整体效率。

3. 安全与隐私保护强化

AI 技术的应用带来新的安全挑战，特别是对于涉及大量个人数据的领域。未来的汽车软件架构将更加重视安全架构的设计，将重点放在加密通信、数据脱敏、安全认证等方面，确保系统能够及时应对新的威胁。

4. 标准化与开放性

开放平台将成为推动行业发展的关键因素。标准化组织将推动 AI 相关标准的制定，统一 API 接口标准，汽车制造商提供开放的 API 和 SDK，允许开发者为特定车型开发新的应用和服务，不同 AI Agent 可以更容易地交换数据和共享服务，以促进不同系统间的互操作性和兼容性，降低开发成本，提高系统的互操作性。开放平台吸引更多领域的创新者加入进来，能够鼓励技术创新和生态合作。

04 趋势下的技术点

1. 大模型技术演进

随着人工智能技术的快速发展，大模型技术已成为推动智能系统演进的关键驱动力。Transformer、BERT 和GPT 等架构通过深度学习和自注意力机制显著提升模型的表现力和泛化能力。开发模型压缩与量化技术，如模型剪枝和权重量化等方法，减少模型所需的计算资源，以适应资源受限的环境。

2. 数据增强与合成提升

数据作为 AI 模型训练的基础，其质量直接决定模型性能。数据增强技术通过对原始数据进行变换，生成额外的训练样本，从而增强模型的泛化能力。数据合成技术可以通过生成对抗网络（GANs）等手段生成合成数据，以补充真实数据的不足。为平衡数据使用和隐私保护之间的关系，采用差分隐私和联邦学习等技术，确保在保护个人隐私的同时，能有效利用数据进行模型训练。

3. 通信效率与安全提升

随着 AI 应用的日益复杂，高效的通信技术变得尤为重要。第五代（5G）和第六代（6G）移动通信技术提供更高的带宽和更低的延迟，这对于实时 AI 应用的支持至关重要。