各智驾企业是如何进行数据飞轮工程落地的？

智驾最前沿 2026-05-31 973

描述

[首发于智驾最前沿微信公众号]在自动驾驶领域，经常会听到数据飞轮这个概念。为什么特斯拉的FSD能从频繁接管进化到近乎老司机的能力，迭代速度甩开传统开发模式几个量级？为什么华为、小鹏这样的厂商都在不计成本地铺设数据闭环？答案就藏在飞轮这两个字里。今天就和大家来聊聊企业是如何做好数据飞轮的。

自动驾驶

这个飞轮是怎样转起来的？

数据飞轮简单理解，就是一套让自动驾驶系统从真实驾驶中自我学习、持续进化的工程闭环。它可以完成车辆采集数据、数据回传云端、云端完成自动标注与模型训练、新模型通过OTA部署回车端，车辆继续采集新数据进入下一轮循环等一整个运转链路。当这套链路中各环节的自动化程度足够高时，飞轮就能够在极短时间内完成发现问题、训练改进、验证上线的完整周期，周而复始地提升智驾能力。

自动驾驶

图片源自：智驾最前沿

当前行业对数据飞轮的竞争，已从谁有数据转向谁的迭代效率更高。特斯拉从FSD V12的端到端模型与影子模式构建了业界效率最高的数据闭环，FSD累计行驶里程超过16亿英里，且仍在加速。华为则通过八爪鱼平台将数据闭环能力封装为可交付的产品，为车企提供数据、标注、训练、仿真、合规等一站式工具链。Waymo没有照搬行业流行的端到端大模型路线，而是构建了独特的驾驶员、模拟器、评价者三位一体闭环架构，强调安全可验证。英伟达则凭借Cosmos世界基础模型与Omniverse仿真平台，将数千英里真实驾驶数据扩展为数十亿英里虚拟驾驶里程，用合成数据角度为飞轮提供动力，对于各企业的具体实施方案，将在第四章节与大家详细聊一聊。

自动驾驶

车端如何精准采集高价值数据？

数据采集是飞轮的起点，一辆具备高阶智驾能力的车辆每天产生的传感器数据可达TB级别，如果全量回传，网络成本和云端存储成本难以承受。因此，车端必须具备在行驶中自动筛选高价值场景的能力，这是飞轮能否低成本运转的第一道关卡。

特斯拉通过影子模式来实现这一环节，在人类驾驶员操控车辆时，FSD算法在后台同步运行并独立做出决策判断，但不控制车辆。系统实时比对算法判断与驾驶员实际操作，一旦两者出现显著分歧（如算法认为应该减速而驾驶员加速通过），就判定该场景为异常工况，自动触发数据回传。这种机制将人类驾驶员的日常操作作为免费的真值参照，系统无需任何人工干预就能自动发现模型表现不佳的场景。

自动驾驶

图片源自：网络

影子模式是一种被动触发策略，而主动学习则是云端主动向车队发起数据采集请求的一种形式。当算法团队识别出模型对某类场景处理能力不足时，会向全球车队下发包含目标场景特征描述的轻量级触发器。车辆在行驶中持续匹配这些特征，一旦命中，就可以将对应时段的数据打包上传。这种缺什么、找什么的定向采集方式，在控制传输成本的同时大幅提升了进入训练集的数据价值密度。

华为乾崑方案也采用了类似架构，通过量产车数据采集网络与云基础设施的配合，实现端云协同的定向数据筛选。其智驾数据闭环模型可以低成本、快速获取高价值训练和仿真数据，同时通过端云协同增强复杂场景的理解与决策能力。小鹏则将用户干预行为作为关键触发信号，车端回传用户干预时的操作、环境和系统状态三维信息，以定点攻克接管场景。

自动驾驶

数据上云后怎样处理和训练？

数据回传后，首先要做的是标注环节，传统标注方式大量依赖人工，一辆车一天产生的激光雷达点云可能需要上百名标注员处理数日。为支撑飞轮的高频迭代，标注环节的自动化是必须解决的问题。

4D自动标注是当前行业的主流方案。4D意味着在3D空间坐标之上加入时间维度，对点云和图像数据进行跨时序的连续标注，标注结果能更好地支撑BEV感知模型的训练。阿里云的ADS 4D标注平台就可以通过AI预标注技术对点云进行初步识别，再由人工做微调修正，同时引入自动化质检逻辑，将标注精度从行业通用的98%提升到 9.2%，年度完成数亿帧3D点云处理。标贝科技的4D-BEV上亿点云标注系统则利用大模型进行多模态预识别，从空间和时序维度对车辆、行人和路标等目标进行多视角标注，将百亿点云的标注周期从月级压缩到周级。

自动驾驶

图片源自：网络

学术界也在推进标注技术的底层探索，SAM4D方案引入统一多模态位置编码（UMPE），将相机和激光雷达的特征在共享3D空间中对齐，实现跨模态提示与交互，能够对相机和激光雷达流中的任意目标进行分割。这些技术共同方向是让人的角色从标注操作者转变为质量审核者。

标注完成后就会进入模型训练环节，大模型时代下，算力基础设施成为决定迭代速度的关键。小鹏在2025年科技日披露，其云端训练集群规模达3万卡，基座模型参数量达到720亿，训练数据接近1亿clips，可实现每5天完成一次全链路迭代，等效覆盖人类司机6.5万年的极限场景。腾讯部署的车云一体方案则在数据管理层面发力，通过统一数据目录管理、端到端数据血缘追踪和分布式异构算力调度，将数据发现时间缩短90%，存储成本降低50%，计算成本降低75%。火山引擎提出的全模态数据湖方案，通过引入Lance数据湖格式实现超大规模元数据描述和高级索引，解决了多模态数据异构处理和多团队协同的效率瓶颈。

自动驾驶

图片源自：网络

仿真验证是模型上车前的最后一步，华为的仿真平台预置了25万以上仿真场景库，覆盖高速、城区、泊车等场景，并支持基于基础场景库泛化生成千万级衍生场景，单日可完成千万公里的并行仿真里程。阿里云则整合Omniverse仿真平台与世界模型Cosmos，在虚拟环境中完成模型评测后再部署到边缘设备。

还有一点要提的是，合成数据在飞轮中扮演的角色越来越重。随着智驾系统能力的提升，实车采集的数据中有效信息密度持续降低，譬如系统已经能应付雨天场景后，雨天的绝大多数采集数据就失去了训练价值，真正有价值的只剩暴雪、台风等更极端的长尾场景，此时合成数据就起到了作用。2023年到2025年间，合成数据在训练数据中的占比从20%～30%提升到了50%～60%，已成为补充长尾场景的主要方式。这也意味着飞轮的燃料来源正在从纯实车采集向实车采集+合成生成的混合模式转变。

自动驾驶

几家企业走的不同路线详解

行业对数据闭环的必要性早已形成共识，但具体到实现路径上，每家企业都给出了完全不同的解法。这些分歧背后，实质是各家对自身战略定位的考量。

特斯拉作为数据飞轮模式的标杆，其核心优势建立在一套垂直整合的全栈架构之上。全球数百万辆能够运行FSD的车辆组成了一个庞大的分布式数据采集网络，在这个网络中，影子模式和定向触发机制负责高效筛选有价值的数据，当算法判断与人类驾驶员的操作出现分歧时，系统会自动上传相关场景数据，整个过程无需人工介入。近期更新的强制接管原因填写功能，则为每一条接管数据赋予了明确的分类标签，进一步提升了数据标注的质量。在云端，自研的Dojo超算与自动标注工具打通了训练链路，新模型可通过OTA通道直接部署回车端。从芯片到算法再到数据，这条完整的链路全部掌握在特斯拉自己手里，省去了跨供应商协作的摩擦成本。

自动驾驶

图片源自：网络

特斯拉提出的Data Engine框架将这一循环梳理得更加清晰。它首先采集特定场景的初始素材，然后向全球车队请求扩充类似场景，接着对数据进行自动标注并投入训练，通过影子模式验证效果后，再启动下一轮循环。这套框架让数据飞轮的每一个环节都形成了明确的反馈链路。近期FSD V14的发布进一步释放了技术潜力，模型参数规模扩展至V13的十倍，引入了专家混合架构和强化学习，推动智驾能力持续跃迁。

华为的打法与此不同，作为增量部件供应商，它通过八爪鱼平台为车企提供一站式的数据闭环工具链，覆盖数据处理、场景挖掘、标注、模型训练、仿真测试、合规服务等完整环节，底层硬件基于自研昇腾AI处理器，盘古预标注大模型为其提供AI能力支撑。这套方案的关键在于，数据闭环被封装成一个可交付的产品，车企可按需集成，不必每家都从头自研。在算法架构上，ADS 5.0搭载的WEWA架构选择了另一条路，行业主流方向是VLA模型，华为则认为中间的语言层会引入延迟和信息损失，因此转而采用WA模型，直接从多模态感知数据映射为行驶轨迹控制指令。云端的World Engine则以极高密度生成极端驾驶场景进行训练，在正式上路前完成高强度的虚拟验证。

自动驾驶

图片源自：网络

Waymo的路线与前面两家截然不同，它没有押注更大的端到端模型，而是构建了一套以安全可验证为优先级的AI生态系统，由驾驶员模型、模拟器和评价系统三个组件构成闭环。三者的底层由统一的Waymo基础模型驱动，内部采用了快思考与慢思考的双系统架构，一个负责融合多传感器数据进行毫秒级实时决策，另一个则基于视觉语言模型对罕见复杂场景进行深度语义推理。

Waymo的飞轮可以理解为内外两层，内环是基于强化学习的仿真到验证再到上车的闭环，外环则是实车测试的反馈闭环。评价系统负责标记问题，系统据此生成改进行为，经过模拟器高强度的压力验证和安全框架审核后，才能部署到真实道路。这套架构让Waymo的模型并不依赖人类经验来学习，而是从自身超过一亿英里的完全自动驾驶实际数据中直接进化，系统安全性相较人类驾驶提升十倍以上。

英伟达则从算力和仿真工具链的角度切入数据飞轮，在2026年GTC大会上，它发布了物理AI数据工厂蓝图，这是一个开放的参考架构，用于统一并自动化训练数据的生成、增强与评估。蓝图的核心包含三个组件，Curator负责数据处理和标注，Transfer用于数据扩展和多样化，Evaluator则执行自动评分和验证。借助Cosmos世界基础模型，开发者可以将有限的真实驾驶数据转化为大规模多样化的数据集，覆盖现实中难以采集的长尾与边缘场景。这套数据工厂模式的意义在于，它大幅降低了对实车采集数据的依赖，通过仿真生成的多样化场景来加速端到端自动驾驶的开发。

小鹏汽车选择了一条相对激进的技术路线。它在2025年科技日发布了第二代VLA大模型，并在2026年完成量产推送。该模型采用端到端架构，跳过了传统的视觉识别、语言转译、动作执行分步流程，直接将视觉信号映射为驾驶指令，决策延迟被压缩在80毫秒以内，响应速度较前代提升十二倍，百公里接管次数减少三分之一以上。与此同时，小鹏Robotaxi已正式量产下线，搭载四颗图灵AI芯片，算力达到3000TOPS，采用纯视觉方案搭配第二代VLA模型，实现了L4级自动驾驶能力。在数据层面，小鹏将物理世界模型比作引擎，将数据比作燃料，数据的数量和质量直接决定了引擎能否高效运转。

自动驾驶

图片源自：网络

Momenta自创立之初就提出了一个飞轮两条腿的战略，让智能辅助驾驶与Robotaxi共享同一个数据闭环和模型底座，通过两个应用方向的协同来加速飞轮运转。在2026年北京车展上，Momenta宣布R7强化学习世界模型实现量产首发，CEO曹旭东曾打过一个比方，数据就像贫矿，原始数据只贡献了价值源头的十分之一，剩下的九成来自飞轮的体系能力，其中又包括架构能力和组织能力。目前搭载Momenta系统的量产车辆已超过八十万台，且增速持续加快，飞轮效应的加速趋势正在数据层面得到验证。

从整个行业来看，各家实现路径虽有不同，但底层演进方向高度一致，那就是从模块化架构走向统一的端到端模型，数据闭环的迭代周期从天级向小时级压缩。随着合成数据占比持续提升、全流程自动化工具链逐步部署，行业的核心矛盾正聚焦于长尾场景覆盖与成本控制之间的平衡。

审核编辑黄宇

打开APP阅读更多精彩内容