各智驾企业是如何进行数据飞轮工程落地的? [首发于智驾最前沿微信公众号]在自动驾驶领域,经常会听到数据飞轮这个概念。为什么特斯拉的FSD能从频繁接管进化到近乎老司机的能力,迭代速度甩开传统开发模式几个量级?为什么华为、小鹏这样的厂商都在不计成本地铺设数据闭环?答案就藏在飞轮这两个字里。今天就和大家来聊聊企业是如何做好数据飞轮的。

这个飞轮是怎样转起来的?
数据飞轮简单理解,就是一套让自动驾驶系统从真实驾驶中自我学习、持续进化的工程闭环。它可以完成车辆采集数据、数据回传云端、云端完成自动标注与模型训练、新模型通过OTA部署回车端,车辆继续采集新数据进入下一轮循环等一整个运转链路。当这套链路中各环节的自动化程度足够高时,飞轮就能够在极短时间内完成发现问题、训练改进、验证上线的完整周期,周而复始地提升智驾能力。

图片源自:智驾最前沿
当前行业对数据飞轮的竞争,已从谁有数据转向谁的迭代效率更高。特斯拉从FSD V12的端到端模型与影子模式构建了业界效率最高的数据闭环,FSD累计行驶里程超过16亿英里,且仍在加速。华为则通过八爪鱼平台将数据闭环能力封装为可交付的产品,为车企提供数据、标注、训练、仿真、合规等一站式工具链。Waymo没有照搬行业流行的端到端大模型路线,而是构建了独特的驾驶员、模拟器、评价者三位一体闭环架构,强调安全可验证。英伟达则凭借Cosmos世界基础模型与Omniverse仿真平台,将数千英里真实驾驶数据扩展为数十亿英里虚拟驾驶里程,用合成数据角度为飞轮提供动力,对于各企业的具体实施方案,将在第四章节与大家详细聊一聊。

车端如何精准采集高价值数据?
数据采集是飞轮的起点,一辆具备高阶智驾能力的车辆每天产生的传感器数据可达TB级别,如果全量回传,网络成本和云端存储成本难以承受。因此,车端必须具备在行驶中自动筛选高价值场景的能力,这是飞轮能否低成本运转的第一道关卡。
特斯拉通过影子模式来实现这一环节,在人类驾驶员操控车辆时,FSD算法在后台同步运行并独立做出决策判断,但不控制车辆。系统实时比对算法判断与驾驶员实际操作,一旦两者出现显著分歧(如算法认为应该减速而驾驶员加速通过),就判定该场景为异常工况,自动触发数据回传。这种机制将人类驾驶员的日常操作作为免费的真值参照,系统无需任何人工干预就能自动发现模型表现不佳的场景。

图片源自:网络
影子模式是一种被动触发策略,而主动学习则是云端主动向车队发起数据采集请求的一种形式。当算法团队识别出模型对某类场景处理能力不足时,会向全球车队下发包含目标场景特征描述的轻量级触发器。车辆在行驶中持续匹配这些特征,一旦命中,就可以将对应时段的数据打包上传。这种缺什么、找什么的定向采集方式,在控制传输成本的同时大幅提升了进入训练集的数据价值密度。
华为乾崑方案也采用了类似架构,通过量产车数据采集网络与云基础设施的配合,实现端云协同的定向数据筛选。其智驾数据闭环模型可以低成本、快速获取高价值训练和仿真数据,同时通过端云协同增强复杂场景的理解与决策能力。小鹏则将用户干预行为作为关键触发信号,车端回传用户干预时的操作、环境和系统状态三维信息,以定点攻克接管场景。

数据上云后怎样处理和训练?
数据回传后,首先要做的是标注环节,传统标注方式大量依赖人工,一辆车一天产生的激光雷达点云可能需要上百名标注员处理数日。为支撑飞轮的高频迭代,标注环节的自动化是必须解决的问题。
4D自动标注是当前行业的主流方案。4D意味着在3D空间坐标之上加入时间维度,对点云和图像数据进行跨时序的连续标注,标注结果能更好地支撑BEV感知模型的训练。阿里云的ADS 4D标注平台就可以通过AI预标注技术对点云进行初步识别,再由人工做微调修正,同时引入自动化质检逻辑,将标注精度从行业通用的98%提升到 9.2%,年度完成数亿帧3D点云处理。标贝科技的4D-BEV上亿点云标注系统则利用大模型进行多模态预识别,从空间和时序维度对车辆、行人和路标等目标进行多视角标注,将百亿点云的标注周期从月级压缩到周级。

图片源自:网络
学术界也在推进标注技术的底层探索,SAM4D方案引入统一多模态位置编码(UMPE),将相机和激光雷达的特征在共享3D空间中对齐,实现跨模态提示与交互,能够对相机和激光雷达流中的任意目标进行分割。这些技术共同方向是让人的角色从标注操作者转变为质量审核者。
标注完成后就会进入模型训练环节,大模型时代下,算力基础设施成为决定迭代速度的关键。小鹏在2025年科技日披露,其云端训练集群规模达3万卡,基座模型参数量达到720亿,训练数据接近1亿clips,可实现每5天完成一次全链路迭代,等效覆盖人类司机6.5万年的极限场景。腾讯部署的车云一体方案则在数据管理层面发力,通过统一数据目录管理、端到端数据血缘追踪和分布式异构算力调度,将数据发现时间缩短90%,存储成本降低50%,计算成本降低75%。火山引擎提出的全模态数据湖方案,通过引入Lance数据湖格式实现超大规模元数据描述和高级索引,解决了多模态数据异构处理和多团队协同的效率瓶颈。

图片源自:网络
仿真验证是模型上车前的最后一步,华为的仿真平台预置了25万以上仿真场景库,覆盖高速、城区、泊车等场景,并支持基于基础场景库泛化生成千万级衍生场景,单日可完成千万公里的并行仿真里程。阿里云则整合Omniverse仿真平台与世界模型Cosmos,在虚拟环境中完成模型评测后再部署到边缘设备。
还有一点要提的是,合成数据在飞轮中扮演的角色越来越重。随着智驾系统能力的提升,实车采集的数据中有效信息密度持续降低,譬如系统已经能应付雨天场景后,雨天的绝大多数采集数据就失去了训练价值,真正有价值的只剩暴雪、台风等更极端的长尾场景,此时合成数据就起到了作用。2023年到2025年间,合成数据在训练数据中的占比从20%~30%提升到了50%~60%,已成为补充长尾场景的主要方式。这也意味着飞轮的燃料来源正在从纯实车采集向实车采集+合成生成的混合模式转变。

几家企业走的不同路线详解
行业对数据闭环的必要性早已形成共识,但具体到实现路径上,每家企业都给出了完全不同的解法。这些分歧背后,实质是各家对自身战略定位的考量。
特斯拉作为数据飞轮模式的标杆,其核心优势建立在一套垂直整合的全栈架构之上。全球数百万辆能够运行FSD的车辆组成了一个庞大的分布式数据采集网络,在这个网络中,影子模式和定向触发机制负责高效筛选有价值的数据,当算法判断与人类驾驶员的操作出现分歧时,系统会自动上传相关场景数据,整个过程无需人工介入。近期更新的强制接管原因填写功能,则为每一条接管数据赋予了明确的分类标签,进一步提升了数据标注的质量。在云端,自研的Dojo超算与自动标注工具打通了训练链路,新模型可通过OTA通道直接部署回车端。从芯片到算法再到数据,这条完整的链路全部掌握在特斯拉自己手里,省去了跨供应商协作的摩擦成本。

图片源自:网络
特斯拉提出的Data Engine框架将这一循环梳理得更加清晰。它首先采集特定场景的初始素材,然后向全球车队请求扩充类似场景,接着对数据进行自动标注并投入训练,通过影子模式验证效果后,再启动下一轮循环。这套框架让数据飞轮的每一个环节都形成了明确的反馈链路。近期FSD V14的发布进一步释放了技术潜力,模型参数规模扩展至V13的十倍,引入了专家混合架构和强化学习,推动智驾能力持续跃迁。
华为的打法与此不同,作为增量部件供应商,它通过八爪鱼平台为车企提供一站式的数据闭环工具链,覆盖数据处理、场景挖掘、标注、模型训练、仿真测试、合规服务等完整环节,底层硬件基于自研昇腾AI处理器,盘古预标注大模型为其提供AI能力支撑。这套方案的关键在于,数据闭环被封装成一个可交付的产品,车企可按需集成,不必每家都从头自研。在算法架构上,ADS 5.0搭载的WEWA架构选择了另一条路,行业主流方向是VLA模型,华为则认为中间的语言层会引入延迟和信息损失,因此转而采用WA模型,直接从多模态感知数据映射为行驶轨迹控制指令。云端的World Engine则以极高密度生成极端驾驶场景进行训练,在正式上路前完成高强度的虚拟验证。

图片源自:网络
Waymo的路线与前面两家截然不同,它没有押注更大的端到端模型,而是构建了一套以安全可验证为优先级的AI生态系统,由驾驶员模型、模拟器和评价系统三个组件构成闭环。三者的底层由统一的Waymo基础模型驱动,内部采用了快思考与慢思考的双系统架构,一个负责融合多传感器数据进行毫秒级实时决策,另一个则基于视觉语言模型对罕见复杂场景进行深度语义推理。
Waymo的飞轮可以理解为内外两层,内环是基于强化学习的仿真到验证再到上车的闭环,外环则是实车测试的反馈闭环。评价系统负责标记问题,系统据此生成改进行为,经过模拟器高强度的压力验证和安全框架审核后,才能部署到真实道路。这套架构让Waymo的模型并不依赖人类经验来学习,而是从自身超过一亿英里的完全自动驾驶实际数据中直接进化,系统安全性相较人类驾驶提升十倍以上。
英伟达则从算力和仿真工具链的角度切入数据飞轮,在2026年GTC大会上,它发布了物理AI数据工厂蓝图,这是一个开放的参考架构,用于统一并自动化训练数据的生成、增强与评估。蓝图的核心包含三个组件,Curator负责数据处理和标注,Transfer用于数据扩展和多样化,Evaluator则执行自动评分和验证。借助Cosmos世界基础模型,开发者可以将有限的真实驾驶数据转化为大规模多样化的数据集,覆盖现实中难以采集的长尾与边缘场景。这套数据工厂模式的意义在于,它大幅降低了对实车采集数据的依赖,通过仿真生成的多样化场景来加速端到端自动驾驶的开发。
小鹏汽车选择了一条相对激进的技术路线。它在2025年科技日发布了第二代VLA大模型,并在2026年完成量产推送。该模型采用端到端架构,跳过了传统的视觉识别、语言转译、动作执行分步流程,直接将视觉信号映射为驾驶指令,决策延迟被压缩在80毫秒以内,响应速度较前代提升十二倍,百公里接管次数减少三分之一以上。与此同时,小鹏Robotaxi已正式量产下线,搭载四颗图灵AI芯片,算力达到3000TOPS,采用纯视觉方案搭配第二代VLA模型,实现了L4级自动驾驶能力。在数据层面,小鹏将物理世界模型比作引擎,将数据比作燃料,数据的数量和质量直接决定了引擎能否高效运转。

图片源自:网络
Momenta自创立之初就提出了一个飞轮两条腿的战略,让智能辅助驾驶与Robotaxi共享同一个数据闭环和模型底座,通过两个应用方向的协同来加速飞轮运转。在2026年北京车展上,Momenta宣布R7强化学习世界模型实现量产首发,CEO曹旭东曾打过一个比方,数据就像贫矿,原始数据只贡献了价值源头的十分之一,剩下的九成来自飞轮的体系能力,其中又包括架构能力和组织能力。目前搭载Momenta系统的量产车辆已超过八十万台,且增速持续加快,飞轮效应的加速趋势正在数据层面得到验证。
从整个行业来看,各家实现路径虽有不同,但底层演进方向高度一致,那就是从模块化架构走向统一的端到端模型,数据闭环的迭代周期从天级向小时级压缩。随着合成数据占比持续提升、全流程自动化工具链逐步部署,行业的核心矛盾正聚焦于长尾场景覆盖与成本控制之间的平衡。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !