MAXIEYE面向行业正式发布全新单视觉L2解决方案牧童MonoToGo

焉知新能源汽车 2023-06-06 1191

描述

5 月 24 日，MAXIEYE 面向行业正式发布全新单视觉 L2 解决方案牧童 MonoToGo。

主要亮点是支持 C-NCAP 主动安全五星 + 评分，E-NCAP 主动安全五星评分，数据闭环全场景复现，视频输出集成复用等，致力于以功能加成和成本下探双轮驱动，刷新 L2 产品定义，助力智能驾驶系统规模化量产。

从这段官方的信息中，我们可以概括出几个核心关键词：单视觉，安全，数据闭环，功能加成，成本，规模化量产。

一句话概括就是：这套单视觉 L2 智驾解决方案成本低，又安全，功能多，还支持向高阶辅助驾驶迭代，各大厂商都用得起。

正如 MAXIEYE 所说，这是一套让客户愿意用，用得起的单视觉 L2 解决方案。

那问题来了，市面上做自动驾驶技术供应商的公司不止一家，如 Mobileye、华为、毫末出行、知行科技 Momenta、Minieye、大疆等都是豪强，为什么偏偏 MAXIEYE 搞个单视觉的 L2 都这么出圈，难道其他家做不出来？

还有诸如成本、安全、功能多、规模化量产等都是各大车企和智驾供应商宣传的主打词汇，消费者早就听腻了，结果也是一言难尽，不了了之。

下面聊聊为什么风评不好的单视觉加上 L2 就能让 MAXIEYE 火出圈。

自动驾驶是个吞金兽

自动驾驶技术是新能源汽车的核心早已是业内共识，马斯克也说了，以后特斯拉靠 FSD（完全自动驾驶）赚钱，车不赚钱都行。

但这条路走到今天却是一波三折。

2022 年，全球自动驾驶行业刚经历寒冬，裁员、倒闭、部门关裁撤，福特投资的自动驾驶公司 Argo AI 宣布失败，Aurora 股价大跌，市值缩水超过 9 成，就连大名鼎鼎的行业头部公司 Mobileye 估值也从 500 亿美元缩水至 170 亿美元。

资本市场开始对当初投资自动驾驶的热情进行泄火，因为他们已经明白了，自动驾驶技术不可能一步到位，应该走渐进式路线。

比如一步到位的代表性企业 Waymo 估值已经从 1800 亿美元缩水至 300 亿美元，百度创始人李彦宏也改口要走渐进式路线都证明这一点，导致这种现象背后的核心原因有两个：成本和技术。

先说成本

先介绍一下一个自动驾驶项目大概的研发流程，主要包括：

前期的数据采集、数据导入、处理标注分类等；

中期的自动驾驶算法开发训练、仿真测试；

后期的算法布置、实况测试、算法迭代等工作。

有业内人士表示，像这样一个自动驾驶项目整个研发周期大概需要五年，也就是五年时间内，企业必须不断投入人物物力财力，而且期间没有任何商业回报，更不知道最终研发出来的结果能否被市场接受。

这还只是初期理论预算，根据现在各大车企的研发经验可知，在实际研发过程中还会遇到一系列成本失控问题，其中典型代表便是芯片及传感器成本、数据流通成本、数据存储成本和研发成本。

芯片及传感器成本

企业为了车辆能更好的识别路况，给消费者提供良好的智驾体验，会在自家车型上安装各种传感器搭配使用，如摄像头、激光雷达、毫米波雷达，但是这样做的后果就是体验上来了，但成本也跟着大幅增加，其中激光雷达是大头，加起来动辄就是数万元的成本，最终价格便会传导至车型售价上。

另一个便是 AI 芯片，它是算法训练的硬件平台，性能越先进的 AI 芯片，对算法训练的效率越高，比如业内大火的英伟达 AI 芯片 A100，可以让 AI 训练速度提升 20 倍，现在单价已经被炒到 1 万美元，对于中国厂商，本就高昂的价格无形之间又增加了不必要的成本。

数据流通成本

为了尽可能的收集高质量的数据训练算法模型，自动驾驶企业会使用各种传感器，比如摄像头、激光雷达、毫米波雷达等，而且需要对这些不同类型的数据进行大量 AI 标注训练，这就会产生大量的人力成本。

正如上文提到，自动驾驶开发流程包括数据采集、数据导入、预处理、训练、仿真等多个阶段，每个阶段需要的数据类型都不同，处理方式也不同，为了避免混乱和提高效率，行业内的普遍做法就是每个阶段的数据都是单独存储，但这样做不仅没能显著提高效率，反而会造成大量资源内耗。

因为开发人员需要在不同阶段，在不同的存储器之间来回调用、回存数据，有可能还要跨部分写作，就会导致大量时间被浪费，降低开发效率，不要小看每次微小的时间成本，长时间累加在一起效率慢的吓人，小编以前做过开发工作，对此深有体会。

数据存储成本

自动驾驶的核心是算法模型，想要迭代更强的算法模型，就需要海量的高质量数据，因此各大企业每天都会产生大量数据，尤其是自己开发自动驾驶技术的车企，每一辆车每天都会产出海量数据，不管有用没用都要先存储下来，只是一辆车的数据就是以 TB 为单位，数十百万辆车加起来的数据会有多么庞大。

而且现在各大车企都在内卷自动驾驶，市场供需失衡，存储器价格也是一路走高，可想而知背后的存储成本有多么巨大。

根据 2016 年英特尔的估计，每台无人车每天将产生 4000 GB 的数据，按照亚马逊目前的收费标准，存储一年的成本约为 35 万美元（折合人民币约为 244 万元）。

技术研发成本

自动驾驶的研发链条很长，需要的技术也是多种多样，比如各种传感器算法、图像解析、地图处理、激光雷达点云、视频编码、车载系统、大数据处理、芯片技术等，需要跨学科、跨领域合作开发。

新能源汽车是计算机和半导体技术对传统汽车的一次技术变革，因此很多技术已经超出传统车企的业务范畴，这就需要车企重新构建新的研发体系，许多新技术需要招聘大量精英人才，都会造成巨大的成本暴涨。

总结起来就是，一开始行业都低估了开发自动驾驶技术的难度，导致成本失控，一步到位式的路线不可取，从商业角度看，渐进式路线才符合各大车企和供应商的利益，因此业内逐渐形成一个共识，先做好 L2 辅助驾驶，然后逐步迭代至更高级。

让人又爱又恨的单视觉

虽然各大厂商决定把目标定在 L2，但自动驾驶基于不同的感知元件，技术路线也不同，大致可分为两派，一是激光雷达，二是纯视觉。

由于激光雷达可通过点云获得对应位置丰富的三维信息，相比其他传感器有明显优势，因此备受车企推崇，如中国各大车企基本都搭载了激光雷达，而且一辆车上还不止一颗，但劣势就在于成本太高。

根据公开信息显示，2022 年，国内激光雷达价格基本在 1000 美元左右。据开源证券分析称，目前单颗激光雷达的成本最高仍有 1 万元，从市面上的车型可以看出，搭载激光雷达的车型价格都居高不下。

因此，各大车企纷纷将关注点转移到了另一个传感器身上，摄像头。

摄像头的成本优势非常明显，目前一颗单目摄像头的价格只有 150 元左右，双目也就 200 元左右，只有激光雷达成本的五分之一。

但摄像头的劣势同样非常明显，比如市面上单目视觉方案，其对物体测距误差很大，需要毫米波雷达或激光雷达数据融合才能消除误差，而且只能获取二维平面信息，且和人眼一样，受到环境因素影响很大，导致很多时候会识别错误。

比如可能会把白色物体误判为天空，把隧道前的栏杆误认为卡车尾部等，或者干脆不识别。

所以搭载视觉智驾方案的车型体验基本都不好，最典型的问题就是 AEB 误触率暴增，所谓 AEB 就是汽车紧急主动刹车系统，如果智驾系统判断遇到紧急情况，汽车便会紧急刹车。

因此目前市面上的单视觉方案汽车会出现很多无缘无故的紧急刹车，也就是网上说的幽灵刹车，更严重的直接撞，大大降低驾驶体验，还会大幅增加事故风险，安全性堪忧，让主机厂又爱又恨。

综上所述，激光雷达优势多但成本高，视觉摄像头成本低但体验差，各大车企既想要单视觉摄像头的成本，又想要良好的 L2 智驾体验，就没个厂家能实现吗。

牧童 MonoToGo 单视觉 L2 新方案

上文提到，单视觉 L2 的问题在于 AEB 误触率，核心原因在于样本库中没有足够丰富的样本作为比对，针对此情况，牧童建立了一整套数据回传机制，据介绍，在 1R1V 和单 V 方案市场，MAXIEYE 是唯一一家具备数据回传能力的公司。

也就是说，目前市面上其他的单 V 方案和 1R1V 方案供应商并不具备数据回传能力，不能有效的迭代算法，识别目标。

为什么数据回传机制这么重要？

这里要解释一下单视觉方案的识别物体的过程，当遇到障碍物时，车辆会先通过样本库中的样本与摄像头看到的图像进行比对，如果能够识别，才会根据图像大小计算与车辆的距离，接着进行后续判断。

换言之，如果车辆不能先识别前方物体，那后面也计算不出来车辆与障碍物的距离，结果就是车辆直接撞上去，如果是识别错了，就会出现幽灵刹车。

牧童的单视觉 L2 方案可以通过数据回传机制把由于缺少毫米波雷达校验所产生的 AEB 误触数据全部回传回来，用于之后的数据训练和算法迭代。

除了数据回传机制，MAXIEYE 还设计了算法冗余，通过多种不同的算法对目标进行检测，不同的算法的原理和检测特征完全不同，可以相互校验。

比如对一个行人进行监测，一套算法检测整体轮廓，另一套算法检测局部特征，如关节、面部等，相互验证得出结论。

为了训练这套系统，MAXI 还要求芯片必须支持 H.264 视频编码，因为需要更高质量的图像和视频录制，为后续向高阶辅助驾驶提供了迭代空间，这都是市面上同等方案不具备的能力。

高阶辅助驾驶迭代

一套具备数据回传机制的单视觉 L2 智驾方案会有怎样的想象空间？

车企可以联合智驾供应商一起针对某个具体场景设计触发机制，提供基于触发机制的数据回传，还原事发场景。

比如安全气囊，可以将安全气囊起爆前后一段时间进行数据回传，帮助车企优化气囊起爆点设计。

由于高阶辅助驾驶包括上下匝道、各种路口等，车企还可以针对各种路口、匝道设计触发机制，将过路口、匝道前后一段时间的视频进行数据回传。

MAXIEYE 还在云端准备了一套 VSLAM 和地图重构算法，可将单 V 视频用 VSLAM 的方式创建整个道路拓扑，可以作为地图真值用来迭代高阶辅助驾驶，而市面上其他同类方案都不具备此能力，意味着它们的车都是在放养，只会一直差下去。

写在最后

从目前行业发展看，单视觉 L2 方案是进入智能驾驶领域性价比最高的入场券，而牧童 MonoToGo 单视觉 L2 再次刷新同类方案产品力上限，不仅成本低，而且具备完善的数据回传机制，扩大了 L2 功能边界，还可以做场景出发，将数据回传支持后续迭代，为以后高阶驾驶打下基础。

对于消费者，感受到的是功能更多、更安全、更适用，获得 CNCAP 五星评分的单视觉 L2 智驾系统的良好体验。

打开APP阅读更多精彩内容