5 月 24 日,MAXIEYE 面向行业正式发布全新单视觉 L2 解决方案牧童 MonoToGo。
主要亮点是支持 C-NCAP 主动安全五星 + 评分,E-NCAP 主动安全五星评分,数据闭环全场景复现,视频输出集成复用等,致力于以功能加成和成本下探双轮驱动,刷新 L2 产品定义,助力智能驾驶系统规模化量产。
从这段官方的信息中,我们可以概括出几个核心关键词:单视觉,安全,数据闭环,功能加成,成本,规模化量产。
一句话概括就是:这套单视觉 L2 智驾解决方案成本低,又安全,功能多,还支持向高阶辅助驾驶迭代,各大厂商都用得起。
正如 MAXIEYE 所说,这是一套让客户愿意用,用得起的单视觉 L2 解决方案。
那问题来了,市面上做自动驾驶技术供应商的公司不止一家,如 Mobileye、华为、毫末出行、知行科技 Momenta、Minieye、大疆等都是豪强,为什么偏偏 MAXIEYE 搞个单视觉的 L2 都这么出圈,难道其他家做不出来?
还有诸如成本、安全、功能多、规模化量产等都是各大车企和智驾供应商宣传的主打词汇,消费者早就听腻了,结果也是一言难尽,不了了之。
下面聊聊为什么风评不好的单视觉加上 L2 就能让 MAXIEYE 火出圈。
01
自动驾驶是个吞金兽
自动驾驶技术是新能源汽车的核心早已是业内共识,马斯克也说了,以后特斯拉靠 FSD(完全自动驾驶)赚钱,车不赚钱都行。
但这条路走到今天却是一波三折。
2022 年,全球自动驾驶行业刚经历寒冬,裁员、倒闭、部门关裁撤,福特投资的自动驾驶公司 Argo AI 宣布失败,Aurora 股价大跌,市值缩水超过 9 成,就连大名鼎鼎的行业头部公司 Mobileye 估值也从 500 亿美元缩水至 170 亿美元。
资本市场开始对当初投资自动驾驶的热情进行泄火,因为他们已经明白了,自动驾驶技术不可能一步到位,应该走渐进式路线。
比如一步到位的代表性企业 Waymo 估值已经从 1800 亿美元缩水至 300 亿美元,百度创始人李彦宏也改口要走渐进式路线都证明这一点,导致这种现象背后的核心原因有两个:成本和技术。
先说成本
先介绍一下一个自动驾驶项目大概的研发流程,主要包括:
前期的数据采集、数据导入、处理标注分类等;
中期的自动驾驶算法开发训练、仿真测试;
后期的算法布置、实况测试、算法迭代等工作。
有业内人士表示,像这样一个自动驾驶项目整个研发周期大概需要五年,也就是五年时间内,企业必须不断投入人物物力财力,而且期间没有任何商业回报,更不知道最终研发出来的结果能否被市场接受。
这还只是初期理论预算,根据现在各大车企的研发经验可知,在实际研发过程中还会遇到一系列成本失控问题,其中典型代表便是芯片及传感器成本、数据流通成本、数据存储成本和研发成本。
芯片及传感器成本
企业为了车辆能更好的识别路况,给消费者提供良好的智驾体验,会在自家车型上安装各种传感器搭配使用,如摄像头、激光雷达、毫米波雷达,但是这样做的后果就是体验上来了,但成本也跟着大幅增加,其中激光雷达是大头,加起来动辄就是数万元的成本,最终价格便会传导至车型售价上。
另一个便是 AI 芯片,它是算法训练的硬件平台,性能越先进的 AI 芯片,对算法训练的效率越高,比如业内大火的英伟达 AI 芯片 A100,可以让 AI 训练速度提升 20 倍,现在单价已经被炒到 1 万美元,对于中国厂商,本就高昂的价格无形之间又增加了不必要的成本。
数据流通成本
为了尽可能的收集高质量的数据训练算法模型,自动驾驶企业会使用各种传感器,比如摄像头、激光雷达、毫米波雷达等,而且需要对这些不同类型的数据进行大量 AI 标注训练,这就会产生大量的人力成本。
正如上文提到,自动驾驶开发流程包括数据采集、数据导入、预处理、训练、仿真等多个阶段,每个阶段需要的数据类型都不同,处理方式也不同,为了避免混乱和提高效率,行业内的普遍做法就是每个阶段的数据都是单独存储,但这样做不仅没能显著提高效率,反而会造成大量资源内耗。
因为开发人员需要在不同阶段,在不同的存储器之间来回调用、回存数据,有可能还要跨部分写作,就会导致大量时间被浪费,降低开发效率,不要小看每次微小的时间成本,长时间累加在一起效率慢的吓人,小编以前做过开发工作,对此深有体会。
数据存储成本
自动驾驶的核心是算法模型,想要迭代更强的算法模型,就需要海量的高质量数据,因此各大企业每天都会产生大量数据,尤其是自己开发自动驾驶技术的车企,每一辆车每天都会产出海量数据,不管有用没用都要先存储下来,只是一辆车的数据就是以 TB 为单位,数十百万辆车加起来的数据会有多么庞大。
而且现在各大车企都在内卷自动驾驶,市场供需失衡,存储器价格也是一路走高,可想而知背后的存储成本有多么巨大。
根据 2016 年英特尔的估计,每台无人车每天将产生 4000 GB 的数据,按照亚马逊目前的收费标准,存储一年的成本约为 35 万美元(折合人民币约为 244 万元)。
技术研发成本
自动驾驶的研发链条很长,需要的技术也是多种多样,比如各种传感器算法、图像解析、地图处理、激光雷达点云、视频编码、车载系统、大数据处理、芯片技术等,需要跨学科、跨领域合作开发。
新能源汽车是计算机和半导体技术对传统汽车的一次技术变革,因此很多技术已经超出传统车企的业务范畴,这就需要车企重新构建新的研发体系,许多新技术需要招聘大量精英人才,都会造成巨大的成本暴涨。
总结起来就是,一开始行业都低估了开发自动驾驶技术的难度,导致成本失控,一步到位式的路线不可取,从商业角度看,渐进式路线才符合各大车企和供应商的利益,因此业内逐渐形成一个共识,先做好 L2 辅助驾驶,然后逐步迭代至更高级。
02
让人又爱又恨的单视觉
虽然各大厂商决定把目标定在 L2,但自动驾驶基于不同的感知元件,技术路线也不同,大致可分为两派,一是激光雷达,二是纯视觉。
由于激光雷达可通过点云获得对应位置丰富的三维信息,相比其他传感器有明显优势,因此备受车企推崇,如中国各大车企基本都搭载了激光雷达,而且一辆车上还不止一颗,但劣势就在于成本太高。
根据公开信息显示,2022 年,国内激光雷达价格基本在 1000 美元左右。据开源证券分析称,目前单颗激光雷达的成本最高仍有 1 万元,从市面上的车型可以看出,搭载激光雷达的车型价格都居高不下。
因此,各大车企纷纷将关注点转移到了另一个传感器身上,摄像头。
摄像头的成本优势非常明显,目前一颗单目摄像头的价格只有 150 元左右,双目也就 200 元左右,只有激光雷达成本的五分之一。
但摄像头的劣势同样非常明显,比如市面上单目视觉方案,其对物体测距误差很大,需要毫米波雷达或激光雷达数据融合才能消除误差,而且只能获取二维平面信息,且和人眼一样,受到环境因素影响很大,导致很多时候会识别错误。
比如可能会把白色物体误判为天空,把隧道前的栏杆误认为卡车尾部等,或者干脆不识别。
所以搭载视觉智驾方案的车型体验基本都不好,最典型的问题就是 AEB 误触率暴增,所谓 AEB 就是汽车紧急主动刹车系统,如果智驾系统判断遇到紧急情况,汽车便会紧急刹车。
因此目前市面上的单视觉方案汽车会出现很多无缘无故的紧急刹车,也就是网上说的幽灵刹车,更严重的直接撞,大大降低驾驶体验,还会大幅增加事故风险,安全性堪忧,让主机厂又爱又恨。
综上所述,激光雷达优势多但成本高,视觉摄像头成本低但体验差,各大车企既想要单视觉摄像头的成本,又想要良好的 L2 智驾体验,就没个厂家能实现吗。
03
牧童 MonoToGo 单视觉 L2 新方案
上文提到,单视觉 L2 的问题在于 AEB 误触率,核心原因在于样本库中没有足够丰富的样本作为比对,针对此情况,牧童建立了一整套数据回传机制,据介绍,在 1R1V 和单 V 方案市场,MAXIEYE 是唯一一家具备数据回传能力的公司。
也就是说,目前市面上其他的单 V 方案和 1R1V 方案供应商并不具备数据回传能力,不能有效的迭代算法,识别目标。
为什么数据回传机制这么重要?
这里要解释一下单视觉方案的识别物体的过程,当遇到障碍物时,车辆会先通过样本库中的样本与摄像头看到的图像进行比对,如果能够识别,才会根据图像大小计算与车辆的距离,接着进行后续判断。
换言之,如果车辆不能先识别前方物体,那后面也计算不出来车辆与障碍物的距离,结果就是车辆直接撞上去,如果是识别错了,就会出现幽灵刹车。
牧童的单视觉 L2 方案可以通过数据回传机制把由于缺少毫米波雷达校验所产生的 AEB 误触数据全部回传回来,用于之后的数据训练和算法迭代。
除了数据回传机制,MAXIEYE 还设计了算法冗余,通过多种不同的算法对目标进行检测,不同的算法的原理和检测特征完全不同,可以相互校验。
比如对一个行人进行监测,一套算法检测整体轮廓,另一套算法检测局部特征,如关节、面部等,相互验证得出结论。
为了训练这套系统,MAXI 还要求芯片必须支持 H.264 视频编码,因为需要更高质量的图像和视频录制,为后续向高阶辅助驾驶提供了迭代空间,这都是市面上同等方案不具备的能力。
04
高阶辅助驾驶迭代
一套具备数据回传机制的单视觉 L2 智驾方案会有怎样的想象空间?
车企可以联合智驾供应商一起针对某个具体场景设计触发机制,提供基于触发机制的数据回传,还原事发场景。
比如安全气囊,可以将安全气囊起爆前后一段时间进行数据回传,帮助车企优化气囊起爆点设计。
由于高阶辅助驾驶包括上下匝道、各种路口等,车企还可以针对各种路口、匝道设计触发机制,将过路口、匝道前后一段时间的视频进行数据回传。
MAXIEYE 还在云端准备了一套 VSLAM 和地图重构算法,可将单 V 视频用 VSLAM 的方式创建整个道路拓扑,可以作为地图真值用来迭代高阶辅助驾驶,而市面上其他同类方案都不具备此能力,意味着它们的车都是在放养,只会一直差下去。
写在最后
从目前行业发展看,单视觉 L2 方案是进入智能驾驶领域性价比最高的入场券,而牧童 MonoToGo 单视觉 L2 再次刷新同类方案产品力上限,不仅成本低,而且具备完善的数据回传机制,扩大了 L2 功能边界,还可以做场景出发,将数据回传支持后续迭代,为以后高阶驾驶打下基础。
对于消费者,感受到的是功能更多、更安全、更适用,获得 CNCAP 五星评分的单视觉 L2 智驾系统的良好体验。
全部0条评论
快来发表一下你的评论吧 !