禾多科技如何利用数据加速自动驾驶算法迭代

描述

随着自动驾驶迈入量产时代,「数据驱动」成为一个热门话题——无论是汽车厂商还是科技公司,在介绍新技术和新产品时,都常常将累计行驶里程和运行时间作为优势亮点。大家时常会听到类似「行驶里程突破千万公里、系统学习突破数十万小时,相当于人类驾龄数万年」的表述。

回归现实,乘用车自动驾驶能力依然处于辅助驾驶的阶段,经历着从高速、泊车到最复杂的城区场景逐步覆盖的进程。理论上已经「学车数万年」的AI,仍然无法完全代替人类驾驶员。

自动驾驶是数据驱动的技术,环境感知、精准定位、路径规划等模块能力都构筑在坚实的数据基础之上。而累计海量数据仅仅是最基础的一步,更复杂也更困难的地方在于如何高效利用回传数据,促进系统技术架构迭代升级。

与此同时,量产落地后海量并发的数据风暴,对创新公司的技术研发能力也带来了诸多挑战:

海量数据,算力压力大:无论是研发测试车辆还是搭载自动驾驶系统的量产车,每天产生的数据量都能达到TB级别。同时,随着传感器数量和图像分辨率增加,算法模型日趋复杂,对数据处理的算力压力也水涨船高。

数据庞杂,处理难度大:自动驾驶研发数据来源多样,有车辆数据、位置数据、环境感知数据、应用数据、个人数据等等,如何对数据进行精准化的筛选、提炼、统计和分析成为难点。此外,数据类型涉及结构化数据和非结构化数据,数据服务类型又涵盖文件、对象等等,导致不同业务对存储接口、协议访问的需求多样化,因此统一标准、提升不同研发任务的协同效率也是困难重重。

数据安全难度大:数据安全是伴随着我国自动驾驶技术创新同步出现的全新课题。自动驾驶汽车涉及的用户隐私数据、国家地理信息等等敏感信息如何安全管控和保护已经成为了全行业共同探索的问题。

总之,如何高效利用和安全处理量产回传数据对技术研发提出了更高的要求。在大数据的基础上,形成完整的数据闭环,才能够对数据进行快速有效挖掘,促进AI算法迭代升级。

禾多科技自动驾驶系统从去年开始在广汽等知名汽车厂商车型上量产搭载。对此,禾多科技基于完全自研工具链,形成从数据采集、数据仿真到场景库搭建、系统测试的完整闭环,打通了基于数据驱动的自动驾驶系统升级闭环链路。

在这背后,禾多研发小伙伴们做了大量的工作,涉及数据采集/回传、数据存储、数据预处理、数据挖掘、数据标注、测试验证等等一系列不同模块,内容纷繁复杂。本期「有禾不可」就选择其中四个亮点维度,见微知著,为大家介绍禾多科技如何通过数据闭环让数据得到更高效的处理和更安全的使用。

数据回传 搭积木式灵活配置量产数据回传功能

为了从海量、复杂的数据中提取真正有用的数据,解决自动驾驶长尾问题,数据场景化是必不可少的一步。场景是数据需求的基本单位,场景化是数据打通的中枢环节,能否有足够强的场景提取的能力,将是一家自动驾驶公司的重要技术壁垒。

在实际量产项目中,禾多科技负责车端数据回传技术的开发。为了满足不同主机厂客户实际需求,禾多科技提供了「积木式」配置方式:将场景识别的条件抽象成可配置的内容,一方面可以满足算法在不同时期对于数据挖掘的动态变化的需求,另一方面也方便程序的升级迭代。

此外,为了充分利用数据,禾多科技在算法端不断优化迭代,灵活选择最优数据进行计算,对场景进行更精准定义和挖掘。同时,通过充分利用多信息融合方式,基于明确的系统异常表现和信息之间的明显差异,利用算法自动挖掘极端场景和异常场景。

算法

通过这种「搭积木」的场景库配置方式,禾多科技的数据挖掘在量的基础上实现了质的突破。

数据生产 统一标签体系

自动驾驶作为一项新兴技术,其研发过程一直面临着「缺乏统一标准」的困扰。

一方面,除了感知模块作为典型的数据驱动技术为大家熟知以外,包括决策、规划、控制、定位、地图等模块也都广泛依赖数据的补给。不同的模块需要一套共同语言能够保证前后互通。

另一方面,完整的研发生命涵盖需求定义、算法实现、测试用例、bug提交、数据采集、结果评测等阶段,每个阶段之间也需要一套共同语言能够保证上下流转。

这套语言就是我们常说的标签。标签体系不统一,就会导致不同模块之间、不同阶段之间的输入输出重叠或不一致,产生「重复造轮子」的问题。

禾多科技自身定位为自动驾驶解决方案公司,需要为主机厂客户提供多模块、全流程的研发服务。在这个过程中,禾多科技基于OpenX标准和量产项目中总结的经验,创造性地构造了统一的标签体系——在广度上统一了不同模块对于数据的挖掘需求,从深度上统一了不同阶段对于数据的分级需求,保证各个模块和流程之间实现标签对齐以及场景一致,显著提高了沟通效率、减少了数据生产过程中的浪费。

仿真测试 贯穿研发测试生命周期

自动驾驶汽车需要经历大量的道路测试才能量产上市。仅仅依靠路测来优化自动驾驶算法耗费的时间和成本太高,且面临着法规限制多、极端交通条件难以创造、场景复现困难和安全风险高等问题。因此,基于场景库的仿真测试是系统验证中的重要环节。

结合实际量产项目开发和测试环节的需求,禾多科技完全自主研发了集「可视化、场景、仿真、评测」功能于一体的综合性验证平台HoloX,支持在高精地图基础上搭建贴近真实道路的仿真场景。更重要的是,HoloX的仿真能力不仅用到传统的SIL、PIL和HIL测试中,还直接在车端应用,实现了高效的车辆在环(VIL)测试,极大提高了系统集成的效率、安全性和极端场景的测试覆盖度。

除此之外,HoloX可以为感知训练提供有效的视觉数据且自动完成标注,既可以对实车数据采集提供有力补充,减少实车数据采集所需的人力和物力,还可以在虚拟场景下还原真实世界中难以遇到的场景,提高场景覆盖度。

算法

停车场环视相机数据仿真

算法

行车场景环视相机感知仿真

算法

泊车场景后视相机障碍物感知仿真  

作为随着研发需求而诞生工具,HoloX还伴随着禾多科技量产项目的进展而不断升级迭代,提供更完善的仿真测试能力。

量产数据应用 云端全管理

除了研发端通常关注的数据处理效率问题,如何保障隐私和敏感数据的安全也是科技创新公司如今需要考虑的问题。

对此,禾多科技将此前应用于本地的数据闭环推到云端,打造完整了云端工具链。通过这种方式,将各种数据进行分类上传、分类管理,在云端完成数据全生命周期处理,通过统一的接口权限,保障数据安全,规避数据泄露风险。

数据越多,算法越强的道理看似简单,但仅仅只靠「堆数据」是远远不够的。如何更加高效地筛选真正有用的数据来反哺算法才是更加关键的一步。与此同时,海量的数据如何安全合规地运用,也是研发过程中不能忽视的问题。

在技术落地层面,禾多科技正与多家中国头部大型汽车集团携手,推动自动驾驶系统规模化量产:于2021年与广汽集团达成「产融联合」合作关系后,禾多科技与广汽研究院携手,为广汽乘用车型平台提供自动驾驶开发服务。目前已通过搭载3颗第二代激光雷达的AION LX Plus车型实现了NDA智能辅助驾驶的落地,并为去年上市的广汽传祺影酷车型提供了高阶自动泊车技术。在2023年,还会有多款不同厂商的新产品搭载禾多自动驾驶系统量产上市。

面对量产之后海量并发的数据风暴,禾多科技已经做好了准备,以上内容仅仅是禾多数据闭环亮点的冰山一角。随着今年系统量产工作的稳步推进,禾多数据闭环能力也将在逐步升级,后续的「有禾不可」将进行更详细的介绍。

在迈向完全无人驾驶的终极目标的道路上,禾多科技数据闭环正加速向前!

审核编辑 :李倩

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分