一种人工智能驾驶系统培训的方法,该方法以监督的方式利用标记的数据

描述

Waymo毫无疑问是全球目前唯一一家取得多个自动驾驶里程碑的公司,截止今年8月份其路测里程超过了1000万英里,上周推出了商业无人驾驶出租车服务Waymo One。

现在,Waymo还在不断挑战未来。

在今天发表的一篇博文中,Waymo研究人员Mayank Bansal和Abhijit Ogale详细描述了一种人工智能驾驶系统培训的方法,该方法以监督的方式利用标记的数据。

近年来,使用大量标记数据对深层神经网络进行有监督的训练,在很多领域,特别是在物体感知和预测领域,已经迅速改进了最新技术,而且这些技术在Waymo得到了广泛的应用。

凭借感知能力,汽车可以使用相机和其他传感器检测前面的车辆,识别它们是否成为潜在危险,并知道连续跟踪它们的运动。这种能力扩展到车辆周围的360度区域,使得车辆能够在行驶时检测和跟踪所有移动和静态物体。

感知是自动驾驶汽车安全运行的第一阶段。一旦车辆能够从周围环境提取相关数据,它就能够规划前进的路径。

为了满足自动驾驶的复杂感知需求,Waymo独立开发了一系列感知传感器,实现了车辆360°监控,包括:激光雷达、视觉系统、雷达系统以及其他传感器。

目前,Waymo搭载的激光雷达有三种类型,短距监控车辆周边环境;中距高分辨率;远距激光雷达。

视觉系统由多组高分辨率相机组成,在白天和光线较暗的地方也能很好地工作。定制化的雷达系统具有连续360°的视野,可以跟踪在本车前后左右不同方位的其他车辆。

现在,上述研究人员表示,“随着神经网络用于感知的成功,我们自然地问自己这样一个问题:……我们能否用纯监督的深度学习方法来训练熟练的驾驶系统?”

为了建立一个能够模仿专家驾驶员的系统,他们精心设计了一个神经网络,叫做ChauffeurNet,通过观察真实和模拟数据的组合,包括地图、周围物体、红绿灯,学习生成驾驶轨迹。

低级控制器将10点轨迹转换为转向和加速度指令,允许AI模型同时驱动真实车和数字车。

这个模型来自于“大约60天的专家驾驶数据”,使用技术确保它不会从过去的运动中推断出来,而是对环境的变化做出实际反应。在测试中,它响应交通控制,如停止标志和交通灯,但可以预见,当暴露于从未见过的情况时,性能很差。

研究人员指出,问题在于从现实驾驶中获得的驾驶演示是有偏见的——它们只包含了在良好情况下驾驶的例子。为了训练深度神经网络从边缘案例中学习,研究小组综合了很多车辆接近与物体碰撞的案例,从而与人工智能模型进行配对。

目前,ChauffeurNet在模拟环境中表现得更好,比如在交通灯从黄色过渡到红色时停止,并且从其轨迹的微小偏差中恢复。当用于在现实世界的路测时,它也能成功地遵循车道标志和转弯。

ChauffeurNet的目标是通过模拟学习来训练一种自主驾驶策略,这种策略足够健壮,可以驾驶真正的车辆。但问题是标准的行为克隆不足以处理复杂的驾驶场景,即使利用感知系统对输入进行预处理,并利用控制器在汽车上执行输出,但3000万个例子仍然不够。

但研究人员认为,完全自主的驾驶系统需要能够处理现实世界中出现的长尾情况。今天在Waymo车辆上运行的规划系统使用机器学习和显式推理的组合来持续地评估大量的可能性,并在各种不同的场景下做出最佳的驾驶决策。

不过,最终对于完全机器学习的系统来替换Waymo现在使用的规划器(目前Waymo的软件系统由很多不同的部分组成,主要包括三大组件:感知、行为预测和规划器)的标准非常高,这样的系统组件可以暂时在Waymo规划器的模拟测试期间用于创建更现实的“智能代理”。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分