电子说
视觉是无人驾驶汽车的勘探物理世界的非常重要的“器官”。在它背后,考验的则是机器算法能力。
无人驾驶技术的算法包括感知、定位、预测、决策、控制等层面,而在由创新工场、搜狗、美团点评、美图公司联合主办的 AI Challenger 2018 全球 AI 挑战赛中,无人驾驶赛道的题目就是最基础的视觉感知,所有参赛队伍需要解决如何通过视觉传感器看到的数据,来感知判断出障碍物、路标、汽车限速以及红绿灯等维度的问题。
在近日的总决赛颁奖礼上,美团点评首席科学家夏华夏称,由于视觉感知有上述诸多不同的识别维度,那在工程层面不可能对每项任务都做一个模型出来,最好的方案是由一个模型可以同时用视觉信号找到多种识别目标,但这并不容易。
根据大赛规定,此次自动驾驶赛道的评判标准分为两部分,一是准确度,二是速度,后者在实验室研究中很容易忽略,更具体来说,在测试和实际运行时,很少有参赛队伍在比赛前考虑能否实现实时性检测的问题。体现在算法上,关键的是要平衡算法执行效率和性能。
在历时 3 个多月,经过数轮比赛角逐后,来自中科院自动化所 SeeLess 团队最终斩获了这一赛道的冠军。那么,他们是如何让算法发挥了最佳效果?
首先在数据上,主办方给无人驾驶的赛道数据量约 1.2 亿张,其中 10 万张属于标注数据。冠军成员中的博士研究生赵旭在接受 AI科技大本营采访时称,标注数据中大约有 7 万张是优质数据,他们验证了 1 万张图片数据,2 万张在测试时使用,剩下的则是未标注数据,他们用了自动化方法来处理这些数据。赵旭认为,庞大的数据量对训练算法性能非常重要。
而在算法层面,执行效率分为两部分:算法实现复杂度和工程实现的优化。基于此,他们同时做了几个方案,另一冠军成员朱优松在颁奖礼上举例称,就车道线行驶区域的判别以及道路上的物体检测两大任务,他们使用了同一模型来实现,以降低算法实现的复杂度,同时他们把神经网络进行压缩,并使用了“老师教学生(大模型教小模型)”的方法。
而工程实现上他们注重细节,不断调整优化,比如就可行驶道路区域分割问题,仅使用底层的计算机视觉特征并不足够,他们还因此引入了一些全局特征,此外还将 GPU 并行做到极致,如此才达到了很好的效果。
“全局思考”是赵旭对这次比赛的经验性总结,当然,基础研究更要考虑工程实践具体情况的观点也尤为重要。
创新工场人工智能工程院执行院长王咏刚评价 SeeLess 团队的成绩时表示,他们在保持识别精度的同时识别性能也远超其他团队,在算法和工程的结合度上远超预计,这代表未来不同的硬件平台都可以利用先进的无人驾驶技术。
不过,视觉感知只是做无人驾驶的一个切面,要做好它需要考虑对技术栈的综合应用,这包括很多软硬件的能力。美团点评首席科学家、无人配送部总经理夏华夏认为,全场景下的无人驾驶技术应用还有很远的距离,感知、定位、预测、规划、控制每一方面都极具挑战,如果要预估什么时候人们能普遍做上无人驾驶汽车,“十年之后”是他给出的一个非常乐观的期限。
全部0条评论
快来发表一下你的评论吧 !