全局思考，无人驾驶冠军亲述算法经验

电子工程师 2018-12-25 2954

电子说

1.3w人已加入

描述

视觉是无人驾驶汽车的勘探物理世界的非常重要的“器官”。在它背后，考验的则是机器算法能力。

无人驾驶技术的算法包括感知、定位、预测、决策、控制等层面，而在由创新工场、搜狗、美团点评、美图公司联合主办的 AI Challenger 2018 全球 AI 挑战赛中，无人驾驶赛道的题目就是最基础的视觉感知，所有参赛队伍需要解决如何通过视觉传感器看到的数据，来感知判断出障碍物、路标、汽车限速以及红绿灯等维度的问题。

在近日的总决赛颁奖礼上，美团点评首席科学家夏华夏称，由于视觉感知有上述诸多不同的识别维度，那在工程层面不可能对每项任务都做一个模型出来，最好的方案是由一个模型可以同时用视觉信号找到多种识别目标，但这并不容易。

根据大赛规定，此次自动驾驶赛道的评判标准分为两部分，一是准确度，二是速度，后者在实验室研究中很容易忽略，更具体来说，在测试和实际运行时，很少有参赛队伍在比赛前考虑能否实现实时性检测的问题。体现在算法上，关键的是要平衡算法执行效率和性能。

在历时 3 个多月，经过数轮比赛角逐后，来自中科院自动化所 SeeLess 团队最终斩获了这一赛道的冠军。那么，他们是如何让算法发挥了最佳效果？

首先在数据上，主办方给无人驾驶的赛道数据量约 1.2 亿张，其中 10 万张属于标注数据。冠军成员中的博士研究生赵旭在接受 AI科技大本营采访时称，标注数据中大约有 7 万张是优质数据，他们验证了 1 万张图片数据，2 万张在测试时使用，剩下的则是未标注数据，他们用了自动化方法来处理这些数据。赵旭认为，庞大的数据量对训练算法性能非常重要。

而在算法层面，执行效率分为两部分：算法实现复杂度和工程实现的优化。基于此，他们同时做了几个方案，另一冠军成员朱优松在颁奖礼上举例称，就车道线行驶区域的判别以及道路上的物体检测两大任务，他们使用了同一模型来实现，以降低算法实现的复杂度，同时他们把神经网络进行压缩，并使用了“老师教学生（大模型教小模型）”的方法。

而工程实现上他们注重细节，不断调整优化，比如就可行驶道路区域分割问题，仅使用底层的计算机视觉特征并不足够，他们还因此引入了一些全局特征，此外还将 GPU 并行做到极致，如此才达到了很好的效果。

“全局思考”是赵旭对这次比赛的经验性总结，当然，基础研究更要考虑工程实践具体情况的观点也尤为重要。

创新工场人工智能工程院执行院长王咏刚评价 SeeLess 团队的成绩时表示，他们在保持识别精度的同时识别性能也远超其他团队，在算法和工程的结合度上远超预计，这代表未来不同的硬件平台都可以利用先进的无人驾驶技术。

不过，视觉感知只是做无人驾驶的一个切面，要做好它需要考虑对技术栈的综合应用，这包括很多软硬件的能力。美团点评首席科学家、无人配送部总经理夏华夏认为，全场景下的无人驾驶技术应用还有很远的距离，感知、定位、预测、规划、控制每一方面都极具挑战，如果要预估什么时候人们能普遍做上无人驾驶汽车，“十年之后”是他给出的一个非常乐观的期限。

打开APP阅读更多精彩内容