描述
在你遇到障碍之前,你必须学习爬行,在你读威廉莎士比亚之前,你需要知道字母表。任何教育工作者都知道掌握任务的分步课程计划的重要性。现在,优步人工智能实验室的研究人员设计了一种算法,该算法提出了自己的课程,用于教授模拟机器人以跨越困难的地形,而不会在他们的不露面的身体上摔倒。该算法有一天甚至可以帮助自动驾驶车辆在紧急情况下作出反应。
这个名为Paired Open-Ended Trailblazer(POET)的新计划首先提出了一系列独特的地形,每个地形都由一个由计算机控制的角色居住。只使用两条腿和一个类似激光的测距仪,角色必须自学走路。经过一段时间的练习,人工智能改变了挑战 - 有时使其更容易,有时更难。它可能使沟渠更宽,树桩更高,或地面更不均匀。偶尔换一个不同的助行器,看看在一个地形上学到的技能是否会对另一个地形有所帮助。这种障碍课程的变异和交换在敏捷的道路上创造了一系列不可预测的踏脚石。
研究人员在本月发布给arXiv的一篇论文中指出,使用POET,机器人步行者最终可以覆盖在没有早期课程的情况下无法学习的困难地形。更重要的是,POET比一个简单地增加地形难度的程序更好,而不需要尝试许多间接路径。POET的迂回学习路线一次又一次得到了回报。在一个例子中,一个机器人蹲下来走路,直到遇到一个有树桩的世界,不得不学会直立行走;它后来又回到了一个平坦的世界,并且一直保持行走,比以前更快地完成了这个过程。
研究人员表示,有一天,POET可以帮助现实生活中的机器人解决许多复杂的任务,甚至让自动驾驶汽车学会处理程序员没有考虑过的课程计划中的紧急情况。在开放式的方式中,POET甚至可以创造和解决从蛋白质合成到诗歌等领域的全新问题。
打开APP阅读更多精彩内容