去年年底,波士顿动力发布的机器人组团载歌载舞贺新年的视频赚足了全球观众的眼球。这几天,江西图书馆两个斗嘴机器人也迅速圈了一批粉。今天,我们来瞧瞧“绝影”机器狗get到的新功夫:无论推倒我还是踢翻我,我都能自己学着站起来。
人类在面对从未遇到的新情况时,可以本能地切换不同的技能来进行尝试和应对,但对机器人来说却是一项不小的挑战。波士顿动力的机器人虽然舞技超人,但还都是基于预先设定好的程序,一旦超出预定程序以外很难做到随机应变。
据《科学·机器人》杂志报道,浙江大学和爱丁堡大学的联合研究团队开发出了一套新的人工智能(AI)加强式学习方案。它能利用所谓的多专家学习架构(MELA),让浙大的“绝影”机器狗掌握自行应对陌生情况的技能。
研究人员从培训可以指导虚拟机器狗的软件开始。他们开发了具有8种算法“专家”的学习体系,可以帮助机器狗产生复杂的行为。对于每种方式,都使用深度神经网络来训练机器狗的计算机模型以实现一个特定技能,这八项技能包括:站立平衡、大步小跑、左转、姿势控制、摔倒后翻正、小步小跑、侧滚和右转。
如果虚拟机器人的尝试更接近目标,它将获得一次数字奖励;如果它做得不太理想,就给它记上一次数字过失。这个过程被称为强化学习。经过许多次这样的尝试后,模拟机器人就成为了某项技能的专家。 一旦对8位算法“专家”进行了培训,“他们”就需要学习团队合作。研究人员将它们组合成一个总体网络,以充当教练或队长的角色。
这使机器人的人造大脑可以利用每位“专家”的知识——如何奔跑,转身或正确站立。研究人员解释说,教练或队长会告诉谁做什么,或者谁和谁应该一起工作。所有“专家”都可以在一个团队中一起协作,从而大大提高了技能的能力。例如,当机器人跌倒并需要恢复时,系统可以检测到该运动并唤醒负责平衡的“专家”。
如动图所示,8位“专家”相对应的数据条会显示在屏幕左上角。当虚拟机器人在模拟环境中移动,追逐浮动的绿球时,网络会根据特定时刻所需的技能来调高或调低每个“专家”的专业技能的影响力。
然后,研究人员可以将数字机器人在模拟中学到的东西移植到现实世界中的机器人大脑中。在上面的动图中,机器狗大脑中的“教练”正在与AI专家进行协调,以帮助机器狗在滑过石子路时保持其立足点。当专业人员用棍子推倒“绝影”时,机器狗在原地重新站立了起来。对任何环境下的四足机器人来说,这都是非凡的能力,更不用说是需要行走在石子路上的机器人了。
当然,研究人员并不满足于让机器狗轻松过关,他们甚至还抓住机器狗头部的手柄,将它摔个脸着地。但每次这只机器狗都会重新站起来。这并不是因为研究人员编写了针对这种特殊攻击类型的反应代码,而是因为“绝影”现在已学会了就其行为策略咨询它的AI专家。当研究人员让机器人在光滑的表面或草地上而不是石子路上行走时,它也适应了这种情况。
这项研究的总体思路是使机器人学习步态的方式与人类幼儿类似。对机器人运动进行编码的传统方法是在机器上加载有关现实世界工作原理的假设。例如,脚如何以不同的方式在硬木地板和地毯上踩稳,并逐点给出指令。但是想象一下,你告诉一个小孩:要爬上楼梯,就必须这样移动胳膊和腿,他们根本不会听你的。他们会通过各种试错来学会如何行动。他们必须通过体验,来学会在不同场景下如何调整其运动方式。
同样,一台机器人不能仅通过遵循脚本来适应环境,因为现实世界中的环境极其复杂。研究人员表示,“所有预设在您进入野外时都会被彻底打破,因为您没有关于此环境的完整信息。” 因此,解决方案是让“绝影”机器狗像人类一样学习,使其能够实时组合其灵巧和自适应的技能,来处理它从未见过的各种不同任务。
责任编辑:xj
原文标题:“绝影”机器狗学会新功夫:人类再也弄不翻我了
文章出处:【微信公众号:天津机器人】欢迎添加关注!文章转载请注明出处。
全部0条评论
快来发表一下你的评论吧 !