电子说
叠叠乐是一款家喻户晓的娱乐游戏。近期,MIT的研究人员发明了一款机器手,可以通过视觉和触觉,毫无压力的玩转这款游戏。而这项研究的方法,有望推广到其它类似任务的领域中。
在MIT3号楼的地下室,一个机器人正在小心翼翼的玩着“层层叠”游戏。
这个游戏想必大家或多或少都有所接触。简单来说就是在保证积木不倒的情况下,从底部抽取木条,再堆到顶部。会有一种“釜底抽薪”的感觉。
而这个游戏对于这个机器人来说可以说是毫无压力。
从视觉、触觉出发,快速学习执行任务最佳方式
该机器人由MIT的工程师开发,配备了一个软齿状夹持器、一个力感应腕带和一个外部摄像头。可以说是从视觉和触觉两个方面协同合作来完成任务。
当机器人小心地推一块积木时,电脑从它的摄像头和腕带接收视觉和触觉的反馈,并将这些测量值与机器人之前的动作进行比较。
它还考虑了这些移动的结果——具体来说,就是考虑是否成功地提取了具有特定配置并以一定力量推动的积木。在实时情况下,机器人会“学习”是继续推还是移动到一个新的区域,以防止积木倒塌。
MIT机械工程系理教授Alberto Rodriguez表示,机器人展示了以前系统中难以实现的一些东西:能够快速学习执行任务的最佳方式,不仅从视觉方面,还从触觉方面做到物体的精确互动。
Rodriguez说:“与国际象棋或围棋等纯粹的认知任务或游戏不同,玩“层层叠这个游戏还需要掌握探测、推、拉、放置和对齐等技能。它需要互动的感知和操作,你必须去触摸积木塔,学习如何以及何时移动积木。这是很难模拟的,所以机器人必须在现实世界中学习,通过与真实的积木塔进行互动。关键的挑战是通过利用关于物体和物理的常识来从相对少量的实验中学习。”
Rodriguez还表示,研究人员开发的触觉学习系统可以应用于层层叠以外的领域,特别是需要仔细进行物理交互的任务,包括从垃圾填埋场中分离可回收物品和组装消费品。
推、拉动作以及堆叠积木是关键
推、拉
在这个实验中, 54个矩形块被堆叠成18层,每层三块,每层中的块垂直于下面的块。
游戏的目的是小心地提取一个块并将其放置在塔顶,从而建立一个新的水平,而不是推翻整个结构。
为了让机器人来玩层层叠,传统的机器学习方案可能需要捕获积木、机器人和塔之间可能发生的所有事情,但这是一项昂贵的计算任务,需要数千甚至数万次积木提取尝试的数据。
相反,Rodriguez和他的同事们受人类认知和我们自己玩游戏的方式的启发,为机器人学习玩层层叠寻找了一种更有效的数据方式。
该团队定制了一个符合行业标准的ABB IRB 120机器人手臂,然后在机器人范围内设置了一个积木塔,并开始了一个训练期,其中机器人首先选择一个随机区块和一个位于该区域上的位置以进行推动。 然后它施加少量的力以试图将块推出塔外。
对于每次尝试,计算机记录相关的视觉和力测量,并标记每个尝试是否成功。
该机器人不是进行数万次这样的尝试,而是在大约300次尝试中进行训练,尝试进行类似的测量,并将结果分组,代表特定的行为。
例如,一个数据集群可能代表对难以移动的块的尝试,而不是一个更容易移动的块,或者在移动时推翻了塔。 对于每个数据集群,机器人开发了一个简单的模型,以根据当前的视觉和触觉测量来预测块的行为。
这种聚类技术大大提高了机器人学习玩游戏的效率。
堆叠
研究人员在使用模拟器MuJoCo进行的游戏计算机模拟中,将他们的方法与其他最先进的机器学习算法进行了对比。在模拟器中获得的经验告诉研究人员机器人在现实世界中学习的方式。
论文作者Oller说:“我们为这些算法提供了我们系统获得的相同信息,以了解他们如何学习、如何在相似的水平上玩层层叠。与我们的方法相比,这些算法需要探索数量级更多的塔来学习游戏。”
由于好奇他们的机器学习方法与真正的人类玩家相比如何,该团队在几个志愿者中进行了一些非正式的试验。
Oller说:“我们观察了人类在积木塔倒塌之前能够提取积木的个数,结果差别并没有那么大。”
但如果研究人员想让他们的机器人与人类玩家竞争,还有很长的路要走。除了物理上的交互作用,Jenga还需要一些策略,例如只提取正确的块,这将使得对手很难在不推翻塔的情况下拉出下一个积木块。
目前,该团队对开发机器人来取得层层叠游戏冠军并不感兴趣,而更关注于将机器人的新技能应用到其他应用领域。
Rodriguez说:“有很多我们用手做的事情,感觉‘正确的方式’来自于力量和触觉暗示的语言。对于这样的任务,类似于我们的方法可以解决这个问题。”
这篇论文发表在Science子刊——Robotics,有兴趣的读者可以复制下方链接阅读全文。
全部0条评论
快来发表一下你的评论吧 !