如何训练机器人学习新技能

电子说

1.3w人已加入

描述

  10月27日消息,据外媒报道,约翰斯霍普金斯大学博士生安德鲁洪特(Andrew Hundt) 近日发布一篇新论文,指出应通过正强化法训练机器人学习新技能。

  这篇论文的核心思想是,在训练机器人的过程中,应采用正强化法,即相比于在它做错时进行惩罚,更应在它做对时进行激励。而对于机器人来说,这种激励机制是以评分系统的形式呈现的,类似玩游戏一样,根据执行任务的情况获得积分。

  安德鲁表示,这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数,所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性,现在只用两天就能做到。”

  不过他也指出,目前机器人执行的这些任务仍然是比较初级的,比如堆积木。但在未来,机器人有望通过正强化法完成更复杂和有意义的任务。
责任编辑:YYX

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分