强化学习环境研究,智能体玩游戏为什么厉害
利用视频游戏语料库,训练一个GAN模型为超级马里奥兄弟生成游戏级别
DeepMind和OpenAI攻克蒙特祖玛的复仇并没有看上去意义那么重大
强化学习的经典基础性缺陷可能限制它解决很多复杂问题
继OpenAI发布Dota2的团战AI后,DeepMind今天也发布了自家的最新研究
DeepMind分享了他们在多智能体学习方面的进展
如何应对并解决可能出现的智能体失控问题
如何让多个智能体学会一起完成同一个任务,学会彼此合作和相互竞争