Atari游戏史上最强通关算法来了——Go-Explore!
如何让AI符合人类的意图?如何创建符合用户意图的智能体?
智能体的连接问题,如何创建能符合人类目标的智能体?
研究人员们提出了一种新的导航工具SafeRoute
伯克利的研究人员提出了一种通用的自适应感知方法AdaSearch
基于模型的学习vs无模型学习
OpenAI的研究人员开发了一套基于能量的神经网络模型
OpenAI提出了一种回报设置方法RND
让强化学习智能体像人类一样穿短袖、衬衫等衣服
一种新型的基于情景记忆的模型,能够让智能体用“好奇心”探索环境
Deepmind“好奇心学习”新机制:让智能体不再偷懒
AI智能体学习如何跑步、躲避跨越障碍物
伯克利那个会“18般武艺”的DeepMimic模型开源了!
DeepMind开源了一个内部强化学习库TRFL
一种从视频中学习技能的框架(skills from videos,SFV)
UC Berkeley大学的研究人员们利用深度姿态估计和深度学习技术
DeepMind开发了PopArt,解决了不同游戏奖励机制规范化的问题
用PopArt进行多任务深度强化学习
Gibson能让算法同时探索感知和运动
基于TensorFlow的开源强化学习框架 Dopamine