电子说
游戏和模拟从一开始就是DeepMind研究计划的核心部分,这种方法已经在人工智能研究上取得了重大突破。作为一名前视频游戏设计师,我对于和Unity达成合作,创建虚拟环境以开发、测试用于解决实际问题的智能、灵活算法感到兴奋。——DeepMind联合创始人兼CEO Demis Hassabis
近日,Unity在几位“游戏设计师”的帮助下彻底火了。
先是登顶steam热销榜的国产武侠游戏《太吾绘卷》,由于代码遭泄露,只有一个main(x)、上万个if、全用字符串……这些非常规操作让一众网友把游戏内核“蛐蛐”吹成了新一代锦鲤。之后,熟悉Unity的玩家开始陆续辟谣,指出主创写游戏用的引擎是Unity,之所以全是字符串,是因为其中内置的PlayMaker可以调整变量数据类型。
无论是游戏营销还是无心造谣,这个事件凸显了Unity在游戏制作上的专业和易上手。事实上,Unity是现在受众最广的实时开发平台,从市场规模上看,它占全球AR/VR内容创作的60%,在移动游戏创作上也占了全球的50%。
而除去简单易用这个特征,Unity的最著名的灵活性也使开发人员能够针对25个平台定位和优化他们的创作,包括Xbox One、PlayStation 4、Gameroom(Facebook)、SteamVR(PC和Mac)、Oculus、PSVR、Gear VR、HoloLens、ARKit(Apple)、ARCore(谷歌)等。
另一个“游戏设计师”是DeepMind的哈萨比斯。26日,DeepMind宣布和Unity达成合作,由前者的研究人员使用Unity创建虚拟环境,进一步开展基础AI研究,而后者能利用这些成果,为游戏开发者提供最新的机器学习技术。
说起DeepMind,相信国内读者对这个名字不会陌生。无论是2014年被谷歌天价收购,还是2016年用深度强化学习系统AlphaGo击败韩国棋手李世石,还是2017年AlphaGo击败中国棋手柯洁,这家受神经科学启发的人工智能公司一直走在科技前沿。自2010年在伦敦成立以来,DeepMind已经共计发表了两百余篇同行评审论文,其中有6篇被刊登在《Nature》等顶级科学期刊上,这是计算机科学实验室的一个史无前例的记录。
截至目前,双方还没有透露有关合作内容和资金往来的信息,但有资料显示,早在今年6月,Unity就已将开始向DeepMind的兄弟部门——谷歌云上的网络游戏开发商提供服务。
合作的意义
智能设计和进化不仅是人类世界观的一个分支,它也是人工智能社区的一个分支。直到几年前,学界研究的AI还仅限于编码智能算法,比如银行欺诈检测和玩独立小游戏。但是对于大型复杂环境,比起人为硬编码,“直觉”算法更能提升机器学习AI的整体表现。因此在现实场景中模拟智能是AI研究下一阶段的重要目标,作为基础,极度逼真的房屋、高速公路等3D环境是必要的。
“游戏有很多种形式……它们比人们想象的更接近自然。”Unity的机器学习和人工智能副总裁Danny Lange在接受采访时表示,“在游戏中,你能得到视觉上的、物理上的、认知层面上的,以及社交方面的互动。这些都给算法带来了进化压力,就像大自然对生物一样。”
演示一
上图是游戏如何训练AI的一个例子,这个小人没有任何关于行走的知识,但它一直在生理学和物理定律范围内探索,一旦它发生了类似行走的行为,系统就会触发数字奖励,激励它不断学习这种行为。经过尝试,这个小人最终学会了走路——尽管它的动作还是很笨拙,
这项技术本身不是新的,很多公司和实验室早几年就已经开始在游戏引擎里训练AI,其中最知名的是Nvidia的Isaac虚拟机器人训练系统。此外,自动驾驶汽车算法也高度依赖逼真的虚拟道路环境,而Danny Lange本人之前也是Uber机器学习平台的建立者。
如果说物理模拟能让AI进行更宏大的实验,帮人类锁定实际测试范围,那么游戏作为开放世界,除了物理学,它能模拟的还有色彩之间的相互作用、社交行为等。
“社会动态建模,这是一个新兴领域,”Danny Lange介绍道:“你模拟了多个智能体,他们会互相交流,甚至发明对话使用的语言。这可以深入了解人群的行为方式,举一个实际的例子,假设我们模拟了两个知名投资分析师,他们中的一个说股票明天会跌,一个说会涨,那我们就能通过模拟来观察他们的言论是怎么影响到其他人的认知的。”
演示二
就好比在自然界中,动物在学会走路、跑步前必须先学会爬行,我们要分析股票这个问题也要先把它分解成一个个简单问题。强化学习遵循的正是这种逐步渐进的学习方法,“你认为自己已经解决了一个难题,然后把‘经验’丢给机器,这其实并没有多大意义。算法必须先掌握一个挑战,并把它所学到的知识用来掌握下一个挑战,这是我们所说的‘课程学习’。”
“和DeepMind的交易不仅仅是出售软件许可证,这是合作。当你构建一个游戏引擎时,它也许可以在iOS、Android、Xbox上快速运行。但DeepMind要做的是在数千甚至数万台服务器上运行Unity以推动深度学习,这是一项完全不同的任务,意味着我们要针对这些需求调整和配置Unity。”
只有大规模的深度学习才能带来发展回报。训练一只狗只需5分钟,如果只是这样的任务,DeepMind绝不会选择Unity,但是,如果他们的目标是以10,000 FPS训练1000只狗24小时,观察这些狗的诡异动作,然后从中找出很快学会如何跨栏的狗,那么这样的合作是必须的。
无论是DeepMind还是Unity,这样的合作都是共赢。
全部0条评论
快来发表一下你的评论吧 !