微软研发出根据文字描述可画出相应图像的机器人 并增加了一些想象细节

电子说

1.2w人已加入

描述

微软近日推出了一项新的模仿类似艺术家的人工智能技术—一个“绘图机器人”。机器人能够根据文字描述创建一个与之相对应的图像,而且它也增加了细节,这些细节甚至超越了本身而不仅仅在所对应的文字里出现的内容。“这些现象可以说明,人工智能具有自己的想象力”,一名在微软公司的工作人员说道。

“如果你在必应引擎去搜索关于一只鸟的信息,你会得到一个与鸟类相关的图片。但是在这里,图片是由计算机逐个像素地从头开始创建的,“微软公司在华盛顿州雷蒙德市微软研究实验室深度学习技术中心的首席研究员兼研究经理何晓东在微软最近的一篇公告中表示。 “这些鸟可能在现实世界中都不存在,而它们只是代表了我们研发的人工智能对鸟类想象力的一个方面的描述。”

研究人员说,机器人能够生成各种图像,包括从“普通的田园场景”,如放牧家畜,甚至包括对“浮动双层巴士”的想象图。

微软方面表示,该机器人已经在配对图像和标题的数据集上进行了培训,该培训能够使其理解如何将相应的单词与图像进行匹配。例如,当标题上写着“鸟”时,它先学会画一只鸟,然后通过机器学习来理解鸟的图像应该是什么样的。

何晓东说:“这是我们相信机器可以学习的根本原因之一。”

绘图机器人的技术由两个机器学习模型组成,一个是从文本描述生成图像,另一个是使用文本描述来判断生成图像的真实性。前者试图从后者获得虚拟的照片,但后者不想被愚弄。所以通过互相之间内部的“竞争”,两者结合起来便能够共同创造更高质量的图像。

根据最近的一篇研究报告,微软方面还指出,与现有技术相比,这种新型机器人生成的图像质量相较以前提升了近三倍。

当然,这不是第一个研发出来的与艺术相结合的人工智能技术。

这两者结合有时会产生出色的结果,比如Google的人工智能机器生成的图像展现了其具有艺术表现力的潜能。谷歌还有一个神经网络,可以猜测你正在绘制什么,他们还拥有一个自动绘图机器人,并定期地详细介绍它如何在帮助机器进行绘制的研究。

Facebook也一直在开发神经网络来制作飞机,汽车和动物等小图片,甚至用它从照片中创建自己的Bitmoji形象。

对于微软来说,教一个机器人根据文本来画出相对应的图像这项技术代表着它已经达到了在这个计算机视觉和自然语言处理领域所需要的技术。

这包括CaptionBot的自动写入照片字幕的开发,以及可以回答人们询问图像的问题的技术,如图中对象的位置或属性,这是对盲人有帮助的事物。

至于人工智能艺术家在现实世界中如何为人类服务,微软公司有一些想法。

这表明该机器人可以作为画家或室内设计师的素描助手,或者可以作为声控美化照片的工具来被使用。 (“Cortana,请你为我画一只鸟”,也许它能做到?)

但该技术还没有达到我们能够用它完成所提出的要求的程度。

如果仔细观察这些图像,它们几乎都会有缺陷,我们可以很明显地看出来它们是由机器创造的,而不是人类:例如上图中的蓝喙鸟,水果和奇形怪状的香蕉图(见上文)。

然而,随着它的进3倍速度能力的提高,绘图机器人代表了人工智能发展的里程碑,微软公司相关人员说道。(TechCrunch )

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分