英伟达研究团队的公布的“AI神笔”吗？

nlfO_thejiangme 2019-08-02 2851

电子说

1.3w人已加入

描述

还记得今年三月英伟达研究团队的公布的“AI神笔”吗？这款智能画笔仅根据寥寥数笔草图即可生成一幅堪比华为P30拍摄的逼真风景图，真实拯救无数手残党。如今这个名为GauGAN的图片生成器终于上线测试啦，无需注册、完全免费，打开网页即可玩耍~

微博上曾经流行过一张图：如何画出一匹马？在此之后又出现了：如何画一个乔布斯？理想与现实、想法和下笔的差距过于真实，引起手残党的极度共鸣。

这叫做“简单画几笔就好”？

怎么玩儿呀？

今年3月英伟达的新科技GauGAN在GTC 2019上一经推出，获得无数手残党点赞。GauGAN的拼写与印象派大师高更（Gauguin）仅两字之差，而前者生成的图象与大师之作相比也丝毫不输。最重要的是，使用者并不需要具备很高的绘画功底，仅通过简单的点击、描画、构图即可生成逼真风景图。

GauGAN具备一个简易的操作界面，左侧是使用者用鼠标控制的画板，右侧是AI实时生成的预览图。在一个类似PS的工具栏中有包括油漆桶、钢笔和铅笔三种绘图工具。在创作时，首先要选择最右侧的元素类型（如天空、树木、山脉等），然后选择绘图工具，在画板上描画出轮廓，右边的AI画板将实时补充轮廓中细节。

背后原理SPADE架构

使用者的涂鸦在计算机视觉领域其实被称为语义布局（Semantic Layout），传统的语义图像合成首先将语义布局作为深度神经网络的输入，而后通过对卷积、归一化和非线性层的处理，输出为合成图像。

但这种传统的合成方式存在缺陷，其中的归一化层通常会让输入语义蒙版中的信息流失，导致合成效果变差，无法达到最佳效果。

为了解决这个问题，英伟达的研究人员提出了一种新的方法SPADE架构——空间自适应标准化，能够通过空间自适应学习转换使用输入语义布局来调制激活，可以在整个网络中有效地传播语义信息。

这篇论文由英伟达的研究人员Taesung Park、Ming-Yu Liu、Ting-Chun Wang和Jun-Yan Zhu（朱俊彦）共同完成，其中朱俊彦大神近日宣布将于2020年秋季回到CMU担任助理教授一职。戳此处回顾朱俊彦在将门做的talk~

国外网友已经玩疯了！

该论文的作者之一Ming-Yu Liu在Twitter上公布了网站地址后，不少网友已经按耐不住激动的小手玩嗨了！

真的好好玩，我都佩服我寄几！

Wow！这也太赞了吧！

别拦着我，我还要玩！

这真的不是摄影+PS吗？

英伟达深度学习部门的副总裁 Bryan Catanzaro称，仅通过草图就能快速生成高保真图像将大大提高设计团队头脑风暴的效率。

GauGAN可以成为建筑师、城市规划者、景观设计师甚至游戏开发者创建虚拟世界、高保真原型图的强大工具，帮助专业人员更快速、更高效、更灵活地完成多种项目需求。而对于我们普通人而言——对专业绘画摄影、PS等操作复杂的修图神器望而却步的手残党们，GauGAN真实地将完全看不出是什么的“鬼画符”变成了高度逼真的图象。

不过归根结底，GauGAN只是一种帮助我们将头脑中的设计点子实现出来的一种工具，如果脑中没有任何想法，再厉害的GauGAN也无法凭空创作出大师之作。

打开APP阅读更多精彩内容