Stability AI试图通过新的图像生成人工智能模型保持领先地位

IEEE电气电子工程师 2024-02-19 450

Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大，而Stable Diffusion是许多其他文本到图像生成AI工具的基础。

Stable Cascade可以生成照片并提供其创建的确切图像的变体，或者尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括图像修复和外画（模型只对图片的特定部分进行填充编辑），以及可视边缘（用户可利用现有图片的边缘制作新照片）。

新模型可在GitHub上供研究人员使用，但不能用于商业用途。在谷歌甚至苹果等公司发布自己的图像生成模型时，新模型也带来了更多选择。

与Stability的旗舰Stable Diffusion模型不同，Stable Cascade不是一个大型语言模型，而是三个依赖于Würstchen架构的不同模型。

语言模型

Comparison of inference time Stable Cascade v other models, Stability AI

将请求分解成更小的比特后，请求所需的内存更少（在那些很难找到的GPU上训练的时间也更少），运行速度更快，同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要10秒，而目前使用的SDXL模型需要22秒。

Stability AI公司帮助普及了Stable Diffusion方法，同时也成为了几起诉讼的对象，指控Stable Diffusion在未经权利持有人许可的情况下对受版权保护的数据进行训练。该公司于12月开始通过订阅的方式提供商业许可，并表示这是帮助其研究获得资金所必需的。

审核编辑：刘清

打开APP阅读更多精彩内容