Stability AI试图通过新的图像生成人工智能模型保持领先地位

描述

Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而Stable Diffusion是许多其他文本到图像生成AI工具的基础。

Stable Cascade可以生成照片并提供其创建的确切图像的变体,或者尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括图像修复和外画(模型只对图片的特定部分进行填充编辑),以及可视边缘(用户可利用现有图片的边缘制作新照片)。

新模型可在GitHub上供研究人员使用,但不能用于商业用途。在谷歌甚至苹果等公司发布自己的图像生成模型时,新模型也带来了更多选择。

与Stability的旗舰Stable Diffusion模型不同,Stable Cascade不是一个大型语言模型,而是三个依赖于Würstchen架构的不同模型。

语言模型

Comparison of inference time Stable Cascade v other models, Stability AI

将请求分解成更小的比特后,请求所需的内存更少(在那些很难找到的GPU上训练的时间也更少),运行速度更快,同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要10秒,而目前使用的SDXL模型需要22秒。

Stability AI公司帮助普及了Stable Diffusion方法,同时也成为了几起诉讼的对象,指控Stable Diffusion在未经权利持有人许可的情况下对受版权保护的数据进行训练。该公司于12月开始通过订阅的方式提供商业许可,并表示这是帮助其研究获得资金所必需的。




审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分