Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而Stable Diffusion是许多其他文本到图像生成AI工具的基础。
Stable Cascade可以生成照片并提供其创建的确切图像的变体,或者尝试提高现有图片的分辨率。其他文本到图片的编辑功能还包括图像修复和外画(模型只对图片的特定部分进行填充编辑),以及可视边缘(用户可利用现有图片的边缘制作新照片)。
新模型可在GitHub上供研究人员使用,但不能用于商业用途。在谷歌甚至苹果等公司发布自己的图像生成模型时,新模型也带来了更多选择。
与Stability的旗舰Stable Diffusion模型不同,Stable Cascade不是一个大型语言模型,而是三个依赖于Würstchen架构的不同模型。
Comparison of inference time Stable Cascade v other models, Stability AI
将请求分解成更小的比特后,请求所需的内存更少(在那些很难找到的GPU上训练的时间也更少),运行速度更快,同时在"提示对齐和美学质量"方面表现更佳。创建一幅图像大约需要10秒,而目前使用的SDXL模型需要22秒。
Stability AI公司帮助普及了Stable Diffusion方法,同时也成为了几起诉讼的对象,指控Stable Diffusion在未经权利持有人许可的情况下对受版权保护的数据进行训练。该公司于12月开始通过订阅的方式提供商业许可,并表示这是帮助其研究获得资金所必需的。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !