一套开源的大型语言模型（LLM）—— StableLM

OSC开源社区 2023-04-24 3564

描述

Stability AI 是 Stable Diffusion 图像生成工具背后的公司，如今他们不再局限于开发图像 / 视频生成方面的 AI，于今天正式发布了一套开源的大型语言模型（LLM）—— StableLM，首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样，被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的，这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过，Stability AI 在 the Pile 的基础上进行了扩展，所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上，开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段，它的参数也比较少，只有 30 亿和 70 亿个参数，之后他们还会推出有 150 亿到 650 亿参数的模型。

GitHub

对于 AI 可能会产生的风险，Stability AI 也给出了提醒：

对于任何没有额外微调和强化学习的预训练大型语言模型来说，用户得到的回应质量可能参差不齐，并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

GitHub

除了将代码托管在 GitHub 上，Stability AI 还在 Hugging Face 上发布了一个演示版本，经过测试 StableLM 会说中文，但只会一点点（回复内容对应不上，语句也不通顺）。

GitHub

在 Stable Diffusion 发布后，Stability AI 遭到了很多艺术家的投诉和起诉，指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具，侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下，如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元，公司估值也超过了 10 亿美元。但 AI 是一个投入非常高，可能短期也很难产生收益的领域，也不知道这 1 亿美金现在还剩多少，为了在这个领域持续发展，Stability AI 会不会继续融资，亦或是投入某个大型公司的怀抱呢？

项目地址：https://github.com/Stability-AI/StableLM

审核编辑：李倩

打开APP阅读更多精彩内容