本地化ChatGPT？Firefly推出基于BM1684X的大语言模型本地部署方案

Firefly开源团队 2023-09-09 1702

自ChatGPT发布以来，生成式AI在全球引起了新的浪潮，它影响着各行各业，为世界带来智能化的发展。然而，类ChatGPT的大语言模型极度依赖算力巨大的服务器，导致目前大部分应用只能通过集中调用API的方式来应用，很难本地化部署。

随着大模型适用领域的扩展，大模型登陆边缘设备的需求凸显，越来越多的行业需要把大语言模型应用在专业的领域上。在这个背景下，Firefly推出了基于BM1684X平台的大语言模型本地部署的方案，让边缘设备可配置上一颗真正的“智慧”大脑，应用于各行各业。

本地化的ChatGLM-6B大语言模型

（1）具有 62 亿参数

采用了由清华大学的ChatGLM-6B大语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数，使用了和 ChatGPT 相似的先进技术，以达到优质的效果。

（2）优化中文对话

支持中英双语的对话语言模型，并且针对中文问答和对话进行了优化，其开源的训练数据量达到1万亿字符的模型。

人工智能

AI边缘计算主机EC-A1684XJD4

ChatGLM-6B可部署在Firefly旗下产品AI嵌入式主机EC-A1684XJD4中，主机配置了16GB大内存，适用于部分大模型的量化部署，可运行Ubuntu20.04操作系统，并集成最新的SOPHONSDK 3.0.0，可充分发挥BM1684X集成TPU的AI加速能力。

人工智能

打开APP阅读更多精彩内容