盘古大模型与ChatGPT的模型基础架构

微云疏影 2023-09-05 2388

　　华为盘古大模型

　　华为盘古大模型以Transformer模型架构为基础，利用深层学习技术进行训练。模型的每个数量达到2.6亿个，是目前世界上最大的汉语预备训练模型之一。这些模型包含许多小模型，其中最大的模型包含1亿4千万个参数。

　　ChatGPT

　　此外，chatgpt基于transformer模型架构，并训练深入学习技术。该模型的每个数量达1亿5千万个，是目前最常用的英语事前训练模型之一。

　　在基础设施方面，华为盘古大模型和chatgpt都采用变形金刚模型结构，但华为盘古大模型的参数数量远远多于chatgpt。这意味着华为盘古大模型在处理更复杂的任务时，具有更强的表达能力和推理能力。

打开APP阅读更多精彩内容