中国电信发布全球首个单体稠密万亿参数语义模型

CHANBAEK 2024-06-20 1353

描述

近日，中国电信人工智能研究院（TeleAI）携手北京智源人工智能研究院，共同推出了全球首个单体稠密万亿参数语义模型——Tele-FLM-1T，这一里程碑式的成就标志着中国电信在人工智能领域取得了重大突破，并成为了国内首批发布稠密万亿参数大模型的机构。

面对大模型训练过程中算力消耗巨大的挑战，TeleAI与智源研究院并未止步于传统方法。他们基于模型生长和损失预测等关键技术，共同研发出了Tele-FLM系列模型。这一模型不仅实现了高效的训练过程，而且仅使用了业界普通训练方案9%的算力资源。这意味着，在相同的计算资源下，Tele-FLM系列模型能够处理更多的数据，完成更复杂的任务，大大提高了算力的利用效率。

值得一提的是，Tele-FLM-1T模型的训练过程仅在112台A800服务器上进行了4个月的时间，就完成了总计2.3T tokens的训练。这一速度之快、效率之高，在业界堪称罕见。这一成果的取得，不仅得益于TeleAI与智源研究院的精湛技术，更得益于他们对人工智能领域的深刻理解和不懈追求。

Tele-FLM-1T模型的发布，不仅展示了中国电信在人工智能领域的实力，也为整个行业带来了新的启示。未来，随着技术的不断进步和应用的不断拓展，我们有理由相信，中国电信将继续在人工智能领域发挥更大的作用，为人类社会的进步和发展做出更大的贡献。

打开APP阅读更多精彩内容