沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.2旗舰模型

沐曦MetaX 2026-06-17 328

描述

6月17日，智谱AI全新旗舰大模型GLM-5.2正式开源发布。沐曦股份曦云C系列GPU率先完成该模型Day 0适配，再度凭借全栈自主软硬件技术实力，领跑国产GPU生态适配赛道。

GLM-5.2 是智谱迄今能力最强的开源模型，支持真正可用的 1M 上下文，并在长程任务中继续保持领先。

在此之前，智谱推出的GLM-5、GLM-5.1、GLM-OCR、GLM-4.6V等全系列模型，沐曦股份均实现Day 0同步适配。依托曦云C系列强大硬件算力与MXMACA软件栈深度优化能力，沐曦股份为GLM-5.2提供全场景、高稳定、低成本的国产算力方案，有效解决大模型落地过程中“适配慢、迁移难、性能损耗大”等行业痛点，助力企业快速将GLM-5.2的技术优势转化为产业价值。

自2025年12月以来，沐曦已累计完成27个主流顶尖模型Day 0适配，合作覆盖智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商，适配品类囊括通用语言、多模态、OCR、机器翻译，适配速度、数量、生态广度均位居前列。本次GLM-5.2无缝适配，将进一步加速“模型-芯片-框架-应用”全国产AI自主闭环落地。

曦云C系列GPU基于沐曦股份全自研的核心GPU IP、指令集和架构打造，具备高能效比与高通用性，精准匹配大模型的超大规模参数处理及长上下文推理需求。MXMACA软件栈作为连接硬件算力与上层应用生态的核心枢纽，全链路覆盖底层驱动、用户态接口、MXCC编译器、算子深度适配及主流训练/推理框架对接，原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架，支持 500+ AI 模型与4500+热门开源项目稳定运行，大幅缩短传统模型适配周期。曦云C系列GPU依托沐曦自研MXMACA软件栈的深度优化能力，成功实现GLM-5.2的高效部署与稳定运行，为其前沿能力提供澎湃算力支撑。

关于智谱GLM-5.2

在全球百万用户参与盲测的前端开发评估系统Code Arena 上，GLM-5.2取得全球可用模型第一的表现。

今天GLM-5.2专为长程任务能力而生，全新特色包括：

Solid 1M上下文，稳定支撑长程任务

更强体感，更实用的Coding能力

极致Infra优化，Day 0运行在国产算力平台

MIT开源协议，无地域限制，技术平权无国界

1 1M上下文与长程任务

GLM-5.2大大扩展了1M Coding Agent的训练环境，覆盖大规模实现、自动化研究、性能优化等多个典型领域，这使得模型的1M上下文真实表现有时候甚至能超过Opus。1M上下文构成GLM-5.2的长程交付能力，在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上，GLM-5.2的表现介于Claude Opus 4.7与4.8之间，是排名最高的开源模型。

在实际体验中，GLM-5.2自主完成开发、联调、测试到打包上线，最终交付一个覆盖Web、移动端与小程序的多端应用。这样一条完整链路累计处理88万以上的tokens，几乎用满1M上下文窗口。过去，这样的大型工程需要一支团队协作数周，GLM-5.2能在一次连续的长程任务中跑完。

2 Coding体感

GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升，复杂系统工程与深度调试更稳。在主流编程基准上，GLM-5.2保持开源SOTA，与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1上（评测AI Agent通过命令行操作一台计算机的数据集），GLM-5.2比Opus 4.8低4%，相比GLM-5.1提升了17.5%；在MCP-Atlas上（工具使用tool-use评测的数据集），GLM-5.2仅比Opus 4.8低0.8%。

GLM-5.2还引入了effort level（思考档位）控制，可以在能力、速度、成本之间做出平衡。在相近的token预算下，GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。

3 极致Infra优化

GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计。智谱团队提出IndexShare，在每四层稀疏注意力层之间复用同一个索引器（indexer），在1M上下文长度下，将单位token的FLOPs降低至2.9倍。此外，智谱团队改进了用于投机解码（speculative decoding）的 MTP 层，将接受长度（acceptance length）最多提升 20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

4 面向开发者与知识工作者

凭借扎实的1M上下文与稳定的长程任务能力，GLM-5.2能长时间自主推进更复杂、更长链路的任务，锁定高价值场景，改变开发者与知识工作者的工作方式。

GLM-5.2在大型重构工程上表现出色。在开发者的Moonshot实验中，它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机（AGC）：把约4,600行的定点CPU逐比特移植为Rust，再让当年65,000行、一字未改的登月飞控程序在上面原样起飞。整个过程由Agent全自主走完，直到复现那个差点中止登月的1202报警。

通过智谱的Agent产品AutoClaw，GLM-5.2的1M上下文与长程任务能力可服务于设计、法务等专业场景，例如从需求一次性生成数十个原型页面，并自主持续迭代和微调，在长上下文中保持品牌规范与一致性。

打开APP阅读更多精彩内容