沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.2旗舰模型

描述

6月17日,智谱AI全新旗舰大模型GLM-5.2正式开源发布。沐曦股份曦云C系列GPU率先完成该模型Day 0适配,再度凭借全栈自主软硬件技术实力,领跑国产GPU生态适配赛道。

GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。

在此之前,智谱推出的GLM-5、GLM-5.1、GLM-OCR、GLM-4.6V等全系列模型,沐曦股份均实现Day 0同步适配。依托曦云C系列强大硬件算力与MXMACA软件栈深度优化能力,沐曦股份为GLM-5.2提供全场景、高稳定、低成本的国产算力方案,有效解决大模型落地过程中“适配慢、迁移难、性能损耗大”等行业痛点,助力企业快速将GLM-5.2的技术优势转化为产业价值。

自2025年12月以来,沐曦已累计完成27个主流顶尖模型Day 0适配,合作覆盖智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商,适配品类囊括通用语言、多模态、OCR、机器翻译,适配速度、数量、生态广度均位居前列。本次GLM-5.2无缝适配,将进一步加速“模型-芯片-框架-应用”全国产AI自主闭环落地。

曦云C系列GPU基于沐曦股份全自研的核心GPU IP、指令集和架构打造,具备高能效比与高通用性,精准匹配大模型的超大规模参数处理及长上下文推理需求。MXMACA软件栈作为连接硬件算力与上层应用生态的核心枢纽,全链路覆盖底层驱动、用户态接口、MXCC编译器、算子深度适配及主流训练/推理框架对接,原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架,支持 500+ AI 模型与4500+热门开源项目稳定运行,大幅缩短传统模型适配周期。曦云C系列GPU依托沐曦自研MXMACA软件栈的深度优化能力,成功实现GLM-5.2的高效部署与稳定运行,为其前沿能力提供澎湃算力支撑。

关于智谱GLM-5.2

在全球百万用户参与盲测的前端开发评估系统Code Arena 上,GLM-5.2取得全球可用模型第一的表现。

模型

今天GLM-5.2专为长程任务能力而生,全新特色包括:

Solid 1M上下文,稳定支撑长程任务

更强体感,更实用的Coding能力

极致Infra优化,Day 0运行在国产算力平台

MIT开源协议,无地域限制,技术平权无国界

1 1M上下文与长程任务

GLM-5.2大大扩展了1M Coding Agent的训练环境,覆盖大规模实现、自动化研究、性能优化等多个典型领域,这使得模型的1M上下文真实表现有时候甚至能超过Opus。1M上下文构成GLM-5.2的长程交付能力,在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上,GLM-5.2的表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。

模型

在实际体验中,GLM-5.2自主完成开发、联调、测试到打包上线,最终交付一个覆盖Web、移动端与小程序的多端应用。这样一条完整链路累计处理88万以上的tokens,几乎用满1M上下文窗口。过去,这样的大型工程需要一支团队协作数周,GLM-5.2能在一次连续的长程任务中跑完。

2 Coding体感

GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1上(评测AI Agent通过命令行操作一台计算机的数据集),GLM-5.2比Opus 4.8低4%,相比GLM-5.1提升了17.5%;在MCP-Atlas上(工具使用tool-use评测的数据集),GLM-5.2仅比Opus 4.8低0.8%。

模型

GLM-5.2还引入了effort level(思考档位)控制,可以在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。

模型

3 极致Infra优化

GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计。智谱团队提出IndexShare,在每四层稀疏注意力层之间复用同一个索引器(indexer),在1M上下文长度下,将单位token的FLOPs降低至2.9倍。此外,智谱团队改进了用于投机解码(speculative decoding)的 MTP 层,将接受长度(acceptance length)最多提升 20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

模型

4 面向开发者与知识工作者

凭借扎实的1M上下文与稳定的长程任务能力,GLM-5.2能长时间自主推进更复杂、更长链路的任务,锁定高价值场景,改变开发者与知识工作者的工作方式。

GLM-5.2在大型重构工程上表现出色。在开发者的Moonshot实验中,它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机(AGC):把约4,600行的定点CPU逐比特移植为Rust,再让当年65,000行、一字未改的登月飞控程序在上面原样起飞。整个过程由Agent全自主走完,直到复现那个差点中止登月的1202报警。

通过智谱的Agent产品AutoClaw,GLM-5.2的1M上下文与长程任务能力可服务于设计、法务等专业场景,例如从需求一次性生成数十个原型页面,并自主持续迭代和微调,在长上下文中保持品牌规范与一致性。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分