MiniMax M3正式发布:自研MSA稀疏注意力架构

描述

国产AI大模型公司MiniMax于2026年6月1日正式推出了新一代通用模型MiniMax M3。据官方介绍,该模型在编程与智能体能力、超长上下文处理以及原生多模态理解等关键维度上均实现了代际性突破,成为国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选择。

M3底层采用的全新自研稀疏注意力架构MiniMax Sparse Attention(MSA),是支撑其三大能力合一的核心引擎。相较于传统全注意力机制,MSA能够显著降低长上下文场景下的计算成本,将上下文窗口提升至100万token——这意味着模型在处理长文档、复杂代码仓库、多轮任务协作等场景时,可以在单次推理中保留完整的信息链路。

从评测结果来看,M3在多项权威测试中表现出强劲竞争力。在衡量编程能力的SWE-Bench Pro评测集上,超过了GPT-5.5和Gemini 3.1 Pro,并接近Opus 4.7的水平。在综合评估SVG生成性能的基准SVG-Bench上,M3超过了Opus 4.7。

商业化方面,MiniMax同步推出了Token Plan订阅方案,共设三个档位:Plus版每月49元,提供6亿token;Max版每月119元,提供18亿token;Ultra版每月469元,提供55亿token。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分