MiniMax发布新一代旗舰M3

描述

近日,MiniMax稀宇科技正式发布新一代旗舰大模型MiniMax M3。这是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多模态"三项核心能力的大模型,也是目前全球唯一将这三项能力完整集成的开源选项。M3的发布,意味着国产大模型在长上下文与智能体能力的竞赛中,已经从跟随者变成了定义规则的人。

支撑M3三大能力合一的技术底座,是MiniMax完全自研的稀疏注意力架构——MiniMax Sparse Attention(MSA)。这套架构的核心思路并不复杂:当模型需要处理一个Query时,它不会像传统全注意力机制那样和全局所有的Key-Value逐一计算相关度,而是先通过一个计算量极轻的"索引分支"(Index Branch),在已经被切分成一个个Block的百万级上下文中快速打分,从中挑出与当前Query最相关的少数几个Block,然后再由"稀疏分支"(Sparse Branch)只对这些被选中的Block执行真实的注意力计算。整条链路可以概括为两步:先索引,再计算。

这套设计带来的性能提升是实打实的。在100万tokens的超长上下文场景下,M3相较上一代M2模型,Prefill阶段提速9.7倍,Decode阶段提速15.6倍。单Token计算量仅为M2的约二十分之一,推理效率的跃升让百万上下文不再是"能用但用不起"的摆设。更关键的是,MSA的设计逻辑被业内评价为"大道至简"——相比DeepSeek V4的三层注意力混合结构,M3只用两阶段分块选择就实现了类似的稀疏效果,索引路径与计算路径清晰分离,工程实现更友好,CUDA算子优化也更容易落地。Redis创始人antirez公开评价这条路线是"正确的道路",认为在本地推理场景中,稠密注意力的开销已经难以为继。

落到实际能力上,M3在编码与智能体评测中达到了行业顶尖水平。在衡量Coding能力的SWE-Bench Pro上,M3超过了GPT-5.5和Gemini 3.1 Pro,逼近Opus 4.7;在综合评估SVG生成性能的SVG-Bench上,M3甚至超过了Opus 4.7;在面向自主Agent的端到端评测框架Claw-Eval中,M3拿下最高分;在BrowseComp智能体评测中,M3以83.5分超越Opus 4.7的79.3分。MiniMax官方还做了一个极具说服力的演示:他们丢给M3一篇ICLR 2025杰出论文,要求独立复现。M3连续运行近12小时,全程自主产出18次commit与23张实验图表,成功跑通核心实验。写出的代码目标是直接可交付,而不是"能跑但需要人改"。

多模态方面,M3从训练起点就采用文本、图片、视频等多模态混合训练,是一个真正的原生多模态模型。MiniMax在技术报告中特别强调,交错数据——即文本和图像等其他模态在序列中交替自然排列的数据——对模型性能的提升比一般认为的更加关键。为此,MiniMax重构了整套数据管线,将预训练数据Token规模推至100万亿的量级。M3不仅支持图像与视频理解,还具备桌面操作能力,可在复杂跨应用环境中执行Computer Use任务。在多模态测试集OmniDocBench上,M3得分超过Gemini 3.1 Pro。

上下文窗口方面,M3的API最高支持1M tokens,并保障至少512K tokens可用。1M tokens是什么概念?大致相当于两本中文长篇小说的体量。这意味着在处理长文档、复杂代码仓库、多轮任务协作等场景时,模型可以在一次推理中保留更完整的信息链路,长程Agent和长程Coding终于有了真正够用的基础设施。M3还即将在HuggingFace和GitHub上开源,支持私有集群部署和微调,兼容Claude Code等主流Agent框架及MCP协议。

模型规格上,M3采用稀疏MoE架构,总参数约196B至229.9B,但每个词元仅激活约11B参数,单请求最高支持400 TPS,兼顾了能力与效率。

商业化方面,MiniMax同步推出了Token Plan订阅方案:Plus版每月49元提供6亿Token,Max版每月119元提供18亿Token,Ultra版每月469元提供55亿Token。API定价上,上下文512K以内输入价格标准版2.1元/百万tokens,输出8.4元/百万tokens,并提供7天限时五折优惠。MiniMax还为老套餐用户准备了迁移适应补偿,以帮助用户平稳过渡到新的积分扣减体系。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分