MiniMax发布新一代旗舰M3

科技绿洲 2026-06-02 243

描述

近日，MiniMax稀宇科技正式发布新一代旗舰大模型MiniMax M3。这是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多模态"三项核心能力的大模型，也是目前全球唯一将这三项能力完整集成的开源选项。M3的发布，意味着国产大模型在长上下文与智能体能力的竞赛中，已经从跟随者变成了定义规则的人。

支撑M3三大能力合一的技术底座，是MiniMax完全自研的稀疏注意力架构——MiniMax Sparse Attention（MSA）。这套架构的核心思路并不复杂：当模型需要处理一个Query时，它不会像传统全注意力机制那样和全局所有的Key-Value逐一计算相关度，而是先通过一个计算量极轻的"索引分支"（Index Branch），在已经被切分成一个个Block的百万级上下文中快速打分，从中挑出与当前Query最相关的少数几个Block，然后再由"稀疏分支"（Sparse Branch）只对这些被选中的Block执行真实的注意力计算。整条链路可以概括为两步：先索引，再计算。

这套设计带来的性能提升是实打实的。在100万tokens的超长上下文场景下，M3相较上一代M2模型，Prefill阶段提速9.7倍，Decode阶段提速15.6倍。单Token计算量仅为M2的约二十分之一，推理效率的跃升让百万上下文不再是"能用但用不起"的摆设。更关键的是，MSA的设计逻辑被业内评价为"大道至简"——相比DeepSeek V4的三层注意力混合结构，M3只用两阶段分块选择就实现了类似的稀疏效果，索引路径与计算路径清晰分离，工程实现更友好，CUDA算子优化也更容易落地。Redis创始人antirez公开评价这条路线是"正确的道路"，认为在本地推理场景中，稠密注意力的开销已经难以为继。

落到实际能力上，M3在编码与智能体评测中达到了行业顶尖水平。在衡量Coding能力的SWE-Bench Pro上，M3超过了GPT-5.5和Gemini 3.1 Pro，逼近Opus 4.7；在综合评估SVG生成性能的SVG-Bench上，M3甚至超过了Opus 4.7；在面向自主Agent的端到端评测框架Claw-Eval中，M3拿下最高分；在BrowseComp智能体评测中，M3以83.5分超越Opus 4.7的79.3分。MiniMax官方还做了一个极具说服力的演示：他们丢给M3一篇ICLR 2025杰出论文，要求独立复现。M3连续运行近12小时，全程自主产出18次commit与23张实验图表，成功跑通核心实验。写出的代码目标是直接可交付，而不是"能跑但需要人改"。

多模态方面，M3从训练起点就采用文本、图片、视频等多模态混合训练，是一个真正的原生多模态模型。MiniMax在技术报告中特别强调，交错数据——即文本和图像等其他模态在序列中交替自然排列的数据——对模型性能的提升比一般认为的更加关键。为此，MiniMax重构了整套数据管线，将预训练数据Token规模推至100万亿的量级。M3不仅支持图像与视频理解，还具备桌面操作能力，可在复杂跨应用环境中执行Computer Use任务。在多模态测试集OmniDocBench上，M3得分超过Gemini 3.1 Pro。

上下文窗口方面，M3的API最高支持1M tokens，并保障至少512K tokens可用。1M tokens是什么概念？大致相当于两本中文长篇小说的体量。这意味着在处理长文档、复杂代码仓库、多轮任务协作等场景时，模型可以在一次推理中保留更完整的信息链路，长程Agent和长程Coding终于有了真正够用的基础设施。M3还即将在HuggingFace和GitHub上开源，支持私有集群部署和微调，兼容Claude Code等主流Agent框架及MCP协议。

模型规格上，M3采用稀疏MoE架构，总参数约196B至229.9B，但每个词元仅激活约11B参数，单请求最高支持400 TPS，兼顾了能力与效率。

商业化方面，MiniMax同步推出了Token Plan订阅方案：Plus版每月49元提供6亿Token，Max版每月119元提供18亿Token，Ultra版每月469元提供55亿Token。API定价上，上下文512K以内输入价格标准版2.1元/百万tokens，输出8.4元/百万tokens，并提供7天限时五折优惠。MiniMax还为老套餐用户准备了迁移适应补偿，以帮助用户平稳过渡到新的积分扣减体系。

打开APP阅读更多精彩内容