近日,阿里云峰会上,平头哥正式发布新一代训推一体AI芯片真武M890,内置144GB HBM显存,片间互联带宽达800GB/s,整体性能是上一代真武810E的三倍,原生支持FP32到FP4全精度,已应用于阿里云磐久AL128超节点服务器。
上一代真武810E于今年1月发布,96GB HBM2e显存,性能对标英伟达H20。M890显存扩容50%至144GB,互联带宽从700GB/s提升至800GB/s,配合自研ICN Switch 1.0互联芯片,128卡超节点P2P时延压至150ns以下,单柜带宽达Pb/s级,可让128张芯片在逻辑上组成一台计算机。
这款芯片专为Agentic时代设计。单卡并发推理能力较同级GPU高2.8倍,在高并发Agent推理场景下综合成本比主流GPU方案低45%。目前已上线阿里云百炼平台,支持Qwen、DeepSeek、Kimi等主流模型。
平头哥同步公布了"一年一代"的迭代路线图:2027年Q3推出真武V900,性能再翻三倍,显存达216GB;2028年Q3发布真武J900。截至目前,真武系列芯片累计出货56万片,服务中国电信、中国一汽、浦发银行等20多个行业400多家客户,在国内AI芯片厂商中排名第二,仅次于华为昇腾。
M890的硬件参数已摸到英伟达H200门槛,显存甚至多出3GB。但客观来看,在超大参数长上下文推理和CUDA生态依赖度高的场景中,迁移成本依然存在。它不是要取代所有GPU,而是为Agent高并发推理提供了一条更经济的国产路径。
全部0条评论
快来发表一下你的评论吧 !