字节豆包大模型团队提出稀疏模型架构

CHANBAEK 2025-02-13 1421

字节跳动豆包大模型Foundation团队近期研发出UltraMem，一种创新的稀疏模型架构，旨在解决推理过程中的访存问题，同时确保模型效果不受影响。

UltraMem架构通过将计算和参数解耦，实现了高效推理。与传统的MoE（Mixture of Experts）架构相比，UltraMem在推理速度上实现了2-6倍的提升，并且显著降低了推理成本，最高可达83%。这一成果对于解决MoE推理时高额的访存问题具有重要意义。

豆包大模型Foundation团队表示，UltraMem架构的提出，不仅优化了模型推理的性能，还推动了稀疏模型架构的发展。未来，他们将继续致力于AI技术的创新，为更多应用场景提供高效、可靠的解决方案。

UltraMem架构的推出，展示了字节跳动在AI领域的技术实力和创新精神，也为行业带来了新的发展机遇。

打开APP阅读更多精彩内容