苹果发布300亿参数多模态AI大模型MM1.5

CHANBAEK 2024-10-14 1116

苹果近日推出了全新的多模态AI大模型MM1.5，该模型拥有高达300亿的参数规模，是在前代MM1架构的基础上进一步发展而来的。

MM1.5模型继续秉承数据驱动的训练原则，深入探究了在不同训练周期中混合各类数据对模型性能的影响。苹果已经将相关模型文档发布在Hugging Face平台上，供开发者参考和使用。

除了基础的300亿参数版本，MM1.5还提供了从10亿到300亿不等的多种参数规模选择，以满足不同场景下的应用需求。该模型不仅具备强大的图像识别能力，还拥有出色的自然语言推理能力，能够实现多模态数据的融合处理。

此外，苹果还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面（UI）理解的MM1.5-UI模型。这两个模型进一步拓展了MM1.5的应用范围，使其在视频处理和移动设备交互领域也能发挥出色的性能。

MM1.5的发布标志着苹果在多模态AI技术方面取得了重要进展，为未来的智能应用开发提供了更加强大的技术支持。

打开APP阅读更多精彩内容