阿里云通义开源长文本新模型Qwen2.5-1M

科技绿洲 2025-02-05 1150

　　近日，阿里云通义宣布了一项重大开源举措，推出了支持100万Tokens上下文的Qwen2.5-1M模型。这一新模型在处理长文本任务中展现出了卓越的性能，稳定超越了GPT-4o-mini。

　　Qwen2.5-1M模型提供了7B和14B两种尺寸供用户选择，以满足不同场景下的需求。在处理长文本输入时，该模型能够保持稳定的性能，为用户提供更加准确、可靠的输出结果。

　　除了推出新模型外，阿里云通义还同时开源了推理框架。这一框架在处理百万级别长文本输入时，可实现近7倍的提速，极大地提升了用户的处理效率。通过这一框架，用户可以更加便捷地应用Qwen2.5-1M模型，实现长文本处理的高效化。

　　阿里云通义此次开源的Qwen2.5-1M模型和推理框架，为人工智能领域带来了新的突破。这一举措不仅提升了长文本处理的能力，也为用户提供了更加便捷、高效的使用体验。未来，阿里云通义将继续致力于人工智能技术的研发和创新，为用户提供更加卓越的产品和服务。

打开APP阅读更多精彩内容