阿里云通义千问720亿参数模型宣布开源

描述

  12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

  据了解,Qwen-72B是基于3T tokens高质量数据进行训练的模型,在10个权威基准测试中表现出色,超越了闭源的GPT-3.5和GPT-4。

  阿里云是国内最早开源自研大模型的科技企业,通义千问是第一个全尺寸开源的大模型,从18亿、70亿、140亿到720亿参数规模。用户可以在魔搭社区直接体验Qwen系列模型的效果,也可以通过阿里云灵积平台调用模型API,或者在阿里云百炼平台上定制大模型应用。此外,阿里云人工智能平台PAI为通义千问全系列模型提供了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

  开源模型Qwen-1.8B在推理2K长度的文本内容时只需3G显存,可以在消费级终端上进行部署。而Qwen-Audio可以感知和理解各种语音信号,包括人声、自然声、动物声和音乐声等。用户可以输入一段音频,并要求模型对音频进行理解,甚至进行文学创作、逻辑推理和故事续写等任务。

  阿里云CTO周靖人表示,开源生态对于推动中国大型模型的技术进步和应用实践至关重要。通义千问将继续投入开源,并希望成为“AI时代最开放的大型模型”,与合作伙伴共同推动大型模型生态建设。

  审核编辑:黄飞

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分