通义千问开源千亿级参数模型

描述

通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了Qwen1.5系列的Transformer解码器架构,并在技术上引入了分组查询注意力方法(GQA),极大地提升了模型在推理时的效率。

这款拥有1100亿参数的模型支持高达32K的上下文长度,同时展现出了卓越的多语言能力。无论是中文、英文、法语、德语、西班牙语、俄语,还是日语、韩语、越南语和阿拉伯语等,Qwen1.5-110B都能提供精准、流畅的语言处理体验。这一里程碑式的开源模型,无疑将为AI领域的科研人员、开发者和爱好者提供更为强大、灵活的工具。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分