壁仞科技完成阿里巴巴通义千问Qwen3全系列模型支持

描述

4月29日,阿里巴巴通义千问发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,壁仞科技完成全系列支持,并率先在壁仞科技开发者云平台上线。

性能卓越,Qwen3部署成本大幅下降

Qwen3包括两款混合专家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同时还包括六个密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。从官方披露的数据来看,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹。

基于广泛的训练,Qwen3在推理、指令跟随、Agent能力和多语言支持方面取得了突破性的进展,不仅是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,大大节省算力消耗;部署成本大也幅下降,显存占用仅为性能相近模型的三分之一。

极速响应,数小时全系列适配

壁仞科技依托自研的壁砺系列通用GPU架构与深度优化的软件栈,在Qwen3正式发布后,仅用数小时完成Qwen3全系列模型的适配工作,并成功上线开发者云平台。

与此同时,壁仞科技快速响应,推出基于壁砺系列一体机,包括便捷4卡机、通用8卡机、高密16卡机,全面支持Qwen3全系列模型。

Qwen3开源更重要的行业意义在于推动大模型技术的普惠和应用的落地。据相关媒体报道,Qwen3显著降低了设备适配的技术门槛以及部署成本,可满足海量中小企业和AI开发者的需求,从而加速AI推理应用落地。

用户访问以下链接或点击阅读全文即可体验部分模型:

https://sgc.birentech.com:5000/

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分