描述
电子发烧友网报道(文 / 吴子鹏)当 AI 从 “尝鲜玩具” 演变为 “生产力工具”,Token 消耗量随用户规模与单用户使用量双重增长呈指数级攀升,AI 计算的重心正快速从云端训练转向端侧推理。在这场端侧 AI 赛道的卡位战中,作为国内芯片 IP 领域的核心企业,安谋科技(Arm China)如何研判行业趋势,又亮出了哪些核心技术与解决方案?
5 月 28 日,在第十届集微大会端侧 AI 峰会上,安谋科技(中国)有限公司产品战略总监张冰带来题为《场景驱动、协同创新、赋能抓住端侧 AI 机遇》的主题分享。他表示,随着 AI 性能迎来爆发式增长,人工智能在图像分类、文本阅读理解、竞赛级数学运算、多模态理解与推理等诸多领域的表现已超越人类水平,全面跨过 “可用” 门槛;在数学推理、多模态计算机操作、软件工程等方向,AI 能力也正快速向顶尖专业人才看齐。
与此同时,Token 消耗量指数级上涨,本质是 AI 推理需求的大幅激增。Token 流量爆发将推动云端与端侧协同演进,催生出全新的 AI 分层计算架构。而这一产业落地的核心前提已然成熟:轻量化模型的智能化水平大幅提升,让端侧部署大模型成为现实。依托模型蒸馏、量化、架构优化等一系列技术,3B、7B 参数量级模型的性能持续突破,从 “可用” 迈向 “好用”,端侧运行大模型不再只是停留在概念层面。
张冰强调,端侧 AI 并非云端模型的简单轻量化移植,而是由本地大模型 + 智能路由 + 云边协同构筑的全新智能入口,离不开硬件、软件、算法的全栈协同创新。
凭借 Arm 三十余年在终端场景的深厚技术积淀,安谋科技以前瞻视角布局端侧 AI 领域,以系统级解决方案(Total Solution) 为核心,形成三步走发展思路:
·立足场景:聚焦终端真实应用需求,明确产品研发方向;
·前瞻布局:精准研判技术发展趋势,提前规划产品矩阵与生态体系;
·生态协同:携手产业链伙伴联合定义需求、协同研发落地解决方案。
安谋科技的最终目标是实现端侧 AI 全栈方案落地,打造硬件 + 软件 + 服务一体化能力。整体布局围绕端侧 AI 推理场景全面铺开:硬件层覆盖 IP / 芯片、模组 / 开发平台、参考设计;软件层包含 SDK、工具链、算法适配、系统调优;服务层提供联合性能调优、全方位技术支持,打通端侧 AI 从研发到落地的全链路。
在核心 IP 产品方面,张冰重点介绍了面向中高算力场景的周易系列 NPU,以及主打 AIoT 场景的Ethos系列 NPU。其中,周易 X3 采用专为端侧大模型打造的新一代 DSP+DSA 架构,计算模式从定点运算升级为浮点运算;单集群算力区间为 8-80 FP8 TFLOPS,支持灵活配置,单核带宽可达 256GB/s,兼容 W4A8、W4A16 等混合精度加速模式。芯片集成 AI 专用硬件引擎 AIFF,搭配硬件级调度器,可灵活适配端侧多任务运行场景。
配套的周易 Compass AI 软件平台,能够对大模型全链路性能进行深度优化,具备行业领先的大模型动态 Shape 适配能力,兼容 GPTQ 等主流大模型量化方案,并原生支持 Hugging Face 模型库。该平台上线之初便已适配 160 余种算子、270 余款模型,大幅提升 AI 应用的开发与部署效率。
针对智能家居、可穿戴设备等 AIoT 低算力场景,Ethos 系列 NPU 算力控制在 4 TOPS 以内,以极致的低功耗、小面积为核心优势,可满足低成本、低功耗终端的 AI 推理需求,推动 AI 能力全面普及。
结语
端侧 AI 产业已迎来爆发拐点。安谋科技坚持以场景为导向、以协同创新为抓手,依托全栈解决方案持续筑牢端侧 AI 产业基础设施。未来,企业将进一步结合 Arm 全球生态优势与本土创新能力,赋能芯片设计企业与终端厂商,紧抓端侧 AI 战略机遇,共建智能终端全新产业生态。
打开APP阅读更多精彩内容