电子发烧友网报道(文/黄晶晶)今年初,微软推出引入Copilot功能的全新个人电脑,Copilot作为AI语音助手被确定为AI PC不可或缺的按键以及功能,它能够在不需要云数据中心的情况下处理本地的人工智能任务。同时,微软还提出,这款全新电脑搭配拥有全新神经处理单元NPU的芯片,可实现每秒超过40万亿次即40+TOPS的运算。那么也就是说,若要符合微软给出的AI PC的定义,NPU的算力至少要达到40 TOPS。
这一定义的抛出,突显了NPU的重要性。半导体大厂们普遍认为CPU+GPU+NPU的组合将是AI PC的算力基座。
《AI PC产业白皮书》中指出AI PC五大特性,包括提供多模态自然语言交互、终端内嵌个人的大模型、标配本地混合AI算力、连接开放的AI应用生态、设备级个人数据和隐私安全保护。尤其是本地混合AI算力,即CPU+GPU+NPU异构混合算力保证了AIPC本地推理的可行性,同时随着端侧算力的快速提升,AIPC可以承载更大的AI模型,执行更加复杂的任务。
在分工上,CPU是计算机的运算核心和控制核心,GPU进行图形处理和大规模并发计算,NPU提供高效能和低功耗的神经网络运算支持,在多种应用场景中实用智能计算。三者的组合发挥各自的优势,协同工作,高效实现端侧AI的能力。
不过,当前来看NPU别说是多少算力的问题,甚至很多设备都还没有NPU。以安卓平台来看,目前70%的第三方 ML/AI 应用运行在CPU上,特别是一些低级别设备很难承担NPU的费用,CPU+GPU+NPU的组合或许要从高端设备开始。
AI PC的演进过程中,《白皮书》指出应分为AIReady阶段和AIOn阶段。在AIReady阶段,AIPC主要表现为芯片计算架构的升级,具备基本的本地混合AI算力,能够为AIPC的软件及服务创新提供基本保障,开启体验创新。
如今,NPU以及高算力NPU的导入已经开始。英特尔、AMD、苹果、高通等厂商纷纷推出了带有NPU的处理器产品,不少新产品的NPU算力都达到40 TOPS,高算力应对复杂且众多的本地AI大模型需求,为迎接AI PC的应用爆发做好准备。
英特尔
去年12月,英特尔正式发布酷睿Ultra处理器。它是首款基于 Intel 4 制程工艺打造的处理器,代表了40年来英特尔架构最大的革新。采用了先进的Foveros 3D 封装技术,在 CPU、GPU 和神经网络处理单元(NPU)的架构中集成了专属 AI 加速功能,从而成为英特尔历史上 AI 性能最强、能效最佳的客户端处理器。英特尔方面还宣布,将与主流 OEM 伙伴推出 230 余款机型,开启AI PC新纪元。
根据英特尔的酷睿 Ultra 产品路线图,2023年为Meteor Lake,2024年将有Lunar Lake、Arrow Lake,2025年为Panther Lake,2026年Future Products还没有具体架构代号。其中Lunar Lake采用台积电3nm工艺,NPU性能将是上一代的4倍,达到48 TOPS,满足 Copilot+ 需求。
另外,英特尔将于年内发布Arrow Lake处理器。报道称,Arrow Lake涵盖了台式机和笔记本电脑产品的多个细分平台,其中“S”用于台式机并采用LGA 1851插座,“HX”用于发烧级游戏本,算力方面,Arrow Lake-S和Arrow Lake-HX提供AI算力达37 TOPS,其中Arrow Lake-S/HX的GPU在新架构加持下,AI算力从3 TOPS提高到9 TOPS;内置的NPU提供13 TOPS的AI算力。
AMD
AMD于2023年5月推出的锐龙7040系列是全球首款内置XDNA架构NPU的X86处理器,同年12月推出锐龙8040系列移动处理器,提供高达16TOPS的NPU算力和39 TOPS的整体算力,相较上一代带来60%的AI性能提升。
在今年6月的台北电脑展上,AMD重磅发布了Ryzen AI 300 系列处理器,采用Zen 5架构、第三代AMD Ryzen AI,内置XDNA2 NPU,GPU升级为RDNA 3.5。
作为一款专为AI PC打造的处理器,其NPU算力可达50 TOPS,相较而言上一代Ryzen 8040系列芯片只有16 TOPS。
可以看到,这款处理器的亮点之一就在于NPU算力的大幅提升。AMD表示,XDNA2 NPU的计算能力提供5倍多,多任务并行能力翻一番,能效提升最多2倍。并且,XDNA2首次引入全新的Block FP16浮点精度,传统的8-bit INT8数据类型性能强但准确性低,16-bit FP16数据类型准确性高但性能弱。FP16 NPU可兼顾两者的性能与准确性,目前大多数AI应用都采用了16-bit精度。另外,AMD已经与超过150家AI赋能的ISV合作伙伴达成深度合作,进而为AMD Ryzen AI提供兼容性更好、性能体验更好的各类型AI应用。
苹果
2023年,苹果A17 Pro处理器对整块芯片进行了全方位提升,包括 Apple 有史以来最大规模重新设计的图形处理器。通过微架构和设计上的改进,全新的中央处理器实现了多达 10% 的速度提升,神经网络引擎的速度也提升多达 2 倍。采用台积电3nm工艺制程,其NPU拥有16核心,性能达到35 TOPS。
今年5月,苹果发布的11英寸和13英寸iPad Pro搭载了M4处理器,该处理器基于台积电第二代3nm工艺,拥有280亿个晶体管,NPU算力从18TOPS提升到38 TOPS。
在前不久的苹果全球开发者大会(WWDC)上,苹果宣布了全新的AI系统Apple Intelligence。要提升系统的AI能力,NPU的升级必不可少。今年9月苹果全新一代iPhone 16 Pro将配备最新的A18芯片,据悉台积电启动2nm芯片试产,苹果A18性能或提升30%,而在NPU性能上,有消息称A18有望超越苹果自家的M4处理器,可能达到45TOPS。
高通
此次微软首批Copilot+PC,搭载高通骁龙(Snapdragon)X Elite 芯片。高通于2023年推出为AI PC设计的骁龙 X Elite 处理器,该处理器集成高通定制 Oryon CPU,基于 4nm 工艺打造,采用 12 颗 3.8GHz 大核,全新 Hexagon NPU 最高可提供 45 TOP(每秒万亿次运算)算力,并且可以在设备上以“惊人的速度”运行超过 13B 参数的生成式 AI LLM(大型语言模型)。首批搭载骁龙X Elite 芯片的PC制造商包括荣耀、联想、小米等。
此外,消息称,联发科与英伟达联手研发Arm架构AI PC处理器,新款芯片将对标苹果M4,预计2024年第三季度完成设计,第四季度进入验证阶段,将采用台积电3nm工艺制造,并计划2025年发布。
小结:
微软给AI PC划了一条NPU算力的“红线”,基于微软强大的生态号召力,AI PC处理器厂商都十分重视NPU性能的提升,当然这也有利于后续AI PC上端侧AI真正的应用普及。40+ TOPS NPU也许会成为今后用户购买AI PC的一个必选项。
全部0条评论
快来发表一下你的评论吧 !