电子发烧友网报道(文/周凯扬)随着2023年步入尾声,无论是苹果还是高通,都已经推出了新一代的旗舰手机SoC,这也昭示着安卓与iOS阵营手机性能的又一次年末大比。然而,对比过去拼通用计算性能和通用图形计算性能的局面,今年两大厂商都已经开始卷向其他的计算负载,比如光追、超分这样的特殊GPU负载,以及终于被积极调动算力的NPU单元。我们就从CPU,GPU和NPU三个手机SoC主力计算单元来分析苹果A17 Pro和高通骁龙8Gen3在设计上新一轮迭代。
CPU,单核多核性能各有千秋
A17 Pro和骁龙8Gen3分别是基于台积电3nm和4nm工艺打造的芯片,在最先进的半导体工艺下,CPU上的提升尤其引人注目,尤其是苹果的A17 Pro还是首发3nm的芯片。然而在各路实机测试的表现中,两者的成绩却是各有胜负。
A17 Pro虽说用上了最先进的3nm工艺,且对微架构进行了一定的改进,最大主频从A16时期的3.46GHz大幅提升至3.78GHz,但A17 Pro依然保持了6核(2性能核+4能效核)的配置,即便是在苹果自己给出的性能指标中,相较上一代也只有10%的性能提升。
而高通的骁龙8Gen3 Kyro CPU,通过升级大核为Cortex-X4、升级中核为Cortex-A720、升级小核为Cortex-A520,并将一个额外的能效核转换成了性能核,从上一代的1:4:3配置,换成了1:5:2配置。正是因为在如此激进的设计改动下,8Gen3的CPU实现了30%的性能提升,20%的能效提升。
主流手机SoC CPU的Geekbench 6测试 / androidauthority
然而在Geekbench 6的测试中,我们还是能看到一些有意思的对比。根据androidauthority对iPhone15 Pro和骁龙8Gen3参考机的测试可以看出,在单核性能上,A17 Pro还是领先一大截的,而在多核性能上,骁龙8Gen3终于实现了反超。这不免让人期待起未来Snapdragon X Elite的CPU架构下放到手机SoC后,高通CPU的单核性能会有怎样的提升。
GPU,光追和超分辨率技术
至于GPU性能的对比,结果与上一代似乎并没有太大不同,在3D Mark的测试中,A17 Pro的GPU全方位落后于骁龙8Gen3。根据苹果的说法,他们对这一代GPU进行了历史上最大的一次重新设计,但从这个结果来看,重新设计的方向应该主要放在了硬件光追和超分技术上,其相比前代提升的20%GPU性能还是无法与骁龙8Gen3相提并论。
主流手机SoC GPU的3DMark测试 / androidauthority
今年的手机SoC设计中,硬件光追已经成了标配。苹果称其GPU加入的硬件光追相较基于软件的光追,速度提升了4倍,更适合用于沉浸式AR应用和游戏体验。不过相较从上一代骁龙8Gen2就开始布局硬件光追的高通来说,苹果在硬件光追上的性能水平还是有所不及。从上面的3DMark光追测试成绩可以看出,8Gen3的硬件光追加速性能要高出A17 Pro一大截。
高通在硬件光追的开发上也领先于苹果,相比去年8Gen2仅有实时光追支持,今年的骁龙8Gen3还加入了对虚幻5引擎Lumen全局光照和反射系统的支持,可以实现比普通硬件光追更好的光线表现效果。
除了硬件光追以外,无论是高通还是苹果,都在这一代GPU的设计中加入了超分辨率的技术,比如苹果的MetalFX和高通的Snapdragon Game Super Resolution(GSR)。为了运行性能要求更高的3A游戏大作,仅仅靠堆高GPU性能是远远不够的,受限于智能手机的散热结构,我们需要英伟达DLSS或AMD的FSR这类超分辨率技术进一步降低配置要求和功耗。
去年的WWDC 2022上,苹果正式宣布了MetalFX这一超分技术,利用相对较低分辨率的图像输出更高的分辨率,从而减少渲染负载,提高应用或游戏体验。不过届时该技术主要是为M2系列的处理器开发的,而如今苹果已经打算将这一技术引入手机GPU。
手机超分技术对比 / 高通
而高通则在今年推出了GSR这一超分技术,高通宣称可以提供10bit HDR 144FPS的游戏性能体验。从上述超分技术对比中可以看出,GSR最高可以实现两倍的超分。高通还表示,虽然GSR技术兼容大部分GPU,但只有在骁龙硬件平台上才能发挥出最大性能。
不过在实现方式上,苹果的MetalFX和高通的GSR还是有一些区别的。高通的GSR是一项单通空域超分辨率技术,与AMD开源的FSR 1.0实现方式一样。而苹果的MetalFX,则给到了开发者选择,既可以采用空域超分辨率技术,也可以使用FSR 2.0一样的时域抗锯齿超分辨率技术。
不过,高通选择这一技术路线不是没有原因的,首先空域超分更容易达到较好的性能和图像质量表现,比过去的插值超分在边缘细节上更有优势。而时域超分虽说可以实现更好的图像质量,但其所需的数据输入在手机图形的渲染管线却不常见,只有一部分PC游戏移植到手机上更适合这一方案。
这点从苹果MetaFX的开发文档中也可以看出,如果只选择空域超分的话,开发者只需要输入像素色彩,而选择时域超分则需要提供像素色彩、深度和动态信息,这对游戏开发者来说,就需要在渲染管线上花更多的工夫。所以高通的GSR和苹果MetaFX中的空域超分更容易适配,相信未来即将支持超分的一大批游戏都会选择这一方案。
NPU,设备端生成式AI
自今年生成式AI成为热门应用后,手机SoC厂商以及大模型应用开发者们均看到了手机AI计算单元NPU的另一大功用。尤其是在高通骁龙8Gen 3的产品详情中,高通着重介绍了这一芯片平台在生成式AI上的优势。
骁龙8Gen 3的Hexagon NPU相较上一代有了质的提升,性能提升高达98%,能效比提升高达40%。这也是高通首度在NPU中加入支持多模态生成式AI模型的AI引擎,该引擎支持LLM(大语言模型)、LVM(语言视觉模型)和ASR(自动语音识别)模型,端侧最大支持100亿参数的模型。
在LLM上,以Meta 70亿参数的Llama 2模型为例,骁龙8Gen 3支持到20token每秒的表现。同时NPU也进一步提高了Sensing Hub各大传感器调用用户数据的能力,比如同时支持两个始终感应的摄像头等。
苹果今年似乎并没有着重强调A17 Pro的神经引擎,除了35TOPS的计算性能。不过从M2和M3系列的神经引擎配置来看,苹果或许对于A17 Pro这一智能手机SoC的AI性能有更多的准备。要知道,同为16核的神经引擎,去年的A16和M2芯片其AI算力只有17 TOPS,哪怕是刚公布的M3系列芯片,其AI算力都只有18TOPS。
写在最后
至此,我们看到了高通和苹果两家厂商对于AI计算的重视,只不过两者的侧重点略有不同。比如目前苹果目前更注重于打造“直觉式AI”,着重加强设备端系统级AI和多媒体AI的表现,比如输入法自动更正、个人语音、拍照人像模式、第三方app中的图片降噪/超分等。而高通已经开始拥抱生成式AI,尤其是智能语音助手的AI性能,也给到了第三方AI应用开发者更自由的硬件资源调用。
然而无论是从纸面参数,还是从各大性能测试得出的结果可知,安卓旗舰SoC与苹果SoC的性能代差已经完全消除了,甚至前者在GPU性能上已经实现了反超。由此也可以看出,半导体工艺提升带来的性能收益已经在缩小,反而是芯片微架构和核心配置决定了最终的手机SoC性能。
全部0条评论
快来发表一下你的评论吧 !