作者:Arm 终端事业部产品管理高级总监 Stefan Rosinger
在之前有关 Arm Cortex-X925 CPU 的文章中,Arm 技术专家曾探讨了每时钟周期指令数 (IPC) 作为评估 CPU 性能的关键指标的重要性。与主要将频率作为性能指标的做法不同,IPC 衡量的是 CPU 每个时钟周期内能处理的指令数。对于移动设备而言,电池续航和散热管理是影响实际应用、用户体验和设备处理复杂工作负载的关键所在。因而,IPC 对于评估移动设备性能而言,至关重要。
更高的频率 ≠ 最优表现
IPC 越高,表示在一个时钟周期内执行的指令越多;即便时钟速度较慢,也能带来更好的性能。这对于内存受限的工作负载尤为重要,因为其性能会受到 CPU 外部因素的制约。更高的 IPC 使得 CPU 能以更低的频率运行,从而减少电量消耗和功耗,设备发热也会缓解。这对于需要保持稳定性能的移动设备来说,尤为有利。
虽然高频 CPU 乍听起来很有吸引力,但它并不能反映性能的全貌。频率表示 CPU 每秒完成的时钟周期数量,而 IPC 则表示每个周期所完成的工作量。事实上,最高频率很少会用到。例如,对于游戏和其他算力要求较高的工作负载来说,并不会以最大频率使用 CPU,大多数时间反而是以中档频率运行。此时的能效更高,可以延长电池续航时间并降低设备温度,而这两者是提升整体用户体验的重要指标。
在相同的时间周期内,具有更高 IPC 的 CPU 在处理实际应用和复杂工作负载时会表现出更优的性能。即便是当今具有复杂计算需求的 AI 应用(例如聊天机器人、实时语言翻译和虚拟助手),在 IPC 更高的 CPU 上运行时也会表现得更加出色。此外,就能效而言,在一个周期内执行更多的指令意味着可以更快地完成任务,使得 CPU 处于高能耗状态的时间减少,从而节省电池电量。
卓越的架构设计
在基于 Armv9 架构的 CPU 设计中,可伸缩向量扩展 (SVE2) 是提高 IPC 的关键所在。这一架构特性采用新的专用向量指令,是加速智能手机关键工作负载和应用的理想之选。
SVE2 可将 HDR 视频解码速度提高约 10%,这样用户在主流应用上观看点播视频时,能获得更长的电池续航时间。此外,通过加速常用的图像处理库,SVE2 还增强了视频通话期间用户体验的流畅度,同时提高了画面质量。其中包括更好的摄像头旋转体验,以及图像滤镜的切换和使用体验。
不仅如此,SVE2 还不受向量长度的影响,这意味着代码开发将支持更大的向量长度,例如 256 位。由此可确保与移动计算未来发展的兼容性,包括未来更注重逻辑扩展,而非 RAM 的先进工艺节点。移动端市场将因此能够适应更大的向量长度,有利于游戏和 AI 模型中 SVE 代码的呈现。
通过深入研究设计,IPC 性能可借助一系列特定的微架构改进得以提高。其中包括但不限于:
超标量乱序执行
分支预测和预取器
数据推测
适当的缓存选择
Arm Cortex CPU 一直在逐年推进各种类似的微架构改进,以实现更高的性能水平。
面向移动端的最新 Armv9 CPU
上述的架构特性和微架构提升是 Arm 面向移动端市场的最新 Armv9 CPU 的核心所在。作为 MediaTek 天玑 9400(已被搭载于 vivo X200 系列等旗舰智能手机)的核心,Cortex-X925 对私有 L2 缓存进行了升级,从 2MB 增加到 3MB。再加上 Cortex-X925 能够更加快速、高效地预取数据和复杂指令,从而显著增强了 CPU 的整体性能和能效。得益于此,Arm 计算平台在 2024 年实现了惊人的两位数 IPC 性能提升。
如此一来,终端用户能够享受到一系列实际性能的提升,包括更快的应用响应速度、更好的游戏体验、更流畅的视频流媒体传输、更快的网页浏览和顺畅的多任务处理。同时,更高的 IPC 也带来了能效的提升,延长了用户的沉浸式体验。
与此同时,Cortex-A725 作为 CPU 工作负载的主力,也进行了一系列针对性更新,着力于需要持续出色性能的关键 AI 和游戏用例。与 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每个 CPU 组件都能应对广泛的实际用例和复杂的工作负载。例如,Cortex-X925 可处理应用启动和网页浏览的“突发”工作负载,而 Cortex-A725 则可以在常见的移动端用例(包括游戏、网页浏览、基于摄像头的应用和视频流媒体)中持续提供稳定性能,以延长设备的使用时间(即电量耗尽之前,用户可在设备上使用某些用例的平均时间)。
打造无可比拟的移动端体验
从根本上说,移动设备需要兼具性能与能效,而 IPC 的提升恰好能同时满足这个需求。用户因而能更长时间体验各种需要高算力的应用。最新的 Armv9 CPU 将卓越的 IPC 水平与高时钟频率相结合,将性能和能效提升到一个更高的水平,从而为最终用户带来更加出色的用户体验。这也正是为什么全球 99% 的智能手机都基于 Arm 计算平台打造的原因之一。
全部0条评论
快来发表一下你的评论吧 !