Qualcomm收购Nuvia终于要开花结果

描述

‍‍ 虽然Qualcomm在Android手机的Arm SoC市场取得了巨大成功,但他们也在努力将其转化到其它市场,但迄今为止还没成功。该公司已经为Windows-on-Arm笔记本电脑生产了几代芯片,尽管每一代多少都有点改进,但这还不足以撼动Intel绝对的主导地位。虽然Windows-on-Arm成绩不理想不仅仅是Qualcomm的问题(对于OS和软件来说也有很多可说的),但芯片肯定也起到了一定作用。为了在市场上取得突破,仅仅渐进式改进是不够的。Qualcomm需要在性能上取得重大飞跃。

历经三年的努力,Qualcomm现在正准备实现这一目标。前两天,Qualcomm发布了他们即将推出的Snapdragon X Elite SoC,这是他们为Windows设备设计的下一代Arm SoC。基于子公司Nuvia的全新Arm CPU内核,名为“Oryon”。但Snapdragon X Elite也可能只是新一代Qualcomm SoC设计中的冰山一角。它不仅是迄今为止Qualcomm最重要的Windows-on-Arm SoC的核心,且最终将用于智能手机和更多其他设备。

现在让我们来看下Snapdragon X Elite SoC和支撑它的Oryon内核。

尽管这次发布并并没有太深入的内容,但这是我们第一次看到Qualcomm的旗舰SoC及其内部的新CPU内核。新款SoC将在2024年中期发布,终端设备大概又会在那之后几个月才会上市。目前,Qualcomm已经完成了芯片开发工作,随着芯片的规格确定,现在正在为明年的发布进行最后的打磨。

Snapdragon X Elite中的Oryon CPU内核是Qualcomm在2021年初收购Nuvia后的成果,在被收购之前Nuvia团队也已经进行了一段时间相应的开发。该团队的雄心壮志,以及定制的Arm架构CPU内核的重要性,都不可低估。因此,Snapdragon X Elite将在多个层面上成为一个有趣的芯片,因为这为Qualcomm的下一代芯片设计定下了基调。

soc

从高层次看这款芯片,Snapdragon X Elite是一款为Windows-on-Arm笔记本设计的高性能SoC。Qualcomm并没有列出任何官方TDP(Thermal Design Power)值,但表示Elite设计用于跨越“广泛范围”的热设计。为了充分发挥Elite的性能,需要主动冷却,但据Qualcomm称,也有可能使用被动/无风扇的设计。

Qualcomm在一个未知的4nm工艺上制造这款芯片。考虑到他们之前因采用Samsung的4nm工艺出现过性能问题,这次他们很可能会采用TSMC代工(可能是N4P)。芯片本身是一个传统的单片芯片,所以这里没有使用chiplet或其他高级封装(wireless部分是独立的)。

CPU:12个Oryon

此次发布的主角是Oryon,Qualcomm最新的定制化Arm CPU内核。这是由Qualcomm在2021年收购的Nuvia团队设计的,Oryon是Qualcomm历经多年推出的第一款高性能、完全定制的Arm CPU内核。继基于Arm Cortex-A/X的多代平庸的SoC后,Oryon标志着Qualcomm的一个重大转向。

由于这只是一个预告,目前我们还不知道Oryon的重要架构细节。我们不知道带宽、各种buffer大小、执行端口等。但我们确实知道,Qualcomm在这款SoC上给予了厚望。在被收购之前,Nuvia团队就在研究一个服务器级别的CPU内核,这种激进的设计也延续到了Oryon中。毕竟,这也是Qualcomm收购Nuvia的主要目标之一,因为他们希望有一个高性能的CPU内核来帮助他们超越其它笔记本芯片供应商(当然,最终也会包括移动设备)。

soc

Snapdragon X Elite SoC搭载了12个Oryon CPU内核。与Qualcomm的8cx系列不同,没有基于不同微架构的明确的“能效”和“性能”核;这是一个同质的CPU设计,更类似于传统的PC处理器。这意味着Oryon需肩负双重职责,在重负载下表现出色,而在轻负载下又不能功耗太高。

Oryon CPU内核被分配成三个集群,每集群4个核。当然,我们还需进一步等待更多技术细节,但可以放心地假设每个集群都有自己的电源轨,所以当只需要少量核时,不需要的集群可以被关闭。

仅这一点,Snapdragon X Elite看起来就比8cx性能要强得多。8cx Gen 3只提供了4个性能核(Cortex-X1)和4个能效核(Cortex-A78)。Snapdragon X Elite的CPU内核多出了50%,更不用说那些核的性能也更高。对于一个笔记本芯片来说,Qualcomm竟然投入了这么多CPU内核。

至于时钟速度,在all-core turbo负载中,所有12个Oryon CPU内核在功耗和热管理容量允许的情况下可达到3.8GHz。而在较轻的负载中,芯片支持2个核的turbo速度高达4.3GHz。Qualcomm在PPT上每个集群只显示了其中一个核,但目前尚不清楚这是否是某种主核的意思(即只有某些部分核才是这个速度)。

soc

无论如何,Qualcomm都计划为该芯片设计很高的时钟速度,这与8cx形成了显著差别。虽然时钟速度高本身并不直接代表芯片速度快,但8cx芯片的性能瓶颈之一就是时钟速度,所以如果Oryon提供的IPC速率如我们所猜测的那样高,这将极大地提高Qualcomm的CPU性能,使其能够与行业最强的玩家竞争。

内存:128位LPDDR5x

为强大的Oryon CPU内核(以及其他部分)提供支持的是一个128位的LPDDR5x内存总线。这与芯片的CPU部分相比并不那么引人注目,但仍然很重要。之前的8cx只支持LPDDR4x,采用LPDDR5x让Qualcomm在内存技术支持方面重新与最新的PC芯片持平。并且支持的数据速率高达LPDDR5x-8533,这是目前市面上最快的内存控制器之一。

soc

Qualcomm还表示,系统中42MB的缓存位于各种处理器模块和系统内存之间。考虑到明确说到是“total cache”,这几乎肯定是L2+L3。先前的芯片是6MB共享的L3。如果这次也是这种情况,意味着每个CPU内核有3MB的L2缓存,或者有某种排列组合。

GPU:最新一代Adreno

Snapdragon X Elite集成了最新一代的Adreno GPU。对于GPU,Qualcomm的惯例是几乎不谈架构细节,但这应该是Qualcomm内部GPU设计的最新的迭代。

从功能的角度看,这是一个支持ray tracing的DirectX 12级GPU,与Qualcomm去年推出的Snapdragon 8 Gen 2 SoC的功能相呼应。在Windows生态系统中,它几乎肯定会被认为是DirectX 12 Ultimate(feature level 12_2)设计。

soc

Qualcomm为这款设计提供了一个单一的吞吐量数据:在未指定的位深/格式下达到4.6TFLOPS(猜测是FP32)。Qualcomm之前的8cx没有披露过类似数据,所以很难说怎么比较。或者,与其他公司的GPU相比如何,因为真实世界的GPU性能不仅仅是纯粹的FLOPS。

该GPU的显示控制器部分支持最多4个DisplayPort显示器。除了笔记本内部显示器外,它还可以驱动另外3个外部显示器(全部为DP 1.4),其中一个输出支持5K,其余的支持4K。

最后,这块SoC还搭载了Qualcomm的最新VPU(Video Processing Unit)。这种最新设计不仅支持AV1解码,而且首次支持Qualcomm SoC的AV1编码。

NPU:Hexagon发挥出色

除了使用Oryon CPU核心外,Qualcomm在Snapdragon X Elite SoC上的另一个大赌注与他们最新一代的Hexagon NPU有关。Qualcomm预计AI的使用将在未来几年内继续迅速增长,下一个大的推动力将是在用户的系统上本地运行的AI模型。因此,他们在这一代的芯片(X Elite和8 Gen 3)的Hexagon NPU上投入了大量资源。

因此这一代NPU的性能应该大大超过8cx Gen 3。Qualcomm在这里引用了相对低精度INT4的45 TOPS性能,而8cx Gen 3则为未指定的数据格式的15 TOPS。

soc

与他们的CPU和GPU不同,Qualcomm在这里分享了关于NPU的一些架构细节,以及他们为提高其性能所做的努力。用于最密集的矩阵数学的tensor加速器模块,速度直接比以前快了2.5倍。支持它(以及NPU的其他部分)的是一个2倍大的共享内存/缓存(尽管Qualcomm没有披露实际的大小)。Qualcomm这一变化主要是针对LLM,因为LLM高度依赖内存。据Qualcomm称,该芯片将有足够的资源来在本地运行一个拥有130亿参数的Llama 2模型。

Qualcomm还做了一些电源供应的变化,以帮助从NPU中获得更多的性能/效率。功耗大的tensor模块现在有自己的电源轨道,而NPU的其余部分位于一个单独的共享轨道上。该公司还对他们处理推断工作负载的微切片方式做了一些改进,直接影响了他们如何拆分工作负载以尽可能地保持NPU的各种子模块忙碌,同时最小化中间内存操作。

I/O:USB4、PCIe 4和独立Wi-Fi 7

再来说说Snapdragon X Elite的I/O部分。

在内部I/O方面,SoC为NVMe存储提供PCIe 4.0连接。在其它地方,使用PCIe 3为其modem和Wi-Fi解决方案提供连接。尚未提及是否有任何空闲的PCIe通道可用于其它外围设备。

对于外部I/O,SoC支持USB4。据Qualcomm称,它可以驱动多达3个此类Type-C端口,还有一对USB 3.2 Gen2输出以及一个供内部使用的USB 2.0输出。

如前所述,该SoC的Wi-Fi和modem都是独立的。这款芯片旨在与Qualcomm的FastConnect 7800芯片组成的M.2卡配对。7800是他们最新一代的Wi-Fi 7解决方案,支持4个空间流以及Bluetooth 5.4。Modem配对是Snapdragon X65,这是一款高性能的5G modem,也适用于8cx Gen 3。

Wireless系统没有集成到SoC中对于Qualcomm来说是不寻常的,但鉴于他们希望尽快推出Elite,也不意外。集成这些模块需要更多时间,而作为一款笔记本SoC,Qualcomm不需要那么节省空间。无论如何,Qualcomm的官方立场是,独立的modem是为了为OEM提供灵活性(可选是否包含modem)。当然,Qualcomm当然会强烈鼓励OEM选择这款差异化的选项。

性能

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

由于没有足够的架构细节来做有意义的性能预测,目前只有Qualcomm与竞争对手的模糊比较。这也是Qualcomm为该芯片提供的与能效数据最接近的东西(尽管,如往常一样,SKU的目标时钟速度在其中起到了巨大的作用)。

凭借12个性能核,Qualcomm正在大力推进多线程性能。事实上,多线程性能是Qualcomm做出的唯一CPU性能比较,因为没有单线程比较可言。对此你可以有自己的看法。

soc

相对于一个暗示是Intel的12核CPU设计,Qualcomm报道称Snapdragon X Elite在Geekbench 6中的多线程性能提供了2倍的提升。或者说,在相同的性能下,它们的功耗只有对方的1/3。

soc

即使与Intel最好的14核(H-class)芯片相比,Qualcomm仍然说他们在性能上领先60%,而且在相同的性能下功耗还是只有1/3。无疑,这很大程度上归因于工艺节点,因为TSMC N4应该相较于Intel现有的Intel 7工艺提供了显著的优势。但Snapdragon X Elite应该在明年发布时与基于Intel 4的Meteor Lake系列竞争。

更有趣的是,Qualcomm说与一个“基于Arm的竞争者”在多线程性能上有50%的优势。这可能是在暗指Apple,另外MTK确实也提供一些基于Windows-on-Arm的芯片。

soc

soc

Qualcomm还预计会在3DMark Wildlife Extreme中在GPU性能上领先。再次,凭借工艺节点优势和制造更大iGPU的整体趋势,这也不足为奇。

当然,我们对这些声明还是要保持谨慎态度,尤其是对于一个仍然距离发布还有几个月的平台。

2024年中旬出货

总结一下,Qualcomm目前正在为Snapdragon X Elite做最后的准备。公司认为这是“公司近期历史上最关键的平台公告”之一,而且理由充分。Oryon CPU内核最终将会扩展到更多产品,所以Oryon的竞争力将决定Qualcomm未来几代设计的成败。

soc

基于Snapdragon X Elite的设备预计将在2024年中期上市。按照这个时间表,同期的竞品Snapdragon X Elite应该会与Intel的Meteor Lake(Core Ultra)、AMD的Phoenix(Ryzen Mobile 7000)以及Apple M系列的最新版本竞争。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分