骁龙865背后的CPU+GPU模块技术解析

电子说

1.3w人已加入

描述

手机的“心脏”只有指甲盖大小,但凭借着高集成度的SoC身份,这种芯片却完美诠释了“麻雀虽小五脏俱全”的定义。

如果说指令集架构和制程工艺决定了SoC的天赋(详见《硬核科普!为啥说SoC的性能取决于架构和工艺?》),那SoC的直观战斗力则全看CPU+GPU模块的规格了。骁龙865之所以是Android手机圈综合性能最强的SoC,就是源于其集成的GPU更加强悍。

接下来,我们就将SoC分解,并先来看看影响其绝对性能的这两个关键模块。

*****CPU:性能基石*****

在SoC的组成部分中,CPU是最关键的核心单元之一,我们可以将它理解为PC上的酷睿处理器,而它的强弱主要受到以下几个参数的影响。

手机专用的SoC都属于“ARM处理器”,而ARM公司与芯片厂商的合作则存在3种形式:

原生Cortex-A系列架构

ARM公司平均每年都会推出全新的“原生”(公版)架构,包括性能级的Cortex-A7x,以及效能级的Cortex-A5x,前者可以作为CPU中的“大核”,目前SoC正好处于Cortex-A76向Cortex-A77之间的过渡阶段,2020年中旬ARM还将祭出Cortex-A78架构。

Cortex-A架构版本越高,性能越强

后者则属于CPU中的“小核”,Cortex-A73或更早期的大核都会与Cortex-A53搭配,从Cortex-A75开始则与Cortex-A55“联姻”,短期内ARM还没有更新效能级核心架构的计划。

基于Cortex的半定制化架构

芯片商在拿到ARM原生Cortex-A的架构后,可以对其进行一定程度的改造,从而实现更高性能、更多功能或更低功耗。

高通旗下的骁龙SoC总会采用名为“Kryo”的核心架构,而它们就都是基于原生Cortex-A架构半定制化而来,业内人士还习惯将这种形式称为“魔改”。

华为从麒麟980开始,包括最新推出的麒麟820,也是主打Cortex-A Based,理论上也是一种半定制化的魔改。

基于指令集的自研架构

如果芯片商只凭借ARM的指令集授权,并在此基础上研发芯片,则可被归类到“自研”架构。

比如骁龙820采用的Kryo核心、三星猫鼬(Mongoose)核心、苹果从A5往后的SoC就都采用了在ARM指令集基础上的自研CPU架构。

soc

从ARM授权的成本角度来看,采用原生架构的授权费用最低,魔改次之,基于指令集的授权最高,而且芯片商想在ARM指令集基础上加以定制优化以形成自己独特的设计,还需要强大的研发实力,所以目前只有苹果、高通和三星有所涉猎。

从性能的角度来看,不同时期的架构之间则存在明显的性能压制,比如Cortex-A77天生就比Cortex-A76更强,但同一时期的原生、魔改和自研架构之间的差异其实并不大,主要还是受制于核心数量、多丛集和最高主频方面的影响。

多丛集设计

我们都知道Cortex-A7x性能比Cortex-A5x更强,为什么没有SoC采用全部由Cortex-A7x打造的多核处理器?

答案很简单,高性能的背后就是高功耗,为了让智能手机可以具备至少一天一充的续航底线,手机SoC必然要采取“大小核”(Cortex-A73之前称Big.Little,Cortex-A75之后为DynamIQ Big.Little)的搭配策略。

soc

从Cortex-A75开始,DynamIQ技术可以实现更灵活的核心搭配

为了更好地权衡性能和功耗,手机SoC在“大小核”的基础上还引入了“多丛集”的概念,比如联发科天玑1000就是了“4+4”双丛集的代表,由4×Cortex-A77和4×Cortex-A55共计8个CPU核心构成。

麒麟990和骁龙865都是三丛集代表,差异是前者采用了“2+2+4”(2×A76+2×A76+4×A55),后者则是“1+3+4”(1×Kryo 585+3×Kryo 585+4×Kryo 585),即大核+中核+小核三种核心搭配的策略。

在不考虑功耗的前提下,自然是大核架构越先进,数量越多性能越强。

骁龙865的三丛集设计

但是,现实中SoC在全速运行(玩游戏)时CPU非常容易因过热而触发降频机制,从而导致性能骤降引起卡顿问题。

因此,“2+6”的双丛集和“1+3+4”或“2+2+4”的三丛集设计正逐渐成为主流。

运行频率

CPU的性能强弱,除了受制于核心架构和多丛集设计,运行频率的影响总是更加立竿见影。

我们都知道Cortex-A77架构比Cortex-A76架构强,但2019底才刚刚量产的联发科1000L(大核为Cortex-A77)的CPU性能却还不如2018年底上市的麒麟980(大核为Cortex-A76)。

原因很简单,联发科1000L的大核主频只有2.2GHz,而麒麟980的主频则高达2.6GHz,更高的主频足以弥补核心架构和大核数量上的劣势。

相同SoC的手机之间,散热设计越好的手机性能往往也是最强的

因此,对于同期同级别的SoC而言,谁的CPU主频更高,往往更容易取得性能上优势。当然,前提是手机自身的散热设计必须过硬,可以让CPU长时间运行在预设的最高主频上。

*****GPU:游戏引擎*****

GPU是SoC中重要性仅次于CPU的单元,我们可以将它理解为PC上的独立显卡,一款手机能支持多高的分辨率、刷新率、玩游戏能跑出多少帧数,几乎都需要看GPU的脸色。

GPU品牌

和SoC中的CPU单元由ARM一家独大不同,其集成的GPU单元还未江湖一统,在Android手机领域正处于“三国争霸”的格局——高通旗下的骁龙SoC全部集成自家Adreno品牌的GPU,华为/三星旗下的SoC则青睐ARM公司推出的Mali品牌GPU,联发科则经常“脚踏两只船”,ARM Mali GPU和Imagination公司的PowerVR GPU都有所涉猎。

据悉,三星已经携手AMD,在未来Exynos SoC很可能会集成由AMD授权的RDNA架构GPU,而华为也正在开展自研GPU的项目。

核心架构

和ARM CPU架构总在不断升级一样,各个品牌的GPU每隔1年~2年也会完成一次迭代。

其中,高通Adreno GPU刚刚完成了Adreno 500向Adreno 600的全面升级,从定位中低端的骁龙665(Adreno 610)到最新的顶级旗舰骁龙865(Adreno 650),Adreno 6x0中的“x”数字越大代表性能越强。

ARM Mali品牌的高端GPU正经历由Mali-G76(与Cortex-A76 CPU搭配)向Mali-G77(与Cortex-A77 CPU搭配)过渡,而中端GPU很快也要从Mali-G52升级到Mali-G53。

soc

ARM Mali GPU的发展路线

在大的方向上,Mali-G7x肯定强过Mali-G5x,并同样是“x”数字越大代表性能越强。Imagination GPU很快也要从第九代(PowerVR 9)过渡到第十代(PowerVR IMG A),考虑到该系列GPU比较小众,我们就不在本文赘述了。

如果你想了解更多手机GPU的历史和相关技术,请参考《手机处理器的GPU谁最强?看完这篇文章你就懂了!》这篇文章。

计算单元

在现实中,很多GPU都采用相同架构的核心,但它们的GPU性能却存在很大的差异。

比如,骁龙675(Adreno 612)和骁龙730(Adreno 618)集成的都是Adreno 61x系列GPU,麒麟990和Exynos 980集成的也都是Mali-G76 GPU,但它们两两之间的3D性能却不可同日而语。

DIY用户都知道,PC领域的独立显卡会根据不同数量的“流处理器”来划分档次。

手机SoC内的GPU也是如此,只是这里的“流处理器”叫法不同,高通Adreno GPU称做“ALUs”,ARM Mali GPU则叫“Shader Core”,我们习惯将它们统称为“计算单元”。

还是以麒麟990和Exynos 980为例,前者为Mali-G76 GPU搭配了16个计算单元,即Mali-G76MP16,而后者的计算单元数量只有5个,即Mali-G76MP5,所以麒麟990的3D性能至少2倍~3倍于Exynos 980。

图形接口

在3D游戏的开发中,API图形接口越先进,GPU的执行效率越高。

如果手机GPU恰好支持这种API,就能最大限度避免“负优化”,还有机会实现“越级挑战”。

手机SoC GPU所支持的API主要以OpenCL、OpenGL、Vulkan和DirectX为主,目前它们最新的版本分别为OpenCL 2.0FP、OpenGL ES3.2、Vulkan 1.1和DX12,很多最新的GPU加入了多神经网络加速器的优化,可配合NPU单元进一步加速AI运算。

soc

从2018年底开始很多中端手机玩《王者荣耀》也能启动60FPS模式并比同时期的旗舰级还要流畅,就是因为该游戏推出了Vulkan API的优化版,可以进一步释放新款GPU的全部潜力。

运行频率

和CPU一样,GPU的强弱除了架构之外,也受到运行频率的牵制。联发科Helio G90、骁龙730和骁龙765是最具代表性的SoC,它们都存在一个后缀带“G”的型号,通过提升CPU和GPU的频率获得了更强的性能(表2)。

soc

如果你只关注绝对性能,看到这里就能告一段落了。

当我们看到一款陌生的SoC时,可以先看制程工艺,如果它能采用7nm或7nm+EUV就代表它具备更加节能省电的特性。

然后看CPU架构和主频,Cortex-A77和Kryo 500核心代表着当前架构的最强音,当CPU主频高于2.6GHz那它就具备旗舰级的CPU性能,如果低于2.4GHz就是中等偏上。

如果你喜欢玩游戏,就需要看它的GPU是Mali-G7x还是Mali-G5x,并数一下计算单元的数量,多多益善。

然而,手机并不仅限于跑分和玩游戏,在追求更强性能之余,它在日常应用环境下的表现,往往要比绝对的性能更加重要。比如,基带、DSP、ISP等单元,如果你对它们的作用感兴趣,请关注CFan的后续报道。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分