处理器/DSP
高通在2021年投资者大会上宣布下一代CPU将由收购的Nuvia团队设计,预计2023年有样品可以交付大客户,目标市场针对Windows PC市场,也就是笔记本电脑市场,并且将扩展到移动、汽车和数据中心领域。
从高通第四代座舱芯片开始,高通车载芯片也不再沿用手机芯片的设计。高通座舱芯片与高通笔记本电脑芯片的设计开始非常近似,因为车载芯片与笔记本电脑芯片的需求基本一致,即追求多核性能而非像手机那样追求单核性能。早期手机也是看重多核性能,随着短视频和手机游戏的爆发,大部分人都是抱着手机划来划去几个小时,这时候单核性能重要性便得以凸显,手机从4大核加4小核改变为今天的1个超大核加3个大核加4个小核,或者再加几个中核。手机领域的设计在车载领域显得有些不合时宜了,因此第四代的典型代表SA8295P与高通笔记本电脑领域的8cx Gen 3很接近,这样做主要是车载领域出货量相比笔记本电脑和手机都太低了,为车载领域做一款全新的芯片,会导致每颗芯片上分摊的成本太高,采用高通芯片的笔记本电脑已经不少,甚至包括了高通的对手华为,华为的海外版MateBook E Go就采用了8cx Gen3,微软称8cx Gen3为SQ3,即Surface Pro 9。
8cx Gen3型号为SC8280XP,从中不难看出SC8280XP与SA8295P驱动几乎完全一致,应该差别很小,二者的推出时间差不多也接近,都是2021年4季度。同时SA8295P还有可能取代第一代高通Ride中的SA8540P,SA8540P与SA8195P接近。8cx Gen3有两个版本,一个带5G Modem,一个不带,华为的MateBook E Go就是不带5G Modem的版本。GPU也有Adreno 695和Adreno 690两个版本。
大胆推测,8cx Gen4与高通第五代车载芯片重合度也会比较高,估计在量产车上使用要到2026或2027年以后了。为何会抛弃ARM,主要还是ARM挤牙膏挤得让高通受不了了,ARM架构与苹果的差距让高通的手机和笔记本电脑都无法超越苹果。
ARM目前最顶级架构:Cortex-X3微结构
图片来源:ARM
苹果自A14起大核心Firestorm架构
图片来源:Apple
苹果微架构的中后端
图片来源:Apple
ARM目前最顶级架构Cortex-X3与苹果的A系列和M系列差距非常明显。
图片来源:Geekbench
单核跑分对比,苹果的优势非常明显。为何苹果如此之强?关键在于其IPC(每周期执行指令数)也就是图中的解码器是8个,即一个周期能执行8条指令。而ARM的Cortex-X3是6个解码器。另一个关键点是缓存大小。
图片来源:各公司
从上表不难看出ARM挤牙膏的过程就是不断增加解码器宽度和L1/L2缓存容量。而苹果自A14后一步到位,彻底碾压ARM。并非ARM没有能力一步到位,主要还是ARM要配合手机芯片厂家每年一升级,每年一换机,性能不能一步到位,否则吸引不了消费者换机了。而苹果的粉丝忠实度极高,即使苹果没有明显提升性能,苹果也能让粉丝换机。
图片来源:WikiChip
而对乱序执行影响比较大的指令重新排序缓冲区(Re-Order Buffer, ROB),Firestorm有640条,X3只有320条,A78只有256条。苹果的超强性能也有代价,那就是对晶体管密度要求高,必须用最先进的工艺,因此苹果需要和台积电合作,让台积电为其做出最先进的工艺,达到最高的晶体管密度,台积电开价自然不低,这也是台积电营业利润率碾压苹果的原因。ARM对先进工艺的迫切程度低于苹果。
苹果有没有缺点?当然有。
图片来源:Anand Tech
上图是苹果M1的die shot,可以看出CPU占用面积很大,比一般ARM要大得多,没办法,苹果的缓存太大,为性能不得不做大缓存,GPU面积也略大,GPU的效率肯定比不上高通的Adreno或AMD,这样就使得NPU不可能做太高,而高通的DSP做AI算力惊人,8 Gen1就有29TOPS,而苹果的M2才15.8TOPS。
图片来源:ARM
ARM 2023与2024路线图,估计2024年推出的CXC24(可能会叫Cortex-X5)会采用7位解码器,且必须配合3纳米制造工艺,即便是X5和苹果的Firestorm也有差距,换句话说,ARM落后苹果4-5年。因此高通等不及了,决定自研架构,这就是高通2021年1月收购的Nuvia。
Nuvia由三位苹果前高管创立,他们分别是威廉姆斯(Gerard Williams III)、古拉蒂(Manu Gulati)和布鲁诺(John Bruno)。这三位创始人都曾在苹果工作过,且在iPhone芯片部门担任过高管职务,拥有超过20年的半导体工程经验,迄今已获得100多项专利。其中:
威廉姆斯曾担任苹果CPU和A系列SoC首席设计师,九年期间几乎负责了苹果所有芯片的研发,包括Cyclone、Typhoon、Twister、Hurricane、Monsoon和Vortex等架构。他于2019年初离开苹果公司。除了苹果经历,另外两位创始人还在谷歌工作过。
古拉蒂曾在AMD和谷歌从事芯片研究,且在苹果公司工作了八年,从事移动端SoC的开发。
布鲁诺曾在谷歌从事芯片研究工作,2012年加入苹果公司,并在芯片平台架构小组工作了五年多。
2019年2月,三人在美国加州圣克拉拉郡(Santa Clara)联合创立Nuvia。
2019年11月15日,Nuvia宣布完成5300万美元的A轮融资,由著名的硅谷投资者Capricorn Investment Group和戴尔技术资本领投,Mayfield、WRVI Capital以及Nepenthe LLC参投。
加上2020年9月官宣完成的2.4亿美元的B轮融资,Nuvia两轮总募集资金达到2.93亿美元。
2021年1月高通以14亿美元收购了Nuvia。
2022年ARM起诉高通,主要是针对Nuvia,不过近期似乎两者已达成了和解,官司即使赢了,也打压不了高通另起炉灶的心,反而坚定了高通走独立研发架构的决心,输了对ARM自然也是不利,对高通来说,赢了也和长期合作伙伴ARM关系不再和睦,输了意味着14亿美元可能打水漂了。因此两家可能秘密和解了。
我们大致知道8cx Gen4的基本情况:
l8 performances cores - 3.4 GHz peak clock speed
l4 efficiency cores - 2.5 GHz peak clock speed(标称速率2.34GHz)
lAdreno 740 GPU(现在手机旗舰8Gen 2也用这个GPU,2.14TFLOPS)
lHexagon Tensor NPU (45 TOPS)
l36 MB L2 cache
l8 MB L3 cache
l12 MB system-level cache
l4 MB GPU cache
8个大核心每核心的L2缓存估计是4MB,4个小核心是1MB,性能比现在的SA8295P要强很多,SA8295P的大核心估计每核心的L2缓存也只有1MB。至于Nuvia Phoenix的架构,高通从未透露过,只能推测大概像苹果那样,8个大核心类似Firestorm,小核心类似Icestorm,将采用4纳米工艺制造,3纳米还太贵,3纳米用在出货量上亿的手机领域更合适。不过不管硬件如何演进,ARM的指令集谁也无法绕开,ARM建立了强大的生态系统,这个系统的核心就是ARM指令集,无论是苹果、英伟达还是高通,都绕不开。
高通即将在2023年推出的8Gen3旗舰手机芯片预计还是会采用ARM架构,台积电4纳米工艺N4P制造,超大核心是Cortex-X4,中核心是2个Cortex-A520,小核心是5个Cortex-A720。2024年推出的旗舰手机芯片8Gen 4也会采用Nuvia的架构,不过是2大核心(性能核)加6小核心(效率核),将采用台积电的N3E即第二代3纳米工艺制造。
8cx Gen4的AI算力很高,有45TOPS,几乎是苹果M2的3倍,对笔记本电脑来说,AI算力没什么作用,苹果一直都没有增加AI算力的打算,从M1到M2再到M2 Pro,AI算力一直都是15.8TOPS,但车载就不一样了,多多益善。高通第一代舱驾合一或者说中央计算芯片SA8295P的AI算力是60TOPS,估计第二代能到100-120TOPS,第五代座舱至少也是45TOPS,是目前SA8295P的1.5倍。
对国内芯片厂家来说,想彻底抛弃ARM恐怕还难以做到,如何面对高通的竞争,只能用ARM的服务器系列芯片与之对抗。
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !