ARM Neoverse 服务器芯片支持 DDR4/DDR5 主存储器

处理器/DSP

868人已加入

描述

面向通用领域和百亿级超级计算机的服务器处理器的设计上,欧盟的意思再明确不过了,那就是它决心摆脱对美国表弟的依赖,将自己的双足深深扎根于欧洲的大地上。这是一项极其艰巨的任务,没有任何人怀疑这一点。现在,这项光荣而又艰巨的任务落到了由 Philippe Notton 创立的法国初创公司 Silicon Pearl 头上。

这款欧洲本土服务器处理器使用了同样来自欧洲供应商的矩阵数学计算部件和 FPGA 加速器,这种技术选择一点都不奇怪,实际上,这也算是“独立自主”的应有之义。不过,有意思的是,由于服务器处理器的设计任务非常繁重,所以无论欧洲再怎么努力,它也离不开英国的帮助,而当下的英国正处于志在政治和经济上都和欧盟脱钩的脱欧进程中,脱欧后的英国又将投入到欧盟竭力想摆脱依赖的美国大侄子的怀抱,其中的讽刺意味,实在意味深长。

在指令集的选择上,欧盟的选择空间也相当有限。业界人士早已给出定论,除非欧盟愿意出资打造自己的指令集(这种可能性实在值得商榷),或者资助由 CPU 双雄英特尔和 AMD 牢牢控制的 x86 指令集,否则它必将使用 ARM 的指令集打造自己的服务器处理器。尽管 ARM 在服务器领域也许可过一些知识产权,但是它的大本营更多布局在智能手机、平板电脑、各种控制器、嵌入式系统和电信设备领域,几经资本运作后,在计算领域耕耘日久的 ARM 已经成为了一家由日本软银控制的英国公司。

抛开指令集暂且不论,欧盟在操作系统的选择上也很尴尬。本来,在英国还没有脱欧之前,搭载欧盟处理器的服务器很可能会运行 Linux 的一个分支 -Ubuntu Server,该分支由英国的 Canonical 公司维护和控制。但是当英国脱欧之后,心存芥蒂的欧盟很可能会转而选择 SUSE Linux。不过,严格说起来,SUSE Linux 现在的东家 Micro Focus International 也是一家英国公司,不过好在,尽管几经易主,大本营位于德国纽伦堡的 SUSE Linux 一直保持了独立运营。所以,如果英国没有脱欧的话,欧盟会自然而然地选择 ARM+Ubuntu Server,技术抉择上自然而然,自主可控的口号也很有说服力。但是,历史从来没有如果,所以,SUSE Linux 现在成为了欧盟的首选。

不过,和以上“出身不正”形成鲜明对比的是,诺顿的公司 SiPearl 总部位于巴黎西侧,在法国 Rivera 设有开发实验室。倒是没有比这更欧洲的了:)

去年六月份,SiPearl 进入欧洲处理器计划(EPI),当时我们进行了深度报道。截止到现在,SiPearl 共计从欧盟拿到了 620 万欧元(折合 670 万美元)的启动资金,雇佣了首批十名员工,从 Arm 手中取得了“ Zeus” Neoverse N2 内核和相关技术的许可,开始了第一代 ARM 服务器处理器“Rhea”产品的开发。时过大半年,现在是时候和诺顿一起坐下来喝杯咖啡,聊一聊 SiPearl 是如何帮助实现欧洲处理器计划的目标、以及作为野心勃勃的公司是如何在这个竞争激烈的市场中独立运作的了。在 ARM 服务器芯片领域,Ampere Computing、Marvell、Fujitsu 霸榜前三元,个个都不是易与之辈。

说起来,诺顿也算是半导体业界的老兵了。1993 年,在巴黎中央理工 - 高等电力学院主修信号处理专业的诺顿取得电气工程学位。毕业后,他先是入职汤姆逊广播系统公司从事数字机顶盒处理器设计工作,之后便跳槽到巴黎 Canal+工作了六年。后来,呆不住的诺顿又相继担任了 LSI Logic 和美高森美的现场应用工程师。从美高森美离开后,诺顿开始走上管理岗位,出任 Mstar 半导体公司副总裁,这是一家为各种消费和图像处理产品生产 ASIC 的公司。再之后,跳槽成性的诺顿加入意法半导体,时隔不久,2017 年 6 月,诺顿再度跳槽到持有服务器制造公司 Bull 的 Atos 公司领导其处理器计划,并被任命为 EPI 总干事。去年六月份,诺顿创立 SiPearl 并出任首席执政官,该公司负责设计和生产 EPI 主导的 ARM 服务器处理器,同时,他将继续担任 EPI 总干事直到 2020 年 6 月底。

诺顿告诉记者,从事 SiPearl Arm 服务器处理器 - 第一代产品为 Rhea、第二代产品为 Chronos- 相关工作的工程师人数将随着 Rhea 的问世、测试和上量而逐渐增长到 200 名左右。当然,巧妇难为无米之炊,上述乐观假设都建立在 SiPearl 可以筹集到更多资金的基础上,随着公司成立并拿到了第一笔启动资金,诺顿今年将开始认真开展招兵买马的队伍建设工作。

在芯片行业,制定技术发展路线图从来都是一件相当难办的事儿。上面这个路线图展示了 SiPearl 产品预计的迭代节奏,但是实际时间可能会有所偏差。第一代 Rhea 芯片将使用台积电的 N6 工艺,有人将该工艺称为 7+nm,你可以在 ARM Neoverse 芯片设计路线图中看到这样的说法。N6 是传统 7nm 工艺的增强版,将工艺尺寸缩减到 6 纳米,并将使用极紫外线光刻技术。

按照这个路线图,Rhea 的量产时间可能介于 2021-2022 年之间,但是现在诺顿表示,Rhea 的全面量产可能要等到 2022 年底,相应地,Chronos 的量产时间也将推迟到 2024 年,而非上述路线图所表明的 2022-2023 年之间。在这个气泡图形式的路线图里,第一个气泡表示的是 Rhea 的问世时间,第二个气泡是其量产时间。第三个气泡说的是 Chronos 芯片,它也基于 Zeus 内核,而且可能会和 ARM Neoverse 服务器芯片设计路线图所表明的一样采用更先进的 5 纳米工艺。第三代 SiPearl 芯片尚未命名,它可能采用 ARM 的 Poseidon 内核,将使用台积电的 5 纳米工艺。虽然路线图没有明确表明第三代产品的问世时间,但是根据前两代产品的推出节奏,我们预计它将在 2025 年底 -2026 年出问世,当然这种猜测还没有得到诺顿先生的证实。说到这里,大家可能会觉得 SiPearl 先前把牛皮吹得太大了,但是,说句公道话,在一个复杂的处理器中放进去数十亿个晶体管,这个任务对于一个新成立的公司是如此不可承受之重,以至于说它跳票对它也很不公平。

实际上,SiPearl 的技术洞察力还是相当靠谱的。众所周知,在芯片设计中,内核的选择事关成败。SiPearl 选择了 Zeus 内核,对其迅速开展工作起到了至关重要的作用。与之形成鲜明对比的是两年多以前 Ampere Computing 的举动。当时,Ampere Computing 收购应用微电路公司的 ARM 服务器处理器资产后,抛弃了应用微电路公司一直使用的土生土长的的 X-Gene 内核,转向 ARM Neoverse N1 的 Ares 内核设计其“ Quicksilver” Alta Arm 服务器芯片,直到今年三月份,这款芯片才问世。

“SiPearl 是业务导向型的公司,我们做一个芯片只有三年的时间。”诺顿解释道。“当你只有三年时间时,你不可能从零开始创建所有组件,绝对不可能。你需要有一个团队来决定某些组件是自己造还是直接购买。至于像内核这样的组件,显然不可能自己做,不说人力不足,我们也没有那么多时间。当然,Marvell 可以坚持自己打造内核的战略,那是因为他们有一个强大的团队而且已经有了长时间的积累。Ampere 和我们一样,出于同样的原因直接使用 ARM 的内核。而且,即便有足够的预算,我也不确定自己设计内核是不是最好的策略,因为 ARM 已经提供了一系列性能卓越的内核,对于一个新创公司的第一个设计,我们冒不起风险。至于为什么选择 ARM 而不是其它,拿最近很火的 RISC-V 来说吧,客观地说,RISC-V 的生态建设仍然处于初期阶段,尤其对通用处理器而言更是如此。至于 x86,一来很难得到它的官方许可,二来该指令集来自于美国,选择它显然有违 EPI 的初衷。对我们来说,ARM 更加中立,更加国际化,而且它在 HPC 上已经取得了一定的进展,很具有说服力。”

当我们问起 Rhea 集成了多少个内核时,诺顿选择了三缄其口,他打起太极含糊地说道:“要知道,内核不算小,您肯定没办法把 200 个内核放在一颗芯片上。”得,说了等于没说。考虑到该芯片选择的制造工艺,再加上 ARM 曾经表示过一个服务器插槽对应的内核数量介于 64-128 之间,所以我们猜测,Rhea 中的内核数量将在 100 个左右。这可以用小芯片(chiplet)方案实现,也可以在单片芯片上实现。鉴于诺顿没有说起过小芯片,所以我们怀疑 SiPearl 会像 Ampere Computing 那样,直到其产品路线图的后段才会用上小芯片。因为,你肯定不想一上来就同时面对 7+纳米、新设计和小芯片封装这些问题。很有可能,将于 2024 年量产的 Chronos 芯片将在内核集成商使用小芯片方案,并分别部署中央 I/O 和内存 hub,而且所有都基于同样的 N6 工艺。至于尚未命名的第三代芯片将使用 5 纳米的内核,并在 I/O hub 上继续使用上一代的 N6 工艺。

在具体的实现上,显然有多种可选方案。

Rhea 芯片将支持 DDR4/DDR5 主存储器以及 HBM 主存储器(我们现在还不清楚是 HBM2 还是 HBM3,不过我们更倾向于认为是 HBM3 这个更现代化的版本)。此外,Rhea 还将使用 PCI-Express 5.0 外围控制器,并将支持 CCIX 协议以在 PCI-Express 上应用加速器。当我们问起 Rhea 是否支持同样运行在 PCI-Express 5.0 之上的英特尔 CXL 协议时,诺顿没有给出正面回答,他同样回避评论的是是否使用 CCIX 端口创建 NUMA 计算机。显然,鉴于 Neoverse 内核采用 CCIX 做为处理器插槽 NUMA 共享内存集群的传输方式,Rhea 很可能支持采用 CCIX 端口创建 NUMA 计算机,而且,当客户需要更多 I/O 以及面向一定数量内核的大内存带宽和容量时,这种方案还是一种理想的选择。所以,我们很可能会看到双插槽甚至是四插槽的 Rhea 机器,但是在 NUMA 环境中,应该不大可能出现插槽数更大的机器。

SiPearl 的 CPU 封装内会捆绑上各种加速器,还可以使用台积电的 CoWoS 内插器技术加入其它加速器和 HBM 内存,英伟达和 AMD 分别在 Tesla 和 Radeon Instinct GPU 上同样采用了这项技术。
       责任编辑:pj

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分