近日,Arm Tech Symposia 年度技术大会国内首站落地深圳。作为Arm最重要、规模最盛大的技术活动之一,Arm Tech Symposia 年度技术大会以“Arm 正在构建计算的未来”为主题,围绕人工智能、机器学习、物联网、基础设施、汽车、终端、移动计算等行业热点话题展开。在此次大会上,Arm传递出对于服务器市场的处理器技术以及合作生态的最新洞察,并介绍了所推出的相关技术产品以大力支持基础设施的加速建设。
人工智能的大潮已经涌现,基础设施融入AI这一趋势对于数据中心、服务器提出更高的算力和性能需求。Arm在服务器市场呈现快速发展的态势,此外,Arm还帮助合作伙伴实现服务器架构上的创新。
图:Arm高级副总裁兼基础设施事业部总经理 Mohamed Awad 在大会中与媒体进行访谈
Arm高级副总裁兼基础设施事业部总经理 Mohamed Awad解析,在传统的服务器系统架构中,左边是内存,然后内存连接到一个通用的现成 CPU,这个 CPU 又负责管理多个加速器。这样的传统架构是过去市场上唯一可用的架构,但这个架构的问题在于,这个通用的现成CPU 以及加速器之间的接口直接限制了产品最终的性能水平,因为所有的加速器都必须要通过一个 CPU 访问额外的内存,这样就无法达到内存的一致性,也就意味着加速器的性能无法被充分利用,也就无法很好地支持生成式 AI 时代的需求。
基础设施领域的传统系统架构
在Arm展现的一例新架构中,加入了CPU的数量并为整个系统架构提供更高的性能。具体来看,这种现代的系统架构中,CPU 是根据实际需求进行定制化设计,每一个定制化的 CPU 都可以单独和一个加速器相连,会有较强的内存一致性。“在这样的架构下,设计方根据用户的实际场景和用例进行 CPU 设计,方能将加速器的使用效率提到最高。”Mohamed Awad说道。新的架构设计能够更好地支持包括生成式 AI在内的基础设施的市场需求。
面向新的应用需求,基础设施领域出现了现代化的系统架构
这个架构的重点是强调了CPU的定制化,以及对于链路上数据传输性能的提升。
Mohamed Awad解析,在过去的架构中,一个CPU 需要对应多个加速器或者多个 GPU,但是这个 CPU本身不是一个定制化的CPU。这种CPU是通过 PCIe的接口和加速器连在一起的,其数据传输的吞吐率和链路带宽是直接受限于有多少数据可以进入到加速器。如果链路不佳,只有少量的数据进入加速器,影响加速器的性能发挥。但在新架构中,不仅是一个 CPU 对应一个加速器,更重要的是该 CPU 是一个定制的 CPU,跟加速器实现一对一组合后,它的整体链路以及数据吞吐率会达到最高,以提高加速器本身的利用水平。
这个新架构说来也不算新,因为这就是NVIDIA GH200 Grace Hopper 超级芯片所使用的架构。
NVIDIA GH200 Grace Hopper 超级芯片采用 Arm Neoverse 搭配 NVIDIA GPU,满足 AI 性能的需求
在这样的架构当中,72 颗 Arm Neoverse 核心加上来自 NVIDIA 的 GPU的组合,其AI 性能较基于x86架构的系统可提升 10 倍。
不过,未来的新架构还会有很多可能。Mohamed Awad表示,现在判断一个CPU对应一个 GPU这样的结构是不是未来的趋势,仍为时尚早。但鉴于我们正处于计算加速的时代,在未来的架构当中任何的通用 CPU 旁边都一定会有一个加速器。也就是说,不管是通过紧密耦合、中度耦合或者是分散耦合的方式,都一定会存在一个加速器。但具体这个加速器是什么样,采用什么样的架构,目前业界也还在不断探索过程中。
从他的话语中可以判断出CPU+加速器这种演进的方向是确定的。至于Arm将如何引领这样的方向,相信会有更多新技术新产品的出现。
目前,Arm在服务器市场以Neoverse 平台为主,为了简化客户基于这一IP设计服务器芯片,近期 Arm不仅推出Neoverse 计算子系统 (CSS),还推出一项全面设计 (Arm Total Design) 生态项目,目标是集行业生态之力,加速基于 Neoverse 计算子系统 (CSS) 的定制系统级芯片 (SoC) 的开发与交付。
Arm Neoverse CSS预集成了 Arm Neoverse 平台并完成验证配置,可降低开发成本并加速产品上市进程。基于 Arm Neoverse N2 平台所开发的Arm Neoverse CSS N2 为Arm Neoverse CSS的第一代产品。据介绍,在一家合作伙伴的实现中,Arm Neoverse CSS 不但可降低SoC设计复杂性,并且节省了长达80人/年的工程师时间。
Arm 全面设计 (Arm Total Design) 生态项目助力合作伙伴加速基于 Neoverse CSS 的芯片开发
Arm 全面设计汇集了专用集成电路 (ASIC) 设计公司、IP 供应商、EDA 工具提供商、代工厂和固件开发者等行业领先企业,以加快并简化基于 Neoverse CSS 的系统开发。
例如,楷登电子 (Cadence)、Rambus 和新思科技 (Synopsys) 等合作伙伴的预集成、经过验证的 IP 和 EDA 工具;ADTechnology、Alphawave Semi、博通 (Broadcom)、凯捷 (Capgemini)、智原科技、Socionext 和 Sondrel 等合作伙伴的设计服务;来自英特尔代工服务 (IFS) 和台积公司 (TSMC) 等代工厂合作伙伴的技术,专为领先工艺节点和先进封装技术进行优化;来自 AMI 等基础设施固件提供商,针对 Neoverse CSS 提供商业软件和固件支持。
引入这么多合作伙伴到这个生态系统中来,这意味着Arm已经为IC设计公司做好了前期大量的准备工作,而IC设计公司只需要聚焦于本身的产品创新即可。
Mohamed Awad表示,Arm 全面设计也进一步提高了 Neoverse CSS生态系统中可供合作伙伴使用的可能性,不管是专用集成电路 (ASIC) 设计公司、IP 供应商、EDA 工具提供商、代工厂和固件开发者,Arm 都能进一步支持和帮助他们的产品研发。
另外,Mohamed Awad强调,Arm 全面设计生态系统没有排他性,欢迎更多的相关产业链伙伴加入其中。同时Neoverse CSS 还在不断迭代发展,以支持新兴的芯粒 (chiplet) 技术。
微软 Azure Cobalt 100
近期,微软发布的Cobalt 100 CPU,便是基于Neoverse CSS进行研发的。此外也有中国的合作伙伴正在基于 CSS 进行开发。很多合作伙伴将会在 2024 年将第一代CSS设计投入生产。
现如今,所有主要的公有云都提供基于 Neoverse 的云实例,Arm Neoverse 平台在整个市场中增速显著。比较典型的合作伙伴包括超大规模云服务商亚马逊云服务 (AWS)、阿里巴巴,以及本土初创企业鸿钧微电子、遇贤微电子与云豹智能等。
从超大规模云服务商到初创企业,在 Arm 平台上赋能创新
据介绍,阿里巴巴的倚天 710 就是基于 Arm Neoverse 平台打造的 CPU。另外鸿钧微电子以及遇贤微电子,这两家都是来自中国的本土初创企业,他们都基于 Arm 平台打造服务器 SoC 解决方案。同时,中国本土的公司云豹智能,也借助 Arm Neoverse 平台来创建云计算与数据中心的 DPU 解决方案。而联想则更多地是将Arm架构部署到 5G 领域。Mohamed Awad说,通过携手中国本土的强有力的合作伙伴,我们将在中国进一步地推动 Neoverse 的发展。
Arm Neoverse 计算子系统 (CSS)
Arm中国区业务全球副总裁邹挺表示,在中国市场,Arm Neoverse 特别是在基础设施领域拥有很多客户。在过去的三、四年当中,整个 Neoverse 在中国的发展非常强劲。同时,Arm 也积极参与数据中心、云计算等本土的生态、开源软件社区,包括龙蜥社区等,帮助这些社区能更好地融入Arm全球生态系统中。
小结:
半导体的创新往往是从源头开始的,Arm的IP以及生态往往引领着一个潮流的方向。在移动终端领域Arm是当之无愧的霸主,在今年早前手机SoC厂商基于Armv9架构推出全大核芯片,将高端手机推向新的高度。
对于这样的集群配置,Arm 产品营销副总裁 Ian Smythe表示,在目前的高端智能手机市场,我们往往可以看到许多不同的创意,各家手机厂商在选择其 CPU 集群的配置时,是根据他们最终面向的目标受众的用户场景,来选择合适的 CPU 进行配置,这也正是 Arm CPU战略的一部分,通过Arm IP的灵活配置带来多元化与差异化。
而移动终端上,Arm通过为移动平台提供的Arm全面计算解决方案,持续赋能移动设备上 AI 的实现。此外,在物联网领域,Arm拥有种类丰富的边缘 AI 产品组合。凭借 Arm Cortex-M55、Cortex-M85 以及新推出的 Cortex-M52,持续提供合作伙伴所需的各种性能,从而满足 AI 时代人们对物联网日渐增长的需求。
在AI时代,计算基础设施也在迎来变革。在当今 70% 的机器学习工作负载运行在 Arm 平台之上。Mohamed Awad表示,AI的关键在于硬件和软件的紧密集成,以及性能和计算能力的提升。未来AI 将存在于边缘、网络、数据端、存储、服务器,它将融入每一个过程当中。Arm 正在不断地加速推动和赋能 AI 所带来的变化和革新。
全部0条评论
快来发表一下你的评论吧 !