Ampere下一代AmpereOne系列处理器将拥有256个核心

安晟培半导体 2024-06-18 550

描述

虽然训练 AI 需要超强大的 GPU 算力，但 AI 算法的执行首先需要超高效的芯片。就像 AmpereCPU，未来的 AmpereOne 将拥有不少于256个内核，其功率仅为350W。(原文转自 Adrian Branco 发表于2024年6月10日)

Adrian Branco pour les Numériques - AmpereOne 256

或许你永远无需自己购买处理器，但毫无疑问，你每天都会在不知不觉中使用。Ampere Computing 是一家美国公司，由英特尔前高管 Renée James 创立。Ampere 的使命是设计和销售用于数据中心和超级计算机的基于 ARM 架构的CPU，其最新一代 AmpereOne 不久前刚刚亮相。这与我们的应用程序和使用有什么关系呢?随着基于云的 AI 助手的不断发展，行业玩家们正在努力寻求降低购买和消费方面的使用费用。在这个游戏中，Ampere 基于ARM 架构的 CPU 具有很多优势。

首先让我们来谈谈芯片：虽然192核5nm版本的 AmpereOne 已经上市，并集成到法国 Scaleway 公司(我们去年12月访问过其后台)等数据中心，但 Ampere 未来的芯片将走得更远。得益于迄今为止苹果芯片独有的3nm工艺，Ampere 能够将内核数量增加33%，将 CPU 核心数量提高到256个。但是，面对越来越耗电的芯片，英特尔正在积极研发从1KW到2KW的散热芯片，英伟达毫不掩饰自己也在走同样的道路 —— Ampere 正在做战略性的押注，以不断散热的方式寻求性能提升。通过添加越来越多的内核来实现这一点，即创造更加高效的“心”。

恒定功耗下的更多内核

Jeff Wittich, Chief Product Officer at Ampere

根据 Ampere 的路线图，该公司计划于2025年推出的下一代旗舰产品 AmpereOne 将拥有256个内核。但正如 Ampere 首席产品官 Jeff Wittich 所解释的那样，这种芯片与 GPU 和其他高功率加速器相反。“数据中心行业的能源消耗增长速度是不可持续的，你不可能总是消耗更多的电力，你必须尽可能优化消耗。我们在市场上的优势在于，我们设计了一种专门用于云计算的芯片架构。尽管我们的竞争对手拥有云前和 AI 前的核心设计，但我们的 CPU 内核和芯片完全是为满足这一需求而设计的”， Jeff 说。

Ampere 的第一个武器是其芯片中嵌入的内核数量惊人。“目前，我们最密集的芯片有192个 CPU 内核。但到2025年，我们的3nm AmpereOne 将提供不少于256个内核。” 这就是 Ampere 的第二个武器。新芯片的功耗将与当前芯片完全相同，也就是说 “在300W到350W之间”，Jeff解释道，“我们不想消耗更多的能源，我们总是想用同样的功率做更多的事情。Ampere 的架构是可扩展的，特别适合 AI ”。等一下，AI不是 GPU 的领域吗?

85%的AI与训练无关

Victor Jakubiuk, Head of AI at Ampere

面对如今市值达30000亿美元的英伟达，一个小玩家如何撼动这样一个庞然大物呢?Ampere AI 主管 Victor Jakubiuk 解释道：“这不是一回事。强大的 GPU 是用来训练 AI 的。我们谈论的是密集型计算，这需要高性能的芯片。但 AI 训练只占该领域相关计算的15%。剩下的85%用于推理，即使用这些 AI。因为一旦一个模型经过训练，需要数周或数月的时间，它就会被数百万用户大量使用。这就是 Ampere 处理器的用武之地” 。

以最优化的方式运行模型的处理器，它们是什么型号?Jeff Wittich 回答说：“除了 CPU 的经典用途(如MongoDB等数据库)外，我们的 CPU 核心还用于许多日常任务。当您观看视频时，我们的 CPU 负责生成自动字幕并翻译这些字幕。当您在银行应用程序中使用聊天机器人时，我们的 CPU 可能也在运行并提供支持”。

真正的节省，而不仅仅是在AI方面

Damien Lucas, CEO of Scaleway

为了验证 Ampere 团队的说法，我们回到了去年我们见过的 Scaleway 首席执行官 Damien Lucas 那里。他面带微笑，非常直接地说：“Ampere 芯片的节能是真实的”。他说，虽然 ARM CPU 在数据中心的发展之路并不总是一帆风顺，但“自从 Scaleway 几年前提出并停止使用ARM以来”，该指令集正在强势回归，“这要归功于客户的需求。我认为，一方面，垄断对市场来说从来都不是一件好事，但另一方面，Ampere CPU 可以显著节省能源”。根据 Ampere 的说法，在 AI 中，这意味着 “与英伟达 GPU 相比，推理的增益从 x3到x5”。

An Ampere server from Scaleway

效率的提高并不局限于 AI 推理领域。Damien Lucas 表示：“虽然我们将所有技术和芯片都投放市场，为客户服务，但由于我们与每个人合作，我们在Scaleway 也有自己的基础设施。事实是，我们已经将所有内部服务器从 x86切换到了Ampere。我们的能源费用减少了30%” 他非常兴奋地说。

但是，不要被云玩家的责任冲昏头脑：尽管那些有推理需求的人可能会集体转向 Ampere 这样的芯片，但与能耗这个庞然大物对抗仍有很长的路要走。 “目前这是一场与时间的赛跑。可用的 GPU 永远不够。在 Scaleway，我们为所有类型的客户提供服务。我们可以清楚地看到双重趋势：一方面，我们称之为超密集型计算，另一方面是超高效计算”。能效，是Ampere的强项。

2030年将推出1000核处理器?

处理器计算能力的提高面临着巨大的挑战，比如进一步降低雕刻技巧的困难。然而，Jeff Wittich 似乎并不担心芯片每瓦性能的未来改进。他向我们保证：“即使制造工艺多年来一直停留在3nm，即使使用350W的封装，我们仍然可以做得更好。” 在同意做出预测之前，他承诺：“即使有这些限制，到2030年，我们也可以拥有1000核芯片。我们的架构仍有很大的空间”。最后他总结道：“因为在我们的世界里，我们不再浪费能源。”

关于 Ampere Computing

Ampere Computing 是一家现代化半导体企业，致力于塑造云计算的未来，并推出了世界上首款云原生处理器。为可持续云而生，Ampere 云原生处理器兼具最高性能和最佳每瓦性能，助力加速多种云计算应用的交付，为云提供行业领先的性能、能效和可扩展性。

打开APP阅读更多精彩内容