博通评论英伟达竞品:没有独到之处

描述

在早前举办的Computex,Nvidia 通过推出其 Spectrum-X 平台承诺为生成 AI 工作负载提供“无损以太网”——但如果你问 Broadcom,这甚至不是一个新想法。

Broadcom 核心交换组高级副总裁 Ram Velaga 告诉The Register说:“他们的设备没有什么我们没有的独特之处。”

他解释说,Nvidia 实际上用 Spectrum-X 所做的是构建一个垂直集成的以太网平台,该平台擅长以最小化尾延迟和减少 AI 作业完成时间的方式管理拥塞。

Velaga 认为,这与 Broadcom 对其Tomahawk5和Jericho3-AI交换机 ASIC所做的没有什么不同。他还认为 Nvidia 承认以太网对于处理 AI 中的 GPU 流更有意义。

Nvidia 的 Spectrum-X

就 Nvidia 而言,它并没有放弃 InfiniBand 网络。InfiniBand 非常适合那些运行少量非常大的工作负载的用户——例如 GPT3 或数字孪生。然而,Nvidia 网络部门营销副总裁 Gilad Shainer 告诉The Register,在某些环境中,尤其是多租户云,以太网是首选。

Shainer 说,对于较小的 AI/ML 工作负载,传统的以太网基础设施工作得很好——但现在这些工作负载的增长超出了一个节点,速度太慢了。

Nvidia 的 Spectrum-X 平台声称可以应对这一挑战。

需要明确的是,Nvidia 的 Spectrum-X 不是产品。它是硬件和软件的集合,我们过去已经介绍了其中的大部分内容。核心组件包括 Nvidia 的 51.2Tbit/sec Spectrum-4 以太网交换机和BlueField-3数据处理单元 (DPU)。

基本思想是,只要您同时使用 Nvidia 的交换机和它的 DPU,它们就会协同工作以缓解流量拥塞,并且——如果 Nvidia 可信的话——完全消除数据包丢失。

虽然 Shainer 声称这是 Nvidia 的一个全新功能单元,但 Velaga 认为“无损以太网”的想法只是营销。“与其说它是无损的,不如说你有效地管理了拥塞,以至于你拥有了一个非常高效的以太网结构,”他争辩道。

换句话说,不是包丢失是给定的以太网网络,而是规则的例外。无论如何,这就是想法。

此外,Velaga 声称这种拥塞管理已经内置到 Broadcom 最新一代的交换机 ASIC 中——只有它们可以与任何供应商或云服务提供商的 smartNIC 或 DPU 一起使用。“你不必在 NIC 上做,你可以从一个 Jericho3-AI 到另一个 Jericho3-AI ,”他补充道。

当我们向 Shainer 询问 Broadcom 的 Tomahawk5 和 Jericho3-AI 时,他拒绝与这些芯片进行比较,他辩称 Spectrum-X 属于自己的一类,并暗示一些供应商只是将“AI”附加到现有产品上。

“无论你怎么称呼它,都没有任何东西具有专为 AI 设计的功能,”他说。

垂直整合与分解

根据 Velaga 的说法,Nvidia 试图实现的垂直整合与以太网相冲突。“以太网今天成功的全部原因是它是一个非常开放的生态系统,”他说。

正因为如此,Nvidia 的 Spectrum-X 可能被证明对云提供商来说是一个艰难的销售,云提供商倾向于尽可能避免供应商锁定。他们强烈希望避免这种情况,导致广泛采用与供应商无关的网络操作系统,如 SONiC。这使他们能够在任何兼容的交换机上运行他们的云。

就其价值而言,Nvidia 的 Spectrum-4确实支持 SONiC,以及它自己的 Cumulus NOS 和 Linux Switch 驱动程序。但是,由于 Spectrum-X 平台依赖于同时拥有 Spectrum-4 和 BlueField,因此您不能只将一个换成另一个兼容 SONiC 的开关或 DPU 而不会损失功能。

说到 DPU,许多最大的云服务提供商已经拥有适合其环境的 SmartNIC。Amazon Web Services 拥有 Nitro,Google 与 Intel 共同开发了基于 ASIC 的 SmartNIC,Microsoft在 1 月份收购了 Fungible 。这些设备对云提供商来说非常有价值,因为它们允许他们卸载常见的网络、存储和安全工作负载——释放 CPU 来运行租户工作负载。

Shainer 说这完全没问题。他认为云提供商可以使用他们现有的 DPU 来管理他们的基础设施和控制南北流量,并使用 Nvidia 的 BlueField-3 来控制集群中节点之间的东西向流量。

他补充说,也没有什么能阻止人们将 Nvidia 的交换机或 DPU 作为独立产品进行部署。

“如果有人想使用我们的交换机并构建他们自己的东西,我们非常欢迎。如果有人想使用我们的 DPU 并使用其他人的交换机,当然 - 去吧。你可以自己开发这些东西,”Shainer 说。“但是,如果你想获得完全优化的东西,全堆栈......并在四个星期而不是六、七或八个月内启动系统?无价之宝。”

Broadcom 的 Velaga 不太确定客户会如何接受这个想法。“很难说在一个一切都被分解的世界里,他们将如何销售垂直集成以太网解决方案的价值。” 

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分