NVIDIA全新AI以太网络平台大幅提升AI云性能

描述

 

NVIDIA 近日宣布,三家头部系统制造商将率先在其服务器产品阵容中集成专为 AI 量身定制的 NVIDIA Spectrum-X 以太网络技术,帮助企业客户加速生成式 AI 业务。

Spectrum-X 专为生成式 AI 量身定制,为企业提供了一种全新的以太网络,相较传统以太网方案,其 AI 通信网络性能提高了 1.6 倍。

这三家头部系统制造商的新系统,整合了 Spectrum-X 与 NVIDIA Tensor Core GPU、NVIDIA AI Enterprise 软件和 NVIDIA AI Workbench 软件,为企业通过生成式 AI 来实现业务转型奠定了基础。

NVIDIA 创始人兼首席执行官黄仁勋表示:“生成式 AI 和加速计算正在推动新一代的业务转型,企业需要升级其数据中心来满足新型业务的需求。加速网络就是 NVIDIA 的头部服务器制造商合作伙伴推出新一代系统的催化剂,加快他们迈向生成式 AI 新时代。”

专门用于加速 AI 的网络

为实现 AI 业务的出色效率,Spectrum-X 集性能优异的 Spectrum-4 以太网交换机、NVIDIA BlueField-3 SuperNIC(一款可以大幅提升超大规模 AI 业务性能的新型网络加速器)以及多种加速软件于一体。领先的基础设施计算平台 —— NVIDIA BlueField-3 DPU 就属于 Spectrum-X 的一部分。

Spectrum-4 是专门面向 AI 的 51Tb/sec 以太网交换机,可在大规模、满负荷的场景下提供较高的数据吞吐量,同时在 AI 云业务的多租户场景下将网络拥塞降低,其智能的、基于微调的路由技术可以保障网络基础设施的利用率。

BlueField-3 SuperNIC 专为网络密集型的大规模并行计算而设计,可在 GPU 服务器之间提供高达 400Gb/s 的 RDMA(RoCE - RDMA over Converged Ethernet)网络连接,大幅提升了集群内部基于东西网络流量的 AI 训练和推理性能,还能实现多租户数据中心环境的安全隔离,确保租户业务的可预测性和性能隔离。BlueField-3 SuperNIC 基于低功耗、半高半长的 PCIe 规格设计,是企业级服务器的理想选择。

NVIDIA 加速软件包括 Cumulus Linux、SONiC 和 NetQ 三者组成的性能优异的 Spectrum-X 软件开发套件,以及作为 BlueField 核心的 NVIDIA DOCA 软件框架。

NVIDIA AI Enterprise 为安全、稳定和已经支持的生产级 AI 业务提供了框架、预训练模型和开发工具。NVIDIA AI Workbench 使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练生成式 AI 模型,然后将其扩展至几乎任何数据中心或云。

搭载 Spectrum-X 的 NVIDIA 超级计算机

NVIDIA 自己的一台超级计算机就在使用 Spectrum-X,这也是新一代 AI 系统的参考架构。该超级计算机由 NVIDIA 与戴尔科技联合开发,使用了基于 8 卡 NVIDIA Hopper GPU 的 HGX 平台和 BlueField-3 DPU 及 SuperNIC 的 Dell PowerEdge XE9680 服务器,并通过 Spectrum-4 交换机组成了集群系统。






审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分