英伟达便捷式AI数据中心和DGX SuperPod双升级

yingujun 2021-05-01 2438

处理器/DSP

871人已加入

描述

在400亿美元收购Arm的6个月后，NVIDIA连发三款基于Arm IP打造的处理器，包括全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU，以及业界首款1000TOPS算力的自动驾驶汽车SoC。此外，还公布了与亚马逊AWS、Ampere Computing、联发科和Marvell等基于Arm的CPU平台的合作伙伴关系。

黄仁勋表示：“我们每年都会发布激动人心的新品。三类芯片，逐年飞跃，一个架构。”NVIDIA数据中心路线图包括CPU、GPU和DPU这三类芯片，每个芯片架构历经两年的打磨周期（周期内可能出现转变），一年专注于x86平台，另一年专注于Arm平台。

Grace：专为大型应用建立的数据中心CPU

专攻GPU的英伟达在这次GTC大会上推出了基于Arm架构的中央处理器（CPU）—— Grace，用于大规模人工智能和高性能计算应用。

黄仁勋表示，“这是英伟达第一个数据中心CPU，专为大型应用建立”。

这款CPU以美国海军少将、计算机编程先驱Grace Hopper的名字命名。Grace Hopper是计算机科学的先驱之一，也是哈佛Mark 1的第一批程序员和第一个链接器的发明者。她在20世纪50年代开创了计算机编程，发明了世界上第一个编译器，被称为“计算机软件工程第一夫人”。

这款名为Grace的CPU使用了节能 Arm 核心—— Neoverse，为系统训练大型人工智能模型提供了巨大的性能飞跃，每个CPU能在SPECrate2017_int_base基准测试中分数超过300分。

具体讲，基于Grace的系统与NVIDIA GPU紧密结合，性能将比目前最先进的NVIDIA DGX系统（在x86 CPU上运行）高出10倍。

它能够满足世界上最先进应用的计算需求，包括自然语言处理、推荐系统和人工智能超级计算，这些应用分析需要超快计算性能和大容量内存中的巨大数据集。

Grace还是一款高度专用型处理器，主要面向大型数据密集型HPC和AI应用。新一代NLP模型的训练会有超过一万亿的参数。

这款CPU的基本性能是第四代Nvidia NVLink互连技术，从CPU到GPU连接速度超过900GB/s，达到相当于目前服务器14倍的带宽；从CPU到CPU的速度超过600GB/s。

拥有最高的内存带宽，采用的新内存LPDDR5x技术，带宽是LPDDR4的两倍，能源效率提高了10倍，能提供更多计算能力。

英伟达表示，新产品将于2023年初上市。

黄表示，使用经过授权的 ARM IP，英伟达将 Grace 设计成专门用于大规模人工智能和高性能计算的 CPU。

作为首批客户，瑞士超级计算中心（CSCS）和美国洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）将是第一个使用由惠普打造的Grace驱动的超级计算机的机构。

Grace将为世界上最快的超级计算机提供驱动力。这台被称为阿尔卑斯山的超算将具有20亿亿次浮点运算的能力。

这比当今领先的人工智能超级计算机——2.8亿亿次运算的 Nvidia Seline 超级计算机的计算能力高出约7倍。

基于Arm架构的新数据中心CPU Nvidia Grace的发布，或将直接挑战英特尔在服务器和数据中心计算领域的主导地位，抢占英特尔最赚钱的市场领域。

BlueField-3 DPU：220亿晶体管

在黄仁勋看来，负责在数据中心传输和处理数据的数据处理单元（DPU），正与CPU、GPU共同组成“未来计算的三大支柱”。

他宣布NVIDIA BlueField-3 DPU包含220亿个晶体管，采用16个Arm A78 CPU核心、18M IOPs弹性块存储，加密速度是上一代的4倍，并完全向下兼容BlueField-2。将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。

这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。

BlueField-2能够卸载相当于30个CPU核的工作负载，而BlueField-3实现了10倍的性能飞跃，能够替代300个CPU核，以400Gbps的速率，对网络流量进行保护、卸载和加速。

业界首款1000TOPS算力的自动驾驶汽车SoC

NVIDIA DRIVE Atlan是NVIDIA新一代车载系统级芯片，为汽车带来真正的数据中心。

Atlan可以达到每秒超过1000万亿次（TOPS）运算次数，约是上一代Orin处理器的4倍，超过了绝大多数L5无人驾驶出租车的总计算能力。

这是DRIVE平台首次集成DPU，通过Arm核为自动驾驶汽车带来数据中心级的网络，致力于应用到2025年的车型。

该SoC采用下一代GPU的体系结构、新型Arm CPU内核、新深度学习和计算机视觉加速器，并内置为先进的网络、存储和安全服务的BlueField DPU，网络速度可达400Gbps。

黄仁勋夸赞说：“Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成，堪称一项技术奇迹。”

软硬件双管齐下，便捷式AI数据中心和DGX SuperPod双升级

软硬件双管齐下，黄仁勋宣布升级NVIDIA专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station，以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。

全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU，内存带宽达到每秒8TB。然而，仅需将其插入普通的壁装电源插座即可使用，耗电量只有1500瓦。

DGX SuperPOD使用全新80GB NVIDIA A100，将其HBM2e内存提升至90TB，实现2.2EB/s的总带宽。要实现如此的带宽，需要11000台CPU服务器，大约相当于有250个机柜的数据中心，比SuperPOD多15倍。

目前它已经升级至采用NVIDIA BlueField-2，且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。

NVIDIA Drive Orin：汽车的中央大脑

黄仁勋表示，自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一，同时也是最棘手、影响最大的挑战之一。”

黄仁勋表示，将于2022年投产的NVIDIA自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin，旨在成为汽车的“中央电脑”。

此次黄仁勋还推出了Hyperion 8 AV平台，包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。

并宣布沃尔沃汽车扩大与NVIDIA的合作。

沃尔沃从2016年开始应用NVIDIA DRIVE的算力，基于NVIDIA DRIVE Xavier，为新车型开发AI辅助驾驶功能，软件则由沃尔沃汽车旗下的自动驾驶软件开发公司Zenseact自主研发。

沃尔沃新一代汽车的自动驾驶计算机将配备NVIDIA DRIVE Orin。

这也是英伟达和合作伙伴致力推广的“软件定义车型”的概念。

黄仁勋还宣布DRIVE Sim将于今年夏季开放供业界使用。
责任编辑:pj

打开APP阅读更多精彩内容