雄心勃勃！Nvidia宣布“世界上最快的AI超级计算机”的计划

454398 2020-10-20 1670

电子说

1.2w人已加入

描述

Nvidia和意大利大学财团和大型超级计算中心Cineca，宣布了计划建造“世界上最快的AI超级计算机”的计划。作为跨欧洲合作构建的四台新超算之一，Leonardo 由超过 14000 个基于英伟达 Ampere GPU 的节点组成，FP16 AI 性能高达 10 Exa-Flops 。

Nvidia和意大利大学财团和大型超级计算中心Cineca，宣布了计划建造“世界上最快的AI超级计算机”的计划。

即将面世的莱昂纳多系统将使用近14,000个Nvidia A100 GPU来执行各种高性能计算任务。该系统的最高性能有望达到10个FP16 ExaFLOPS。

该超级计算机将基于Atos的 BullSequana XH2000 超级计算机节点，每个节点均搭载一个未知的Intel Xeon处理器，四个Nvidia A100 GPU和一个用于连接的Mellanox HDR 200Gb / s InfiniBand卡。刀片是水冷的，每个HPC机柜中有32个刀片。

Leonardo（莱昂纳多）超算是用了14000个Nvidia GPU，Nvidia称其为“世界上最强大的AI系统”，这个系统在某些半精度浮点（FP16）应用中提供10 exaflops的AI性能，在以Top500为基准进行测试时，可以提供大约200 petaflops算力。这一系统的推出，也将从今年底开始改变欧洲超算系统的格局。

新超算旨在为欧洲地区的高性能计算提供支持，有助于为科学 / 工业领域的应用程序提供先进的 AI 功能。

此外英伟达将为整个项目集群提供低延时的 Mellanox HDR InfiniBand 宽带连接网络，以达成预期的性能表现。

其它计算机集群包括位于卢森堡的 MeluXina、位于斯洛文尼亚的 Vega、以及位于捷克的 SuperCooling 装置。

展望未来，CINECA 还计划在保加利亚、芬兰、葡萄牙和西班牙地区增设四台超级计算机，更多细节将在稍后公布。

最后，CINECA 的这些超算集群将可用于基因组分析、找寻新的治疗途径、处理多个不同来源的数据、太空探索 / 地外行星研究、以及针对极端天气的模式模拟等。

对于那些从事超级计算已经有几年时间的人来说，对Bull系统应该十分熟悉，尤其是在欧洲。这家公司在2014年初被Atos收购，但从外界的角度，本质没有变化，直到HPC产品（包括“ Sequana”系列）使用Bull的名称。

多年来，Bull一直是欧洲知名但规模不大的HPC集成商，取得了几项重大成就，在研究和学术界只有相对少数的系统。但时代在改变，特别是在Bull重要的收购之后。

先是将IBM的x86服务器业务出售给联想的交易，由于IBM在高性能计算市场关键的地位。欧洲HPC中心也别无选择，因为联想距离很远。IBM具有足够的本机资源，可以用于许多中心，因此多年来，许多欧洲研究机构、政府机构、气象机构、甚至大企业的HPC都是用IBM的产品。

另一家公司Cray希望在欧洲获得许多胜利，这种趋势一直持续增长，直到最近收购HPE为止，尤其是在天气和大型计算设备领域。尽管我们尚未看到这种供应商转变对市场的影响，但我们预计在欧洲，变化会在未来几年中显现。这不是因为Cray或IBM不合适，也不是因为他们的技术已经改变，是欧洲想要一直想要的东西——自己的HPC供应商生态系统。

如今，Atos在欧洲处于有史以来最强大的地位，这表明它可以提供与世界范围内的Cray / HPE和IBM相当强大的，用于多学科科学和技术计算的系统。实际上，有人可能会争辩说，今天宣布的“LEONARDO”超级计算机将把Atos带入高性能计算世界的真正“大时代”。

很难说LEONARDO超级计算机进入世界500强时将位列第几，但有望达到200 petaflops的峰值半精度浮点性能（Nvdia称其为前10 EB的AI超级计算机，它基于FP16）。

在与Nvidia的Ian Buck的一次电话会议中，这家GPU制造商表示这将是欧洲最强大的AI超级计算机，将拥有14,000多个A100 GPU，并在Atos Sequana节点上的四个A100 GPU上分解成一个单一的具有英特尔Rapids处理器和Nvidia Mellanox HDR 200Gb / s网络。

LEONARDO由EuroHPC采购，EuroHPC是欧洲各国政府与欧盟之间的联合合作，旨在在欧洲开发世界一流的超级计算生态系统和百亿亿次超级计算，并由欧洲委员会通过意大利大学和研究部资助。

NVIDIA解决方案架构和工程副总裁Marc Hamilton表示：“欧洲百亿亿欧元的EuroHPC技术路线图为HPC和AI的快速增长和创新打开了大门。我们正在与CINECA和Atos合作，在广泛的应用领域中加速科学探索，为迎接百亿级计算时代提供了一个平台。”

有趣的是，明年会有多少HPC中心选择SuperPOD实现以AI为中心的计算，以及有多少采用Sequana中提供的更标准的HPC面向工作负载的架构？我们希望与AI / HPC世界中其他地方看到的情况相似，在这些地方AI和加速的科学计算应用程序都是GPU密集型的，并且有一些专注于AI的研发中心，需要完整的DGX或SuperPOD。

Nvidia与合作伙伴在欧洲范围内构建多个基于SuperPOD的系统，同时保持其Sequana不仅仅涉及硬件。这些系统的软件和支持生态系统非常庞大，因此，在重建SuperPOD时利润可能微不足道，而它们在支持和牢固生态方面的构成将是无价的，尤其是欧洲在其中扮演的角色比以往任何时候都雄心勃勃。

打开APP阅读更多精彩内容