雄心勃勃!Nvidia宣布“世界上最快的AI超级计算机”的计划

电子说

1.2w人已加入

描述

Nvidia和意大利大学财团和大型超级计算中心Cineca,宣布了计划建造“世界上最快的AI超级计算机”的计划。作为跨欧洲合作构建的四台新超算之一,Leonardo 由超过 14000 个基于英伟达 Ampere GPU 的节点组成,FP16 AI 性能高达 10 Exa-Flops 。

Nvidia和意大利大学财团和大型超级计算中心Cineca,宣布了计划建造“世界上最快的AI超级计算机”的计划。

即将面世的莱昂纳多系统将使用近14,000个Nvidia A100 GPU来执行各种高性能计算任务。该系统的最高性能有望达到10个FP16 ExaFLOPS。 

该超级计算机将基于Atos的 BullSequana XH2000 超级计算机节点,每个节点均搭载一个未知的Intel Xeon处理器,四个Nvidia A100 GPU和一个用于连接的Mellanox HDR 200Gb / s InfiniBand卡。刀片是水冷的,每个HPC机柜中有32个刀片。  

Leonardo(莱昂纳多)超算是用了14000个Nvidia GPU,Nvidia称其为“世界上最强大的AI系统”,这个系统在某些半精度浮点(FP16)应用中提供10 exaflops的AI性能,在以Top500为基准进行测试时,可以提供大约200 petaflops算力。这一系统的推出,也将从今年底开始改变欧洲超算系统的格局。

新超算旨在为欧洲地区的高性能计算提供支持,有助于为科学 / 工业领域的应用程序提供先进的 AI 功能。

此外英伟达将为整个项目集群提供低延时的 Mellanox HDR InfiniBand 宽带连接网络,以达成预期的性能表现。

其它计算机集群包括位于卢森堡的 MeluXina、位于斯洛文尼亚的 Vega、以及位于捷克的 SuperCooling 装置。

展望未来,CINECA 还计划在保加利亚、芬兰、葡萄牙和西班牙地区增设四台超级计算机,更多细节将在稍后公布。

最后,CINECA 的这些超算集群将可用于基因组分析、找寻新的治疗途径、处理多个不同来源的数据、太空探索 / 地外行星研究、以及针对极端天气的模式模拟等。

对于那些从事超级计算已经有几年时间的人来说,对Bull系统应该十分熟悉,尤其是在欧洲。这家公司在2014年初被Atos收购,但从外界的角度,本质没有变化,直到HPC产品(包括“ Sequana”系列)使用Bull的名称。

多年来,Bull一直是欧洲知名但规模不大的HPC集成商,取得了几项重大成就,在研究和学术界只有相对少数的系统。但时代在改变,特别是在Bull重要的收购之后。

先是将IBM的x86服务器业务出售给联想的交易,由于IBM在高性能计算市场关键的地位。欧洲HPC中心也别无选择,因为联想距离很远。IBM具有足够的本机资源,可以用于许多中心,因此多年来,许多欧洲研究机构、政府机构、气象机构、甚至大企业的HPC都是用IBM的产品。

另一家公司Cray希望在欧洲获得许多胜利,这种趋势一直持续增长,直到最近收购HPE为止,尤其是在天气和大型计算设备领域。尽管我们尚未看到这种供应商转变对市场的影响,但我们预计在欧洲,变化会在未来几年中显现。这不是因为Cray或IBM不合适,也不是因为他们的技术已经改变,是欧洲想要一直想要的东西——自己的HPC供应商生态系统。

如今,Atos在欧洲处于有史以来最强大的地位,这表明它可以提供与世界范围内的Cray / HPE和IBM相当强大的,用于多学科科学和技术计算的系统。实际上,有人可能会争辩说,今天宣布的“LEONARDO”超级计算机将把Atos带入高性能计算世界的真正“大时代”。

很难说LEONARDO超级计算机进入世界500强时将位列第几,但有望达到200 petaflops的峰值半精度浮点性能(Nvdia称其为前10 EB的AI超级计算机,它基于FP16)。

在与Nvidia的Ian Buck的一次电话会议中,这家GPU制造商表示这将是欧洲最强大的AI超级计算机,将拥有14,000多个A100 GPU,并在Atos Sequana节点上的四个A100 GPU上分解成一个单一的具有英特尔Rapids处理器和Nvidia Mellanox HDR 200Gb / s网络。

LEONARDO由EuroHPC采购,EuroHPC是欧洲各国政府与欧盟之间的联合合作,旨在在欧洲开发世界一流的超级计算生态系统和百亿亿次超级计算,并由欧洲委员会通过意大利大学和研究部资助。

NVIDIA解决方案架构和工程副总裁Marc Hamilton表示:“欧洲百亿亿欧元的EuroHPC技术路线图为HPC和AI的快速增长和创新打开了大门。我们正在与CINECA和Atos合作,在广泛的应用领域中加速科学探索,为迎接百亿级计算时代提供了一个平台。”

有趣的是,明年会有多少HPC中心选择SuperPOD实现以AI为中心的计算,以及有多少采用Sequana中提供的更标准的HPC面向工作负载的架构?我们希望与AI / HPC世界中其他地方看到的情况相似,在这些地方AI和加速的科学计算应用程序都是GPU密集型的,并且有一些专注于AI的研发中心,需要完整的DGX或SuperPOD。

Nvidia与合作伙伴在欧洲范围内构建多个基于SuperPOD的系统,同时保持其Sequana不仅仅涉及硬件。这些系统的软件和支持生态系统非常庞大,因此,在重建SuperPOD时利润可能微不足道,而它们在支持和牢固生态方面的构成将是无价的,尤其是欧洲在其中扮演的角色比以往任何时候都雄心勃勃。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分