性能翻倍,下一代国产超算蓄势待发

描述

电子发烧友网报道(文/周凯扬)作为每个国家最重要的战略计算资源之一,顶级超算尤其是科研用超算,可以用于制药、天气预测等关键场景。借助强大的算力,国家机关可以省下更多的人力和物力成本来实现政策目标。而曾经国内的两大超算之王系列,天河和神威,也都在近期迎来了继任者的新情报。
 
天河星逸
 
2013 年研制成功的天河二号,曾经是代表了国内超算迈入国际超一流行列的标志,也在 TOP500 拿下过六连冠的殊荣。虽然经过这几年的发展,第一的位置已经多次变化,但天河二号在 TOP500 上依然可以排到 14 名的位置。
 
且随着这几年广州超算中心的应用扩展,其用户数已经从最初的 300 多个增长至 30 多万个。这样让广州超算中心成了全球用户数量最多、应用最广的超算中心之一。然而,为了进一步提高超算中心的高性能计算能力,还是需要打造新的系统。
 
近期举办的 2023 年超算创新应用大会上,新一代国产超算系统“天河星逸”终于面世。尽管广州超算中心没有公开这一新系统的具体配置信息,但根据已有的公开信息,采用了高性能多核处理器、高速互联网络和大规模存储的“天河星逸”,在CPU 通用计算性能、网络能力和存储能力等较“天河二号”实现倍增。
 
这也就意味着在通用计算性能上,国产高性能CPU已经拥有了比肩国际一流处理器平台的实力。不过在 AI 计算上,这类主打HPC通用计算性能的超算系统还是有所局限。
 
下一代神威
 
除了天河外,中国的另一大超算系列神威也没有闲着。在今年的 SC23 上,虽然我们没有看到新的中国超算上榜,但申威终于展示了新SW26010 Pro 众核处理器以及下一代神威超算的性能。
 
此次SW26010 Pro 依然是采用异构众核的设计,与 SW26010 4个 Core Group 的设计相比,SW26010 Pro采用了 6 个 Core Group 的设计,每个 Core Group由 64 个CPE计算核心和一个MPE 管理核心组成,单芯片核心数达到了 390 个。根据申威提供的数据,其峰值 16bit 浮点算力可达55.296Tflop/s。
 
相较上一代 SW26010 DDR3-2133所提供的136.5GB/s 总内存带宽,此次 SW26010 Pro 升级支持了 DDR4-3200,理论内存带宽可达 307.2GB/s。这与其他超算芯片的内存带宽表现还是有着较大的差距,也就导致了计算和网络活动争抢内存带宽的局面,同步内存访问下,NIC 只能实现 9.87GB/s 的带宽,离理论网络带宽 56.25GB/s相差甚远。
 
不过在具体性能表现上,基于这一处理器的新神威超算却在 HPL-MxP榜单上排到第二的位置。从其数据来看,新的神威超算核心数达到 4114万224 个,在 HPC 与 AI 计算同等重要的 HPL-MxP 测试下可以达到 5.048Eflop/s 的性能,仅次于 Frontier。峰值半精度性能达 5.92Eflop/s,半精度浮点效率高达 85%,这样的销量也是一众异构超算系统中最高的,仅次于非异构的富岳超算。
 
写在最后
 
在推动数字经济持续发展的当下,算力并网已经成为了解决算力分布不均、供需失衡的关键方案之一,而超算恰恰是除了通算、智算之外的另一大重要应用。目前粤港澳大湾区拥有较为丰富的超算资源,打造多模式的融合应用支撑平台,加快多方并网生态构建,将成为推动算力规模突破 10Eflops 的关键路径。
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分