深扒北京超级云计算中心背后的故事

电子说

1.3w人已加入

描述

Linpack测试性能达3.743PFlops,峰值性能达7.035PFlops。

在近日公布的2020中国高性能计算机性能排行榜Top 100中,北京超级云计算中心无疑是最令人瞩目的那一个。

这是因为榜单的前2位已经五年没有发生更迭,还是熟悉的两个——“神威太湖之光”和“天河二号A”,而榜单的第3位,也就是北京超级云计算中心,则是异军突起的新面孔。

今天,我们就来深扒北京超级云计算中心背后的故事。

“王谢堂前燕飞入寻常百姓家”

在大家的印象里,超算往往都是大家伙、重武器,是用于研究核能聚变、宇宙、气候等国家级课题的“国之重器”。其实,在“国民经济主战场”,更多的应用是无法企及国之重器这样的高度的,这就要求超算不能只是“王谢堂前燕”,还要“飞入寻常百姓家”。

简单来说,目前超算行业正在形成三类市场:

第一类,尖端超算,需要国家集中力量办大事,打造最尖端的超算中心;

第二类,通用超算,需要性价比高的解决方案,超级云计算中心的模式对推动超算商业化具有重大的作用;

第三类,行业超算,需要根据业务需求设计上云流程,提供行业定制。

而北京超级云计算中心(A分区),就属于不折不扣的、服务千行百业的通用超算。通过“云化”的超算服务模式,服务于对算力不同需求的科研用户,同时也为国家超算提供给了重要的算力补充。

据了解,北京超级云计算中心成立于2011年,依托中国科学院计算机网络信息中心建立,由北京北龙超级云计算有限责任公司负责运营,是怀柔科学城北京市人民政府与中国科学院共同建设的重点项目。本次夺得第3名的北京超级云计算中心A分区,是中心现有资源池的一部分。为满足不同用户对计算的使用和资源存储需求,中心还有T分区、M分区、IO分区以及科技云9分区等。

成立9年的超算中心 冲击超算榜单靠的是什么?

榜单发布人、中国科学院计算技术研究所研究员张云泉介绍,2020年共计提交73台新系统,根据TOP100排行规则,排重合并后新增机器上榜47台,这也意味着,2019年榜单中的100台系统仅剩余53台,淘汰率接近50%,竞争程度之激烈可见一斑。

那么,一家成立9年的超算中心,靠的什么一举斩获2020中国HPC榜单第三呢?

显然,这和技术的升级迭代脱离不了关系。

2019年8月,AMD发布了全球首颗7nm制程工艺,代号为“罗马”的第二代AMD EPYC霄龙系列处理器。在架构方面,新一代AMD Infinity架构突破了x86性能和计算能力,获得了同类产品最高的I/O和内存带宽,在多种工作负载下最高能够将总体拥有成本(TCO) 降低50%。

而北京超级云计算中心正是敏锐地把握住了技术创新的趋势。3个月后的同年11月,北京超级云计算中心选择戴尔科技为设备供应方,采用第二代AMD EPYC 处理器的A分区迅速正式上线了100个节点,截至2020年10月已逐步扩容到3000节点,从而实现算力的大跨越。

迎来黄金期的超算 戴尔科技助力前行

近年来,随着国内移动互联网快速发展,越来越多企业对强大算力的需求持续升温,这也给中国超算的发展带来了黄金期。

统计数据显示,截止至2019年,我国传统超算市场的整体规模达280亿元,其中尖端超算目前大约占四分之一,而通用超算占四分之三。但目前来看,超算主要是尖端超级计算机及其用户,中小用户和面向行业的业务型用户的需求没有得到满足。

北京超级云计算中心聚焦通用计算市场,以随需供应的“超级云计算服务”的模式向用户提供算力,面向海量无超算资源的用户以及中小微超算用户,无疑为超算的商业化发展探索出一条新路线。

还需指出的是,“计算”作为一种支撑和工具,它只是先进生产力链条中的一个环节。在计算之外,数据的采集与处理、软件的设计与调优、模型模式的开发等等,同样重要。

在这方面,戴尔科技作为全球领先的IT端到端解决方案提供商,不仅为像北京超级云计算中心这样的客户提供全面的HPC就绪方案和HPC产品方案,同时也在软件应用等方面,帮助客户用好超算,释放超算的更大潜力。

坐落于著名学府剑桥大学的“Cumulus–英国科学云”是英国最大的学术超级计算机,由戴尔科技为其提供算力支持,性能可达每秒超过2千万亿次浮点运算。

除了算力支持外,戴尔科技还联合合作伙伴开发了戴尔数据加速器(Dell Data Accelerator:DAC),通过基于NVMe的存储解决方案,消除了拖慢系统性能的存储瓶颈,实现了HPC系统中新一代的数据密集型工作流程。

在2019年6月Virtual Institute公布的2019 I/O-500榜单中,集成了DAC的Cumulus以620.69的得分位列第一,领先第二名290分!这意味着它首次亮相即是世界上最快的HPC存储系统,比第二名的性能提高了近一倍。

并且,戴尔科技通过经工程验证的系统配置(包括DAC服务器节点,内存,网络,PCIe存储和NVMe存储),已向广大HPC用户提供该解决方案,从而共享DAC的优势。这意味着DAC提供了全球最快的开源NVMe存储解决方案之一。

可以看见,戴尔科技能为HPC用户提供的,绝不仅仅是算力这么简单。事实上,凭借多年的创新与开放,戴尔科技已经形成了完整的生态系统,可以为客户提供从HPC的采购到部署、从应用到运维的全生命周期管理服务,释放超算的强大潜力,让客户将精力真正投入到业务当中。

责任编辑:lq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分