清华计算机系超算团队以总分88.398分取代麻省理工成为计算机专业最强的大学

电子说

1.2w人已加入

描述

美国得克萨斯州达拉斯市,在2018国际大学生超级计算机竞赛(SC18)现场,当组委会主席约翰·卡泽宣布中国清华大学超算团队夺冠时,团队成员们——来自清华不同年级的6名本科生激动欢呼,48小时,清华赢了。他们以总分88.398分(满分100分)摘得总冠军,并取代麻省理工成为计算机专业最强的大学……

计算机和互联网如今渗透进我们生活的方方面面,以及新出现的云计算、大数据及人工智能都是基于计算机技术,由此可见计算机技术将在未来很长的时间内经久不衰。

美国当地时间11月15日下午,美国得克萨斯州达拉斯市。在2018国际大学生超级计算机竞赛(SC18)现场,组委会主席约翰·卡泽宣布,来自中国的清华大学超算团队夺冠时,团队成员们——来自清华不同年级的6名本科生激动欢呼,48小时,清华赢了。

这一次,清华计算机系超算团队以总分88.398分(满分100分)摘得总冠军,并取代麻省理工成为计算机专业最强的大学。

全球超级计算大会(Supercomputing Conference,简称SC)是国际超算领域的顶级会议,国际影响力巨大。作为会议的重要组成部分,SC比赛是超级计算机领域的顶级赛事,每年举办一次,吸引着世界各国家和地区的众多高校参与。比赛旨在促进大学生与工业界之间的联系,推动世界各地区超算青年人才交流和培养,提升超算应用水平和研发能力。

本次竞赛共有来自全球15所高校的本科大学生组队参赛。清华大学作为唯一一所内地高校参赛,与传统强队新加坡南洋理工大学和***新竹清华大学等传统强队激烈角逐。

中国4所高校入围TOP10

至此,在2018年三大国际大学生超算竞赛ASC、ISC和SC中,清华大学超算队伍包揽了全部三项竞赛的总冠军,实现了继2015年后的又一次“大满贯”。这也是清华大学超算队伍在此三大国际性大学生超算竞赛中累计获得的第11项冠军。

超级计算机

我国华中科技大学、浙江大学、东南大学分别以排名第6名、第9名和第10名入围TOP10。

从无到有,从有到冠军

清华大学计算机系成立于1958年,经过60年的不懈努力从零到全球第一,现有5名两院院士及7名长江学者。1974年清华大学设计、研制成功采用集成电路的DJS-130小型计算机,运算速度达每秒100万次,为我国超算打下基础,这无疑是一种飞跃式的发展。

比赛期间一直没回酒店,队长在桌子下稍作休息(图:清华大学提供)

难怪有网友热议:这才是值得崇拜的偶像!

兴趣是最强战斗力

面对复杂的赛制、烧脑的题目,成员们更愿意把它们视为有趣的挑战。

回顾比赛的过程,成员郑立言说,“我们要让一个程序不停地优化,让它跑得更快,还要降低功耗需求,我觉得这样的事情特别有趣。”

“从进入清华就拜托班主任打听超算团队了。”大学刚入学,成员赵成钢就对超算团队产生了浓厚的兴趣,从参加组会、熟悉规则到做外围支援,从优化程序、操控机器到训练临场应变,一年多之后,刚刚上大学二年级的赵成钢就进阶为正式队员。

“团队的选拔和培养主要以兴趣为主,我们其实是一个兴趣团队。”翟季冬介绍到,同学们在日常培训中会表现出不同的兴趣,比如纪平、欣健对硬件感兴趣,成钢、晨耀对程序优化和程序分析方面有很大的发挥空间,立言和家傲的英文表达非常好……我们会在比赛中极力去发掘和培养他们的这些兴趣。

在各司其职的比赛现场,互相照顾成为了这48小时中6个年轻人的日常状态。何家傲说,我们一起解决问题,是志同道合的朋友更是患难之交。

“我们常说超算比赛就像F1赛事,是非常综合的一个比赛。不仅要拥有先进的硬件设备,同时还需要队员们对相关科学领域的应用有深刻的理解,在高性能计算方面有扎实的基本功,极佳的现场应对策略及语言表达能力等等。”指导教师韩文弢介绍到。

附知识点:竞赛比什么?不明觉厉...

正式介绍前,先来科普几个知识点:

超级计算(supercomputing),也称为高性能计算(high-performance computing),是研发超级计算机(supercomputer)及其软件和应用的领域。 编程是让计算机为解决某个问题而使用某种程序设计语言编写程序代码,并最终得到相应结果的过程。为了使计算机能够理解人的意图,人类就必须要将需解决的问题的思路、方法、和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。这种人和计算机之间交流的过程就是编程。 跑数据指编程后,为检验其是否有纰漏,代入各种情况,并将其输出结果与标准答案比对的过程。 NetCDF(network Common Data Form)网络通用数据格式是由美国大学大气研究协会(University Corporation for Atmospheric Research,UCAR)的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型并适于网络共享的数据的描述和编码标准。目前,NetCDF广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。用户可以借助多种方式方便地管理和操作NetCDF 数据集。

最后再来看看竞赛比什么?

比赛要求参赛队伍在总功率3000瓦的限制条件下,自行搭建计算集群并在集群系统上进行6个应用程序的性能比拼。

在48小时的竞赛中完成超算集群的性能基本测试HPL(直译为高性能线性系统软件包)和HPCG(直译为高性能共轭梯度),大规模机器学习,核裂变链式反应的稳态求解与模拟,论文复现——特大地震模拟,现场公布的神秘应用等内容。

同时还设置了采访、参会、海报设计等环节,成员需在比赛中向评委介绍自己优化的应用和正在进行的软件优化设计,还需要在48小时内完成一篇在国际权威杂志具有发表能力的英文论文。

最让队员们忧心的神秘应用是——WRF(The Weather Research and Forecasting Model)天气预报模式,是一道超算领域里面的经典应用题目。在当今世界,WRF主要应用于天气预报的预测,通常具有极大的数据量。

“夸张一点说,如果使用本次比赛的集群要有将近一栋楼的倍数,才能跑完整个数据。”何家傲解释到,“所以我们要在48个小时之内对应用进行编译还要尽量跑更多的数据点,这是非常大的挑战。”

队员们讨论解决方案

评委在清华大学场地问询

在多次比赛的积累中,清华团队凭借对同类题目的了解,迅速跑完了第一个数据点。但由于题目编译的复杂程度超乎寻常,在比赛已经进行到差不多一半时间时,题目的第二个数据点的编译问题一直没有解决。

凌晨4点,6个年轻人被紧张的气氛笼罩着。于纪平回忆“WRF三个数据点,输入数据均为NetCDF(network Common Data Form)网络通用数据格式,但是后两个数据使用了旧版的NetCDF文件格式。多次尝试之后,我们发现了问题所在,通过在编译过程中加入NetCDF对旧版格式的支持后修复了这个问题。”

凌晨6点,第二个数据点成功跑了起来。早上9点,神秘应用的全部三组数据点成功跑完。

你看懂了吗?一起为他们点赞!

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分