超算如何支持深度学习应用?国家超级计算无锡中心主任杨广文教授现场解惑

描述

2017年4月18日,由鲲云科技主办的2018年全球人工智能应用创新峰会在深圳五洲宾馆召开,来自中国超级计算领域国际权威清华大学杨广文教授,介绍了神威太湖之光超级计算机的系统架构和应用,其中对于引入AI的计算加速芯片,引发了现场众多工程师的共鸣。

人工智能有两个大的应用领域,一个是物联网的前端,一个是超级计算中心。杨广文教授是清华大学教授,连续四年国际超算领域的权威专家,2016年和2017年,杨广文教授带领的国家超算中心无锡中心神威太湖之光,获得国际评选超算第一名。这部国之重器目前的在应用端的重大成果,包括在AI深度学习方面有哪些亮点,国家无锡超算中心主任杨广文教授带来了最新的资讯和成果分享。

“神威·太湖之光”是世界上首台峰值浮点运算性能超过每秒十亿亿次的超级计算机。“神威·太湖之光”也是我国第一台全部采用国产处理器构建的世界排名第一的超级计算机。2016年年底,国际高性能计算应用最高奖戈登·贝尔奖公布获奖入选名单中,依托于“神威·太湖之光”的强大计算能力,中国有3项应用入围最终提名,占了总入围项目的一半,2017年三项入围应用中,基于“神威·太湖之光”的应用占据2/3。

杨广文教授介绍说,神威·太湖之光超级计算机由40个运算机柜和8个网络机柜组成。每个运算机柜包含4块由32块运算插件组成的超节点分布其中。每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。一台机柜就有1024块处理器,整台“神威·太湖之光”共有40960块处理器。每个单个处理器有260个核心,主板为双节点设计,每个CPU固化的板载内存为32GBDDR3-2133。芯片是低功耗设计,制冷是全水冷设计,供电是全直流供电,这台机器性能稳定。

神威 太湖之光,这台机器放在太湖旁,紧邻我国经济最发达的长三角地区。前面有上海,后面有江苏、无锡,南京和常州,这些都是GDP上万亿的城市,这些地区对超算的需求是迫切的。国家对超算的需求:解决重大科技问题,研究重大装备。无论是科技需求,还是经济需求,长三角都是合适的。

杨广文教授在超算中心,主要职责就是运维好,运维的目的就是将这台超级计算机用好。杨广文教授指出,中国制造2025是国家重大战略,如何帮助中国企业和产业进行转型升级?杨广文教授调研发现,中国转型升级的关键问题,创新性设计没有多少,造船厂没有原型设计,只是在大轮船的基础上,做一些细节的修改。电力公司也没有设计。

“超算中心,可以在数据的基础上进行创新设计模拟,对于国家重要工业设计进行创新性设计模拟是有很强的助力的,要把这个工作做好,路程还非常遥远。如果路线清晰,国家提倡的产业转型升级看到的路径就很清晰了。”杨广文教授指出众多中国制造企业存在的痛点。

计算速度

神威三代发展历程,第一代主要是放在气象中心,第二代是神威蓝光,放在济南,千万亿次的计算速度,第三代神威太湖之光,2016年6月20日发布,中国的“神威•太湖之光”超级计算机以每秒10亿亿次的浮点运算速度第三次夺冠,比第二名“天河二号”快出近两倍(“天河二号”也是中国的)。这是划时代的机器,功能强大,性能稳定。

世界强国已经把中国神威太湖之光作为赶超的对象,杨广文教授表示,2018年6月份,美国新的超级计算机会诞生,据外界说法这个新超级计算机由该实验室与IBM联合研制,由NVIDIA公司提供动力,将于2018投入使用。浮点运算速度会达到200P,200千万亿次运算。

关于“制造世界上运算速度最快的超级计算机”的竞争,一直在中美日韩等国之间进行,“在这之前,计算机产业确实存在这样的竞争。不过,现在更重要的是在于,这样高运算速度的超级计算机能用在什么领域这才是现在科技领域的竞争关键点。神威太湖之光花费国家预算23亿人民币,这台机器如何去维护好?

计算速度

超级计算机的核心使命是解决重大科技问题,优势是大的计算资源。神威·太湖之光”两年来的利用率已经超过50%,累计拥有几百项应用课题,到目前基于“神威·太湖之光”已完成了20多个应用领域上百项应用的计算任务,目前完成的整机应用已达15个,取得一些重要的应用成果。

杨广文教授介绍表示,超级计算机能够获得戈登·贝尔奖,有三个标准:有足够大的计算,有足够强的问题,有先进的研究结果。

2017年11月美国丹佛SC17大会上,“神威·太湖之光”不仅在硬件方面继续保持TOP 500世界第一的殊荣,并且基于“神威·太湖之光”系统的2项全机应用“全球气候模式的高性能模拟”、“非线性大地震模拟”,一举拿下了“戈登•贝尔”奖,实现了我国高性能计算应用在此项大奖的蝉联!2017年,国家超算中心做了非线性地震模拟,该工具首次实现了对唐山大地震(M7.2, 1976)发生过程的高分辨率精确模拟,使得科学家可以更好的理解唐山大地震所造成的影响,并对未来的地震灾害救援演习、预防预测等研究具有重要的借鉴意义。

计算速度

超算如何支持深度学习?

我们支持深度学习,超级计算机支持千万核,效率是74%,这台机器计算能力超强,完全可以支持人工智能的深度学习应用需求,许多IT公司的技术负责人找到我们。

计算速度

关于无锡超算对深度学习的支持,杨广文教授说:“第一个开发了大量深度学习算法并行软件;第二,研发了一个深度学习平台swCaffe,来支持用户基于这个进行深度学习应用,目前已开展的应用包括围棋、语音识别、医学图像识别、遥感图像分类、地震波余震特征识别、大规模冷冻电镜生物大分子模型高精度重构等;第三,我们也在布局,与国家并行计算机工程技术中心基于申威26010芯片开展小型化机器研发,特备针对特殊应用开展专用机的研制。进一步,可根据重大应用需求,提出一些申威自主芯片的一些改进方案,如针对人工智能、深度学习做一些定制的芯片,这是一个长期的研究工作。”AI时代对计算能力的要求,杨广文教授认为未来需求还是会朝着定制化的方向的发展。

计算速度

计算速度

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分