燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战

描述

由中国工程院信息与电子工程学部主办,浪潮信息承办,2021年人工智能计算大会(AICC)于北京成功召开。作为全球AI计算领域最具影响力的技术盛会,本次大会以“智算·新际”为主题,邀请到众多专家学者与产业领袖,就智能算力发展、人工智能产业创新以及产业数字化转型展开精彩分享。燧原科技副总裁邓辉先生受邀出席“AI芯片创新技术”分论坛,并就燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战发表演讲。

起点

长期处于自主创新空白的云端训练AI算力一切要从2012年那场改变人工智能发展史的ImageNet图像分类竞赛开始谈起。在当时的比赛中,“深度学习之父”、图灵奖获得者——多伦多大学Geoffrey Hinton教授首次提出深度卷积神经网络模型“AlexNet”,参数量达6000万。AlexNet的出现是人工智能技术发展史上重要的转折点,它将沉寂已久的深度学习技术再次推至历史舞台。除了革命性的“大模型”,Geoffrey Hinton教授创新性地采用了异构算力GPU作为训练加速资源。“AI加速”这个概念由此进入广大AI科研工作者与产业落地先锋的视野。

新一轮技术文明由此开始,可这并没有带来我国自主创新AI算力的繁荣,一直以来,AI加速产品与技术都被GPU厂商所垄断,尤其是在云端训练领域,由于云端数据中心整体架构的高度复杂性、大规模分布式AI训练带来的巨大挑战及其本身要支撑的业务多样性等原因,云端训练是国内厂商切入难度最为高的一个领域,长期处于空白的状态,燧原科技作为行业领头羊于2019年发布邃思1.0云端训练芯片,开始了攻坚技术壁垒、打破垄断的征程。

挑战

云端专用AI训练产品的性能与通用性互联网是人工智能技术与产业发展的沃土,人工智能在互联网的广泛应用得益于各类深入人们生活的终端应用所产生的大量数据,而云计算作为关键的底层技术支撑,正与互联网共同以孪生体姿态不断地蓬勃发展,为我们带来了空前的数据井喷与突破人类认知的巨量模型,对超强算力产生了爆炸性的需求;传统GPU架构虽然早期开创了人工智能发展的篇章,但随着人工智能产业蓬勃发展,在规模效应的驱使下,DSA架构带来的更经济的成本与更高效的计算能力使得专用AI训练产品变得越来越有优势。然而由于专用AI训练产品天生缺乏生态积累,在模型泛化与通用性上一直是业界痛点。因此如何保证比GPU更高效的AI模型计算能力,同时兼顾一定的通用性是云端AI训练芯片面临的最大挑战。燧原科技副总裁邓辉先生表示:“我们把性能与通用性作为产品成功最重要的衡量标准,经过3年的努力,这两方面的能力在我们第二代产品上取得飞跃。”

燧原

中国首家发布二代云端训练加速产品组合的企业燧原科技以助力发展我国集成电路和人工智能产业、推动AI算力普惠化为使命,秉承“做大芯片、拼硬科技”的原则,自2019年12月推出第一代云端训练芯片邃思1.0以后,率先实现国产AI芯片数据中心与千卡液冷集群的商业落地,并于2021年7月在世界人工智能大会(WAIC)发布邃思2.0,是中国唯一一家推出二代云端训练加速产品组合的企业。

基于燧原科技自研的GCU-CARE计算引擎,邃思2.0进行了大规模的架构升级,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础。支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8;并在单精度算力方面达到与7nm GPU相当的性能水平:单精度FP32峰值算力最高达到40 TFLOPS,单精度张量TF32峰值算力最高达到160 TFLOPS,大大提高了能效比。同时搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽最高可达1.8 TB/s。GCU-LARE也全面升级,提供双向300 GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

基于邃思2.0,燧原科技推出了云燧T20人工智能训练加速卡与云燧T21人工智能训练OAM模组,能够通过300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案,支持单机多卡、单机柜多节点、多机柜大机群多种部署方式。

未来

更多的AI解决方案与产品孵化除了强劲的原始创新芯片支撑,AI算力的腾飞与人工智能产业的发展需要依托于健全的生态合作体系。在演讲的最后,燧原科技副总裁邓辉先生表示:“未来,我们期望在人工智能领域和浪潮以及更多的合作伙伴一起合作打造更多AI解决方案和产品,助力中国AI产业蓬勃发展。”

责任编辑:haq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分