曙光已现!通用GPU芯片加速破局,国内企业突破量产瓶颈

描述

电子发烧友网报道(文/莫婷婷)当下,英伟达、AMD两大巨头占据全球超过80%的通用GPU市场。在算力需求激增的情况下,多家国内企业选择加入通用GPU赛道,例如天数智芯、沐曦、壁仞科技、登临科技等。就在2021年3月,天数智芯发布全自研云端训练通用GPU芯片——天垓100芯片,这也是国内第一款全自研、GPU架构下的7nm制程通用GPU训练芯片。
 
电子发烧友网记者了解到,天数智芯的7nm 通用GPU训练芯片已经获得安防、人工智能、超算中心等多个应用领域的客户订单,未来将持续往5nm、3nm等更高级的制程发力。那么,国内通用GPU芯片量产的技术瓶颈在哪里,国内企业如何实现突围?记者就相关问题与天数智芯副总裁郭为进行了交流。
 
为什么国产通用GPU芯片量产难度大?

通用GPU即通用图形处理器,可用于人工智能模型训练与推理,以及高性能计算。与CPU相比,GPU的平行处理能力、处理速度都优于CPU,这也加强了GPU的通用性,而通用GPU的出现让GPU更加专注通用性。可以说,通用GPU就是GPU里的另一个快速发展的细分市场。

 天数智芯

市场机构的数据显示,2019年我国通用GPU芯片的市场规模已达86亿元,预计到2025年将保持32%的年复合增长率,达458亿元。面对如此巨大的市场,国内企业涉足通用GPU市场,面临哪些挑战?郭为向记者表示,通用GPU芯片在设计上主要面临的是两大挑战,一是通用架构,二是软件生态。
 
在架构方面,通用架构需要适配各种各样的算法,包括基础计算;同时考虑到应用场景的特殊性,对芯片功耗也有要求,这就需要对芯片架构的优化和设计,实现低功耗高算力;另一方面,记者了解到国内在人才方面还面临较大的缺口,培养一位成熟的工程师需要10年的时间。
 
在软件生态方面,通用GPU不仅仅是一颗芯片硬件,还涉及到整个软件栈、编译器等一系列的软件生态系统。
 
为了突破技术瓶颈,天数智芯从2018年开始正式启动通用GPU芯片设计,历时三年最终量产国内首款全自研的7nm 通用GPU芯片。据了解,该芯片采用2.5D CoWoS晶圆封装技术,集成240亿晶体管,支持多精度数据类型支持标准/混合训练。在软件上,该芯片兼容主流生态系统,采用自主研发的软件栈,从多方面实现算力升级。
 
目前,一些国际巨头在GPU行业中仍处于领先位置,国内厂商需要突破重重挑战才能实现GPU突围。郭为也提到,英伟达经过十几年的发展,不仅有自主完善芯片架构,同样也有完善的软件生态,相对于软件生态,它具有丰富的软件接口、底层加速库,通用GPU芯片的入场门槛更高,这些都是国产企业需要追赶的。
 
正是因为通用GPU行业的高门槛,天数智芯的不易与成功也让国产企业看到了另一个可能性。
 
天数智芯推出7nm通用GPU芯片时便得到了业内人士的认可。中国工程院院士倪光南表示,该芯片在性能指标方面并不亚于国外主流产品。电子发烧友网了解到,天数智芯的“天垓100芯片”比业内同类芯片的面积小了一半,却实现单精FP32性能37TFlops,半精FP16/BF16性能147TFlops。
 
国产通用GPU芯片落地,深挖应用场景

国产通用GPU芯片在AI领域将打开大规模的应用市场,而这些都需要云端训练。以安防摄像头为例,摄像头在工作过程中,需要进行车辆识别、人脸识别等,这部分更重要的是依赖云端训练出的模型,进行大量推理。
 
郭为提到,通用GPU芯片还可以用于安检机,以及快递行业,对大量的物品进行识别,不管是安防还是快递行业,这些行业对模型训练以及模型推理的速度要求都非常高。在这方面,天数智芯已有客户带来了落地应用案例。
 
通用GPU芯片最典型的应用场景是在人工智能,但随着技术的成熟,通用GPU芯片在5G、自动驾驶、大数据等领域的应用不断扩增。
 
自动驾驶最重要的是安全性,车上有大量的传感器获取路面情况,这些数据将被整合,再通过预先训练的模型预测路况,可以迅速作出决定。郭为指出,在这个过程中,需要大量的算力,同时考虑到汽车空间、电池功耗等问题,将大功耗或者大算力系统放在汽车内部也不太适合,最值得考虑的解决方案是将系统放在边缘侧,同时因为它需要迅速作出决定,要求边缘侧和汽车之间的通讯尽量地做到低时延,5G恰好可以实现这样的低时延。
 
在这些处理过程中,都需要用到通用GPU芯片。郭为认为,在达到理想的高算力低功耗的技术下,未来可以把高端的高算力的芯片直接放在汽车上面,应用场景也就更广了,这也是未来几年业内的研究方向。

 天数智芯

对于未来的发展战略,天数智芯副总裁郭为提到了三大方面:
 
一是更强的算力。任何一个AI应用的模型都会越来越复杂,要求提供更高的算力,同时芯片制成提升会带来边际效应收窄,这时该如何进一步提升算力,实际上是任何一个通用GPU芯片都会面临的技术挑战。另一方面,自动驾驶、智慧医疗等各个行业的算法也在不断演进,此时,对于训练芯片来讲,更高的算力才能支持相应的算法运行。
 
二是更高的通用性。由于技术的快速迭代,云端训练芯片一定要有更高的通用性才能跟上智能驾驶、智慧医疗等高端市场需求。
 
三是隐私计算。智慧医疗场景涉及到患者,甚至医院的医疗数据隐私。而任何一个AI模型都需要大量的数据做训练,这时需要用到隐私计算,通过隐私加解密的方式,让这些敏感的数据做到可用。
 
“对于医疗这样的场景,隐私保护是相当重要的。云端训练芯片关于隐私保护这部分的解决方案,以及通用计算,也应当是后面的发展趋势。”郭为表示,天数智芯在未来会深挖隐私保护的相关应用场景,并且推出解决方案。
 
小结

如今,国内企业不断发力通用GPU芯片市场,随着技术的成熟也将给更多的应用场景带来多样化的可能性。当然,国内企业还需正视与国际企业的差距,并且在追赶的过程中,不断缩小差距,让国内的通用GPU芯片打开真正的用武之地。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分