英特尔Gaudi 3中国特供版大幅降低AI性能

描述

  继英特尔发布全新一代AI加速芯片Gaudi 3后,近日宣布将专为中国市场推出特别版本—HL-328及HL-388两款硬件产品。这两款硬件均兼容OAM相容夹层卡与PCle加速卡两种形式。

  据官方透露,Gaudi 3的白皮书中详细描述了这两款硬件的上市时间表,分别是6月24日的HL-328以及9月24日的HL-388。

  在硬件规格方面,中国版Gaudi 3与原版保持一致,同样具备96MB SRAM片上存储、128GB HBM2e高带宽存储,带宽高达3.7TB/s,并配备PCIe 5.0 x16接口和解码标准。然而,受美国对AI芯片出口管制规定影响,该款芯片的综合运算性能(TPP)需控制在4800以下方可出口至中国,这意味着中国版Gaudi 3的16位性能不得超过150 TFLOPS。

  据英特尔数据显示,Gaudi 3在FP16/BF16计算模式下可实现1835 TFLOPS,较之英伟达H100在大模型训练速度提升40%,推理效率提高50%。

  显而易见,为了符合出口规定,中国版Gaudi 3必须大幅度降低AI性能。为此,中国版Gaudi 3可能会减少核心数量(原版包含8个矩阵数学引擎和64个张量内核)和降低工作频率。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分