英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙地将竞争优势聚焦于其更为亲民的价格与总拥有成本(TCO)上。
Gaudi3处理器采用双芯片设计,内置强大的计算单元,包括64个张量处理器核心(TPC,配备256x256 MAC结构并集成FP32累加器)、8个高效的矩阵乘法引擎(MME,支持256位宽矢量处理)以及高达96MB的片上SRAM缓存,提供惊人的19.2TB/s带宽。此外,它还集成了24个200GbE网络接口和14个媒体引擎,后者能够高效处理多种视频编解码格式,如H.265、H.264、JPEG和VP9,为视觉处理应用增添强大助力。内存方面,Gaudi3搭载了128GB HBM2E内存,通过八个内存堆栈实现高达3.67TB/s的带宽,确保数据处理的高效流畅。
相较于前代产品Gaudi2,Gaudi3在架构上进行了显著优化,尽管在TPC和MME数量上有所精简,但它专注于提升特定精度下的计算能力,仅支持FP8矩阵运算及BFloat16矩阵和矢量运算,这一调整旨在更好地满足当前AI工作负载的需求。
在性能表现上,Gaudi3提供了高达1856 TFLOPS的BF16/FP8矩阵运算能力,以及28.7 TFLOPS的BF16矢量运算能力,同时其热设计功耗(TDP)约为600W。尽管在某些指标上略逊于英伟达H100,但英特尔强调,Gaudi3在实际应用中的性价比优势将尤为突出。
英特尔为Gaudi3制定了明确的市场定位,旨在与AMD的Instinct MI300系列及英伟达的H100、B100/B200等高端芯片展开竞争。据英特尔透露,基于8个Gaudi3芯片的加速器套件定价为125,000美元,单芯片成本约为15,625美元,相较于英伟达H100的30,678美元售价,展现了显著的价格优势。然而,面对可能具备更强性能的英伟达Blackwell架构GPU(如B100/B200),英特尔能否持续保持其竞争优势,仍需市场进一步验证。
英特尔执行副总裁Justin Hotard表示:“AI需求的激增正驱动数据中心领域的深刻变革,行业迫切需要更多元化的硬件、软件及开发工具选择。通过推出搭载P核与Gaudi3 AI加速器的Xeon 6,英特尔正积极构建一个开放的生态系统,助力客户以更高的性能、效率和安全性应对各种工作负载。”
目前,Gaudi3 AI加速器已通过IBM Cloud及英特尔Tiber开发者云平台提供服务,并计划于今年第四季度通过戴尔、慧与(HPE)和Supermicro等合作伙伴全面上市,其中戴尔和Supermicro的部分系统将于10月开始出货,而Supermicro的设备则将于12月抵达市场。
全部0条评论
快来发表一下你的评论吧 !