处理器/DSP
今天,我们聚焦来讲MI300A作为APU,将CPU与GPU IP整合在一起,AMD在这一设计上实现了引领水平的集成度,核心数量相对较少,但集成度相更高。
一)MI300A的规格和设计
MI300A 与 H100 SXM,同样是 APU(CPU + GPU)与仅 GPU 的比较,AMD 认为其芯片处于大致水平,但包含 CPU。
AMD Instinct MI300A 占用了 MI300X 的大约 75% 的空间,并保留了该部分,但是用 CPU 计算取代了平台的四分之一。
AMD 正在使用 Genoa-X 和Genoa等其他芯片中的 Zen 4 核心,APU具有统一内存。通过单个 HBM3 池,CPU 可以转换数据, GPU 可以直接访问相同的内存。APU还有另一大优势。它不需要为 CPU 和 GPU 之间跨 PCB 的长传输提供动力。数据可以位于 HBM3 中,然后移动到正确的计算元素。AMD Instinct MI300A APU 优势是 24 个 Zen 4 核心,但这是以 GPU 计算端的两个 XCD 为代价的。
二)MI300A得架构深入
在AMD Instinct MI300A的架构中,CCD(Core Chiplet Die)的设计与之前在AMD EPYC 9000系列的Genoa和Genoa-X中见到的8核CCD非常相似,一致性的设计带来了更高的可预测性,使得开发者可以更轻松地适应新的架构。
在内存子系统方面,MI300A仍然采用128通道的HBM3控制器,但与以往不同的是,它配备了3个CCD用于x86计算和6个XCD用于GPU计算。这种巧妙的设计使MI300A能够在处理不同类型计算任务时实现更高的灵活性和效率。
MI300A在数据局部性方面进行了一些变化,AMD保留其NPS(NUMA Per Socket)功能,但在MI300A上,用户可以选择单分区或三分区的设置。而MI300X一侧则提供了1个、2个、4个和8个分区的选项,这为8个XCD的应用场景提供了更多的配置选择。
三)MI300A的封装结构
AMD Instinct MI300系列引入了颠覆性的3.5D混合键合封装技术,将内存和计算功能紧密融合,显著降低了能量传输消耗
采用7nm 3D V-Cache块和5nm CCD,AMD在芯片堆栈中巧妙应用HBM和IO芯片,通过3D混合键合实现更高密度,较传统技术更为先进。
灵活的小芯片策略使AMD能够在MI300系列中重用其他产品的组件,实现了混合和匹配,为不同应用提供了更多选择。
挑战中的创新布局展示了AMD对技术挑战的灵活应对,特别是在边缘没有HBM3的布局中。
MI300A APU的独特之处在于共享电源的能力,适应不同类型应用的需求,为大型封装提供了灵活的供电和冷却选择。
这种3.5D堆叠封装技术的先进性使AMD在技术创新领域保持领先地位,为未来计算任务提供了更高效、可持续的解决方案。
审核编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !