拓展AI数据中心内存,第二代AMD Versal Premium系列自适应SoC,首发支持CXL 3.1、 PCIe Gen6

描述

电子发烧友网报道(文/黄晶晶)在数据中心市场,DDR5和CXL内存正在成为广泛采用的主流趋势。预计2024年到2029年CXL内存的采用将达到212%的年复合增长率。如今,现有出货的半数服务器已经支持CXL,预计未来几年越来越多的服务器将实现对CXL的支持。
 
基于这一趋势,AMD宣布推出第二代AMD Versal Premium 系列,这款自适应SoC平台旨在面向各种工作负载提供最高水平系统加速。第二代 Versal Premium 系列将成为FPGA 行业首款在硬IP中采用 CXL3.1与 PCIe Gen6 并支持LPDDR5的器件。CXL 3.1 和 LPDDR5X 能助力更快速地释放更多内存,以满足数据中心、通信以及测试测量市场中数据密集型应用日益增长的实时处理和存储需求。
 
AI
 
近日,AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm,和高级产品线经理Mike Rather与媒体交流,分享了第二代AMD Versal Premium系列自适应SoC的特点细节和应用趋势等等。
 
创新设计
 
第二代AMD Versal Premium系列产品,基于第一代产品进行了复用设计,但针对I/O、收发器以及存储/内存的控制器、主机接口都做了创新。
AI
 
AMD高管分析,DSP的计算密度方面,实现了更高的每平方毫米的DSP算力。另外引入了一个新的收发器GTM2,GTM2能够支持的数据速率从1.25 Gb/s到128 Gb/s,同时还支持NRZ和PAM4编码。保留了非常熟悉的设计流程,开发者可以使用GTM2,同时还确保全过程的可靠性。在I/O方面,增加对于高速MIPI C-PHY和D-PHY接口的支持。第二代新加入的LDPC解码器的模块适用于高通量的解码。
 
AI
 
加速主机连接
 
第二代 Versal Premium 器件支持业界最快的主机接口CXL 3.1和PCIe Gen6,可实现行业领先的高带宽主机CPU到加速器连接。
 
AMD高管表示,与主机连接使用的PCIe Gen 6和CXL 3.1都是64Gb/s的速率。与支持 PCIe Gen4或Gen5的FPGA 相比,PCIe Gen6 能提供2至4倍的线速率,而运行 PCIe Gen6 的 CXL 3.1 在类似时延下则能提供使用CXL 2.1 器件的双倍带宽,以及增强的架构和一致性功能。
 
在Versal Premium自适应SoC和AMD EPYC CPU之间能够形成非常好的协同。PCIe Express能够提供Versal Premium和CPU之间非常高性能的连接,这可以用于卸载计算、网络以及存储工作负载。也能拥有非常连贯的接口,这样Versal Premium和EPYC处理器就能够共享内存空间,从而减少搁置内存。再加上PCIe IDE以及内存DRAM的加密,数据能够做到端到端的安全性。
 
AI
 
释放更多内存
 
第二代 AMD Versal Premium 系列自适应SoC能以至高8533 Mb/s的最快速LPDDR5存储器连接加速存储器带宽,带来更快速的数据传输和实时响应。与采用 LPDDR4/5 存储器的同类器件相比,这种超快的增强型DDR存储器可将主机连接速度提升至高2.7倍。
 
AI
 
第二代产品在DDR5和LPDDR5上支持的数据速率,是第一代产品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率有20%到30%的下降。
 
AMD高管表示,第一代Versal Premium系列产品关注的是在高安全性、高通量和带宽的情况下加速网络。第二代AMD Versal Premium除了像第一代那样加速400G或者800G的网络之外,增加了支持CXL内存的分享和池化,因为我们发现在数据中心需要越来越多的内存来支持大语言模型。
 
也可以说,第二代AMD Versal Premium助力计算,是通过更好地管理系统的内存,这正是现在人工智能模型以及各种数据集成最需要的。
 
支持CXL 3.1存储器扩展模块方面,专门针对CXL 3.1规范设计的存储接口,可以和各家供应商的DRAM实现兼容。至高 256x8.533 Gb/s 的 LPDDR5X存储器带宽,至高 16x 64 Gb/s 的 PCle Gen6 带宽,使得总外部存储器带宽超过500 GB/S。
 
AI
 
增强数据安全
 
在不断变化的安全形势下,增强数据安全性正变得日益重要。增强的安全功能有助于第二代 Versal Premium 系列在传输和静态状态下均可快速、安全地传输数据。其是业界首款在硬 IP 中提供集成 PCIe完整性和数据加密( IDE )支持的 FPGA 器件。硬核 DDR 内存控制器内置的内联加密可助力保护静态数据,而 400G 高速加密引擎则能帮助器件以至高 2 倍的线速率保护用户数据,从而实现更快速的安全数据事务。有了PCIe IDE加上高速加密引擎、DDR内联加密与ECC,数据无论是在传输中、静态中、还是使用中都非常的安全。
 
应用
 
在给出的应用案例中,第二代产品能够扩大数据中心的CXL应用范围,CXL 3.1采用PCIe Gen 6协议,可以利用NUMA轻松与现有的软件集成。
 
操作模式方面,能够支持CXL.io、CXL.mem、CXL.cache。器件模式方面,第二代 Versal Premium 可以作为内存的控制器,也可以使用主机模式,连接CXL扩展模块。在用例方面,支持多主机单逻辑设备(MH-SLD)架构和系统可组合性。
 
AI
 
自适应网络用于GPU集群和横向扩展方面,很多客户都会购买并部署GPU集群,而标准的网络接口却未必能够支持在这样情境下GPU的性能和灵活性。而第二代AMD Versal Premium能够提供很高的带宽和灵活性,实现这方面的应用需求。“这个应用我们在Virtex UltraScale+ 和第一代Versal Premium也都支持过,但是现在第二代AMD Versal Premium系列能够在单个网络适配器上支持2个400G接口。”AMD高管说道。
 
AI
 
在测试与测量领域,开发PCIe Gen 7器件时测试仪器需求128 Gb/s的收发器,这些应用非常重视芯片上的DSP引擎以及内存带宽和其他的接口能力。另外第二代AMD Versal Premium系列支持测试设备需要的C-PHY和D-PHY等协议。
 
AI
 
工具和量产时间
 
AMD也在不断地改善Vivado的开发环境,通过采用新的P&R算法,并且改善多线程的性能,增强的增量流,从而减少编译时间。引入了用于顶层设计的RTL流程,以及用于GTM2的RTL流程等。改善QoR与易用性,通过工具引导的时序收敛,改进的DFX流程,以及分段配置以便加快CPU启动时间和PCIe的唤醒。
 
AI
第二代AMD Versal Premium系列产品表显示有4种产品。从140万逻辑单元到330万逻辑单元不等,从3300到7600的DSP引擎不等,GTM2收发器从32个到72个不等,片上内存、100G/600G以太网MAC、400G高速加密引擎、LDPC解码器等也各有不同。
 
AI
 
第二代AMD Versal Premium系列已经向开发者提供早期文档,AMD将于2024年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年将提供芯片的样片以及开发套件,2026年中实现芯片量产。
 
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 相关推荐
  • AI

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分