作者:Tawfeeq Ahmad
2024-12-27
计算密集型应用程序的快速发展提高了对更快、更高效和可扩展的网络解决方案的需求。为满足这一需求而出现的最具创新性的技术之一是基于融合以太网的远程直接内存访问 (RDMA) (RoCE)。这项突破性技术促进了系统之间的直接数据传输,无需 CPU 干预,从而显着减少延迟并提高整体系统性能。[爱波]一家著名的 FPGA 设计公司处于这一进步的最前沿,通过将 AMD 的 ERNIC IP(以太网 RDMA 网络接口控制器知识产权)集成到其嵌入式计算模块产品组合中,实现了强大的 100G 以太网解决方案。这种集成旨在增强高性能应用程序中的 RDMA 功能。
RDMA 是一项关键技术,可有效绕过 CPU,在主机或服务器之间实现直接内存传输。此功能使 CPU 能够专注于应用程序执行和数据处理,从而显着提高网络性能,其特点是减少延迟、降低 CPU 负载和增加带宽,所有这些都以经济高效的方式进行。 RoCE 是一种特定的网络协议,旨在促进以太网上的 RDMA 操作。通过利用现有的以太网基础设施,RoCE 为希望在不彻底改变当前网络设置的情况下提高性能的组织提供了一个有吸引力的选择。
根据使用的网络适配器,RoCE 分为两个不同的版本:RoCE v1 和 RoCE v2。
ERNIC(支持嵌入式 RDMA 的 NIC)IP 是可定制的以太网 RDMA 网络接口控制器 IP 核,旨在与 AMD FPGA、MPSoC 和软 MAC IP 实现无缝集成。该解决方案的特点是高吞吐量、低延迟以及基于标准以太网的完全硬件卸载、可靠的数据传输机制。 iWave 通过成功实施 100G 以太网解决方案体现了其对技术进步的承诺。这一成就是通过利用 iWave 的[Zynq UltraScale+ MPSoC 支持的开发套件]实现的,该开发套件集成了 AMD 的 ERNIC IP。
Zynq UltraScale+ MPSoC 开发套件专为采用高速 QSFP-28 连接器进行原型设计和评估 100G 以太网解决方案而定制。
典型的演示设置(图 2)包括:
图 2:Zynq UltraScale+ MPSoC 开发套件的典型设置。 (图片来源:iWave)
该系统架构旨在优化数据传输,在处理系统 (PS) 和可编程逻辑 (PL) 组件之间明确定义角色。该实现还具有精确时间协议 (PTP) 同步功能,这对于实时应用至关重要。凭借出色的性能指标,例如能够以每秒超过 100 帧的速度处理 8K 视频,潜在的应用涵盖数据中心、多媒体和高性能计算等各个领域,凸显了该技术在现代计算环境中的多功能性和重要性。
图 3 所示的系统高级架构突出了 Zynq UltraScale+ MPSoC 中 PS 和 PL 组件的不同作用。 PS 具有基于 ARM Cortex-A53 的硬 SoC,这对于系统配置、控制和诊断至关重要。该架构的关键组件包括:
图 3:Zynq UltraScale+ MPSoC 中处理系统和可编程逻辑组件的不同角色的亮点。 (图片来源:iWave)
AMD ERNIC IP 有效地将 RoCE v2 堆栈卸载到 FPGA 上,并由 ERNIC 控制器管理各个模块之间的握手以促进数据传输。它生成工作队列条目并向 ERNIC IP 发送通知(门铃)。同时,Zynq UltraScale+ MPSoC 的 100G 以太网子系统管理 MAC 和物理层,而数据模式生成器则负责生成原始数据和视频数据模式。
PTP(IEEE 1588 标准)时间戳在以太网上跨系统同步时间方面发挥着至关重要的作用。这种同步对于增强实时应用程序的性能、实现纳秒级的同步和低延迟数据交换至关重要。
该设置的显着特点包括:
从 Zynq UltraScale+ MPSoC 开发套件到服务器 PC 的视频数据传输的详细吞吐量统计数据显示出令人印象深刻的性能,能够以超过 100 fps 的速度处理 8K 视频,以超过 400 fps 的速度处理 4K 视频。
RDMA over 融合以太网和 ERNIC IP 的集成为各个行业开辟了新途径,显着增强了一系列应用的连接性、性能和效率,包括:
随着对更快、更高效的数据传输解决方案的需求不断增长,融合以太网上的 RDMA 和 ERNIC IP 有望在未来的高性能计算中发挥关键作用。
iWave 广泛的 FPGA 和 SoC FPGA 平台产品组合与其深厚的技术专业知识相结合,使客户能够开发利用人工智能 (AI)、机器学习和边缘计算领域最新进展的尖端产品。通过与 iWave 合作,公司可以加快产品开发、降低风险,并在日益复杂的技术环境中保持竞争优势。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !