缓冲/存储技术
传统上讲,LRDIMM(低负载双列直插存储器模块) 和 RDIMM(双列直插存储器模块) 为数据中心企业服务器提供补充解决方案——LRDIMM 针对需要更深存储器的应用,而 RDIMM 则针对需要更高数据带宽的应用。然而,随着 8Gb DRAM 的推出,LRDIMM 已提供出色的备选解决方案,能同时满足更深存储器和更高数据带宽需求。
尤其是基于8Gb DDR4 DRAM 的 32GB 2RX4 LRDIMM 已证明在服务器内存容量和带宽方面全面超越 32GB 2RX4 RDIMM。
需要同时具备更深存储器和更高数据带宽
越来越多的互联网应用,例如内存数据库 (IMDB),正受益于更深存储器和更高数据带宽。更大的 IMDB意味着更多的数据可以存储在高速 DDR4 DRAM 存储器中,从而减少数据处理过程中与较慢存储介质的数据交换。减少与较慢存储介质的数据交换意味着内存密集型应用将运行得更快。IMDB 应用包括数据分析、金融算法、游戏和搜索算法。图 1 给出了一些实例。
图1
LRDIMM 的优势
在 8Gb DRAM 之前,32GB LRDIMM 基于采用比较昂贵的DDP1 封装的 4Gb DRAM 构建而成,如图 2 所示。
图 2
在基于 4Gb DRAM 的 32GB 4RX4 LRDIMM 中,来自前侧 DDP 的两路 DRAM 数据负载和来自后侧 DDP 的两路 DRAM 数据负载共享相同的数据总线。这四路 DRAM 数据负载经 LRDIMM 的独特数据缓冲架构进一步缩减为一路数据缓冲器负载。
采用这种数据负载减少技术后,当在一条内存通道中放置三个 LRDIMM 时,只会出现三路负载。 此外,九个数据缓冲器位于距离边缘连接器非常近的位置,能减少数据传输短截线长度 (transmission stublength)。减少传输短截线长度和数量能提高信号完整性。图 3 给出了用 3 个 LRDIMM (3 DPC) 配置的内存控制器通道 (MCH)。提高信号完整性可增加更多的信号裕度,因此在将数千个存储器模块放置在典型数据中心的数千台服务器中时,能够提高服务器系统的可靠性。
图 3
与 32GB 4RX4 LRDIMM 不同,32GB 4RX4 RDIMM 并未得到开发,因为在没有用于减少负载的数据缓冲器的情况下,4 路 DRAM 数据负载都会出现在 MCH 通道中,这样每个 MCH 配置中的 3 个 RDIMM 中总共会有 12 路负载(4 路 DRAM 负载 x 3 个 RDIMM)。
此外,在没有数据缓冲器的情况下,从 DRAM 到边缘连接器的信号距离就会增加。传输短截线的长度和数量的增加意味着信号完整性变差。这也就是为什么基于 4Gb DRAM 的 RDIMM 会止步于 16GB 2RX4 内存容量,而 LRDIMM 则能达到 32GB 4RX4 内存容量。
由于应用不断地受益于内存容量的增加,而 8Gb DRAM 能够让 RDIMM“最佳效点”的存储器模块从16GB 增加至 32GB。16GB RDIMM 基于 4Gb DRAM,采用 2RX4 配置构建而成。这样,就可通过相同的2RX4 配置利用 8Gb DRAM 构建出 32GB RDIMM,因为每个 DRAM 都提供双倍的内存容量。同样,可使用8Gb DRAM 以 2RX4 配置构建出 32GB LRDIMM,而不必使用昂贵的 DDP 通过 4RX4 配置来构建。利用 8GbDRAM 将 RDIMM 内存容量从 16GB 增加至 32GB,以及取代以前使用昂贵的 DDP 来构建 32GB LRDIMM,对于完全填充的系统来说哪种是更好的选择—— 32GB LRDIMM 还是 32GB RDIMM?我们的实验室测量结果表明 32GB 2RX4 LRDIMM 比 32GB 2RX4 RDIMM 具有明显优势,您可在更高带宽下受益于更大的内存。
对比 32GB LRDIMM 和 32GB RDIMM
典型的企业级服务器可具备多达 24 个存储器模块,如图 4 所示。一台服务器具有 24 个存储器模块,每个模块 32GB,那么将拥有 768Gb 内存(24 x 32GB)。
图 4
哪种 32GB 存储器模块解决方案在总服务器内存和数据带宽方面更甚一筹—— LRDIMM 还是RDIMM? IDT 通过以下过程来判断:
1) 针对完全填充的 3DPC 系统配置确定 MCH 通道上模块的信号完整性
2) 以可接受的信号完整性为 LRDIMM 和 RDIMM 选择最高的速度
3) 在最高速度下对比带宽,以确定 LRDIMM 还是 RDIMM 具有更高的内存带宽
在两个位置测量数据信号完整性,如图 5 中所示的 V+ 和 V-。电压测量值 V+ 更正且 V- 更负,说明信号完整性越好。这两个值都是衡量实际数据眼图信号与数据眼图波罩之间有多少电压裕度。无论采用什么样的数据信号图案、DIMM、服务器主板和微处理器,数据眼图信号都不能进入数据眼图波罩之内的区域。如果数据眼图信号进入数据眼图波罩区域,必须将数据值“1” 解读为“0”,反之亦然。
图 5
接收和发送方向的四个测量结果表明,2400 MT/s 运行速度下的 3DPC LRDIMM 信号完整性优于 3DPCRDIMM 在 2400 MT/s 和 2133MT/s 速度下的信号完整性。图 6 中给出了所测量的信号完整性数据,3DPCRDIMM 测量结果为琥珀色,3DPC LRDIMM 的测量结果为绿色。2400 MT/s 下的 LRDIMM 具有更正的 V+和更负的 V-,表明整体信号完整性更好。
图 6
由于 3DPC RDIMM 在 2400 MT/s 的速度下电压裕度很低,因此 IDT 认为这样的 RDIMM 速度和密度组合不适合服务器,可以忽略。尽管 3DPC RDIMM 在 2133 MT/s 的速度下仍表现出较低的电压裕度,但在没有 2400 MT/s 这种速度选择的情况下,IDT 还是选用 2133 MT/s 速度配置与在 2400 MT/s 的速度下工作的32GB LRDIMM 进行带宽比较。
IDT 使用 Membw2 来比较带宽。Membw 是一款用于内存带宽测试的公用软件。Membw 通过所有内存通道用读和写操作对存储器模块施压。这种基准测试所采用的服务器具有两个 Intel 多核微处理器,每个都有 4 个内存通道,以及用 3 DPC 共容纳 24 个存储器模块。Membw 基准测量结果表明,2400 MT/s 下的3DPC LRDIMM 带宽比 2133 MT/s 下的 3DPC RDIMM 带宽高 8%。
图 7
结论
不断发展的企业级服务器应用将受益于带宽和存储器模块容量的提高。IDT 将采用 3DPC 配置的 32GB2RX4 LRDIMM 与 32GB 2RX4 RDIMM 进行信号完整性和读/ 写带宽方面的性能对比。与相同配置下采用24 个运行速率为 2133 MT/s 的 32GB RDIMM 相比,完全填充的服务器采用 24 个运行速率为 2400 MT/s 的32GB LRDIMM 时具备更出色的信号完整性。工作在 2400 MT/s 的 LRDIMM 比工作在 2133 MT/s 的 RDIMM带宽高 8%。
即使在主流模块密度下,DDR4 LRDIMM 也可让您实现比 RDIMM 更高的内存带宽。
全部0条评论
快来发表一下你的评论吧 !