在为工业应用选择闪存器件时提出正确的问题

KOKOKO123 2022-08-17 1435

存储技术

625人已加入

描述

为工业应用选择闪存设备或固态驱动器（SSD）非常复杂。价格性能比较几乎没有用，因为需求驱动的性能定义取决于许多因素。

对于标准 IT 应用程序，每 GB 价格是购买闪存的绝佳标准。在某些情况下，还会考虑写入和读取速度。但是，如果您需要用于工业应用的闪存设备，或者需要用于户外电信应用的存储卡，那么您的优先级将有所不同。如果通常情况下，容量不是真正的问题，那么稳健性和耐用性肯定是问题。持久性（即闪存介质寿命）和保留（即保存数据的持久性）是复杂的问题。存储介质固件和架构都在这里发挥作用，应用程序的性质也是如此。数据将如何写入？还是更强调阅读？如果您对闪存有特殊要求，那么您需要确切知道要问哪些问题。

背景：衰老的迹象

通常，NAND 闪存设备的单元只允许有限数量的删除。这是因为每次产生隧道效应时，通常阻止电子从浮栅流出的氧化层由于熄灭电压而积累了高能电子。因此，阈值电压会随时间变化，最终导致单元不再可读（图 1）。

驱动器

【图1 | 老化电池：电子在隧道氧化层中积累，导致阈值电压逐渐变化。隧道氧化层中的裂缝会引起泄漏电流路径，从而使电荷流出。读取错误增加到块成为需要淘汰的“坏块”的程度。］

老化的另一个影响是在氧化层中形成导电路径，导致电池逐渐失去电荷——随之而来的是保持位。这种效应会因暴露在高温下而加速，特别是在允许的编程/擦除（P/E）循环次数减少的情况下更容易发生，从而导致保留率急剧下降。因此，虽然新的单级和多级单元（SLC 和 MLC）NAND 都可靠地提供了 10 年的保留时间，但在其使用寿命结束时，这一数字下降到只有一年。但是对于 MLC NAND，这一点在 3，000 个 P/E 周期后达到，而 SLC 在 100，000 个之后达到。这就解释了为什么 SLC 是复杂应用的首选解决方案，以及为什么低成本三级单元（TLC） NAND 芯片不能用于长期存储。要使用这种技术在每个单元中写入 3 位，您需要八个不同的电荷状态，这就是退化很快变得明显的原因。在 TLC 中，最初的一年保留水平仅在 500 个 P/E 周期后下降到三个月。

缓解措施

使用各种机制减轻对芯片的物理损坏的影响。考虑到当一个单元发生故障时，需要将整个块标记为“坏”，磨损均衡确保所有物理存储地址都经历相同的使用级别。但读取错误不仅仅是磨损。每次写入数据时，已编程单元周围的单元都会承受压力（即它们变得更有活力）——这种现象称为“编程干扰”。随着时间的推移，单元电压阈值会增加，从而导致读取错误——一旦相关块被擦除，这些错误就会得到修复。阅读还会导致一种称为“阅读干扰”的压力形式，相邻的页面会累积电荷。由于涉及的电压相对较低，这种影响远没有写入那么明显——但读取容易出现位错误，必须通过纠错码（ECC）进行纠正，并通过删除相关块来修复。有趣的是，这种效果在重复读取相同数据的应用程序中尤为明显。这意味着即使在只读存储器中，也需要删除块并重复写入页面以纠正错误。

如何测量 SSD 的耐用性

制造商使用两个指标来衡量闪存设备的寿命：写入的兆字节数（TBW）和每天的驱动器写入数（DWPD）。TBW表示SSD生命周期内可以写入的数据总量，而DWPD表示保修期内每天可以写入的数据量。这些基准的问题在于它们极其复杂，用户别无选择，只能依赖制造商的规格。此外，在为给定的应用程序选择正确的数据介质时，这些规范的实际相关性尚不清楚，因为获得的数字很大程度上取决于测试工作量。例如，Swissbit 480 GBP SSD 的测试得出 1360、912 或 140 TBW 的使用寿命，具体取决于所使用的测量方法。最显着的结果是通过测量顺序写入来实现的。第二个值（912）由客户工作负载产生，而第三个值（140）来自企业工作负载。两种负载测试均构成 JEDEC 标准。客户端工作负载基于计算机用户的行为，并且主要生成顺序访问。另一方面，企业工作负载模拟多用户环境中服务器的性能，生成高达 80% 的随机访问。

虽然理论上这些标准应该允许可比性，但问题是许多制造商根本没有指明底层工作负载，而是将他们的产品信息基于顺序写入值。而且，如示例所示，后者对于企业工作负载可能相差十倍，因此在涉及显着且未明确指定的高耐久性值时需要格外小心。

写放大系数（WAF）降低

逻辑到物理映射系统、ECC 和称为垃圾收集的清除块的过程都是理解和排序闪存功能和性能的相关机制。该领域的一个关键术语是写入放大系数或 WAF，它是来自主机的用户数据与写入闪存设备的实际数据量之间的比率。降低 WAF（闪存控制器效率的一项指标）是提高 SSD 耐用性的关键。影响 WAF 的工作负载因素包括顺序访问和顺序访问以及随机访问之间的差异，或者数据块大小相对于页面和块大小的差异。必须满足两个基本条件：页面需要一个接一个地写入，块需要作为一个整体删除。在标准过程中，逻辑地址和物理地址之间的映射关系到块。这对于顺序数据非常有效，因为给定块的页面可以顺序写入。这种机制的一个例子是连续积累的视频数据。然而，对于随机数据，页面被写入许多不同的块中，因此页面的每次内部覆盖都需要删除整个块。这会导致更高的 WAF 和缩短的使用寿命。因此，基于页面的映射更适合非顺序数据。换句话说，固件确保来自不同来源的数据可以顺序写入单个块的页面。这减少了删除的数量，从而延长了生命周期并提高了写入性能。

驱动器

【图2 | 对比测试：与常规产品相比，F-60 durabit 更耐用，WAF 更低。这是通过 DRAM 中的 FTL 和更大的过度配置来实现的。］

增加 WAF 的另一个因素是内存使用量。存储在闪存设备上的数据越多，固件需要从一个地方移动到另一个地方的比特就越多。基于页面的映射在这里也很有利。制造商还有另一种称为过度配置的调整机制（即，闪存设备的空间仅保留用于后台活动）可供他们使用。SSD 的 7%（千兆字节数字的二进制和十进制值之间的差异）通常用于此目的。但是为过度配置保留 12% 而不是 7% 是非常有效的。例如，从 MLC NAND 芯片派生的两个相同 SSD 的耐久性比较（即企业工作负载的 TBW）表明，60 GB Swissbit F-60 durabit 达到了 6。价值比同一公司的 64 位 F-50 设备高 6 倍。事实上，240 GB 和 265 GB 版本的价值高出 10 倍。

结论和要问的九个关键问题

SLC 闪存器件在许多方面都是工业应用以及断电保护的最可靠的解决方案。然而，在许多情况下，高端 MLC 闪存介质同样适用于此类用途。除了机械性能达到军用标准外，在寻找 SSD 解决方案时，还应特别注意制造商在减少 WAF 和通过固件延长产品寿命方面付出的努力。发挥作用的其他因素是“数据维护管理”措施，以更好地保留，不要忘记经过精心挑选的模块的长期可用性，以适应给定的应用程序。

应用要求决定了您在选择 SSD 时需要特别注意哪些因素。根据要求，Swissbit 为其客户提供 Lifetime Monitor，这是一种通过分析读取和写入来计算给定 SSD 耐用性的工具。如前所述，即使价格不是决定性因素，了解您是否真的需要贵 8 倍的 SSD 或 MLC 是否足以满足您的目的也很有用。

为工业应用选择闪存器件时要问的关键问题：

我对振动、阻力和温度范围有特定的物理要求吗？–工业闪存设备应通过应用适当的鉴定程序，能够证明高质量的材料特性和良好的生产和加工。

内存是否长时间暴露在高温下？–因为高温会更快地削弱cell的可读性，所以应该选择具有数据保护功能的产品，定期刷新数据。

是否打算在数据载体上长期写入和存储大量数据？–如果是，则应选择 SLC 产品。

应用程序是否主要需要读取访问权限？–如果是，则应选择具有数据护理功能的产品，该产品会定期刷新数据。

应用程序是否主要需要写入功能？–然后具有基于块的映射的产品适用于顺序写入功能。对于随机请求，应选择具有基于页面映射的产品。

内存容量是否被充分利用？–对于密集使用的应用程序，控制器需要内部操作空间，并且过度配置可以延长耐用性。

提供商为 TBW 或 DWPD 指定了哪些工作负载？–数据载体的比较只能通过工作量基准的指示来实现。

是否需要更高级别的数据丢失保护？–对于特别关键的应用，数据维护管理和电源故障保护是必不可少的。

几年后，该介质是否仍然可用？–制造商应保证长期可用性，以便无需重新认证即可更换内存存储。

审核编辑：郭婷

打开APP阅读更多精彩内容