三级单元(TLC)、多级单元(MLC)、单级单元(SLC)、伪单级单元(pSLC)——闪存技术有很多种。开发者需要了解存储的基本机制和存储层面的作用,才能知道哪些闪存产品最适合特定的应用。只有这样,他们才会知道要向供应商提出什么问题。
应用程序的不同方面可以决定嵌入式工业系统内存模块的选择。这些包括读写速度、耐久性(或闪存介质的寿命)、保留(存储数据的寿命)、电源故障时的数据安全性、温度和抗振性、产品的长期可用性等。 NAND 芯片的老化是一种闪存特有的效应,在决策过程中也起着重要作用。
NAND 闪存设备的单元只能在有限数量的块擦除周期中存活。在分隔存储栅极的氧化层中,具有更高能级的电子(热电子)在被编程电压加速后被捕获。在适当的时候,这会改变阈值电压,直到单元不再可读(图 1)。
图 1.老化电池:电子聚集在隧道氧化层中,逐渐改变阈值电压值。隧道氧化物中的裂缝会产生泄漏电流路径,从而使电荷泄漏。读取错误会增加,直到整个块被拒绝为“坏块”。
闪存老化——什么时候结束?
还有第二种老化效应:通过氧化层形成导电路径。这导致单元逐渐失去其充电状态,从而失去存储位。
高温大大放大了这种影响。使用 25 nm MLC NAND 设备的研究表明,在 55 °C 下五年后,保留率下降到大约 75%。在 85 °C(相对温和的增长)下,保留率下降到 10% 以下。
此外,随着时间的推移,随着单元越来越接近其最大编程擦除周期(P/E 周期),这种影响会变得更强。这里对保留的影响是巨大的。例如,低成本 MLC NAND 闪存设备的原始保留容量为 10 年,在达到 3,000 个 P/E 周期后,可能会降至大约一年。
同样,低成本 TLC NAND 闪存芯片的充电状态和阈值电压挑战需要八种不同的可区分电荷水平才能写入每个单元的三位。在这些设计中,退化效应更加明显,原始保留时间表仅在 500 个 P/E 周期后从一年下降到三个月。
虽然更昂贵的 SLC 设备会经历相同的退化,但在这些影响发生之前必须发生大约 100,000 次 P/E 循环。显着更高的 P/E 循环容差是 SLC 尽管成本较高但仍然是工业应用首选闪存技术的一个重要原因。
成本妥协:pSLC
引入 pSLC 工艺是为了平衡成本与实现不同电荷水平数量的减少使 NAND 芯片上的数据存储更加稳健的认识。与 SLC 相比,pSLC 为每个单元的第一个“强”位使用了更具成本效益的 MLC 芯片,并取得了一些惊人的结果。pSLC 模式明显快于 MLC 闪存的标准工艺,并将退化前的 P/E 周期数从 3,000 增加到 20,000。在相同条件下,数据耐用性提高了 6.7 倍,而每位存储的成本仅为两倍(图 2)
图 2. SLC、pSLC 和 MLC NAND 闪存技术的耐用性比较。
耐力规格注意事项:工作量是决定性的
开发人员在选择存储设备时需要准确了解制造商的规格代表什么。两项测量特别表明了 SSD 的耐用性:TB 写入 (TBW) 和驱动器每天写入 (DWPD)。TBW 表示在设备的生命周期内总共可以写入多少数据,而 DWPD 表示在保修期内每天可以写入的最大数据量。
有时详尽的制造商规范面临的挑战是开发人员无法确定它们是否对相关应用程序有任何意义。规格值在很大程度上取决于测试期间的工作负载类型。例如,Swissbit 的 480 GB SSD 显示出 1,360 TBW、912 TBW 和 140 TBW 的耐久性,具体取决于测量程序。顺序写入产生了 1,360 TBW 的最强值,而“客户端工作负载”和“企业工作负载”分别占第二和第三个值。客户端工作负载基于主要生成顺序数据访问操作的 PC 用户的行为,而企业工作负载模拟多用户服务器环境的行为,其中 80% 的数据是随机访问的。
此类耐久性测试基于 JEDEC 标准化组织制定的指南,有助于确保产品和制造商的可比性。然而,工作负载规格通常不包含在数据表中。许多制造商乐于宣传基于仅在少数应用中使用的顺序写入的惊人耐用值。如上例所示,对于顺序写入和企业工作负载,闪存解决方案的耐用性值很容易相差 10 倍。买家必须谨慎行事。
压力闪存
擦除加速了存储单元的老化;但是,为了写入,需要块擦除。这可能会导致一个欺骗性的结论,即在纯读取应用程序中,如引导介质,由于数据保留时间延长,数据在长期内是安全的。不幸的是,这是一种误解。还有其他情况会导致读取错误并间接导致 NAND 单元的磨损。
在每次写入过程中,与正在编程的单元相邻的单元都受到压力。这些显示略微增加的电压,称为“程序干扰”。阅读会导致压力以及“阅读干扰”,其中相邻页面会收集电压。随着时间的推移,这些细胞中储存的电势会增加。这会导致读取错误,在删除块后,读取错误会再次消失。由于电压较低,读取的效果比写入的效果要弱,但仍然会发生位错误。这些通过删除块在纠错码 (ECC) 中得到补偿。
但是,开发人员仍然必须考虑到,在重复读取相同数据的应用程序中效果特别强,这意味着即使在仅用于读取的存储介质中,也必须删除块并定期写入页面作为错误的一部分更正。结果,这个媒介也变老了。
内部担忧
这种中等老化导致闪存设备的“内部问题”。擦除、写入和读取不仅由实际应用程序触发,还由众多控制器和固件进程触发。这里发生的事情经常被忽视,但会再次影响速度和耐力等性能因素。
除了纠错之外,这些内部机制中的另一个是磨损均衡。当一个单元发生故障时,必须将完整的块标记为“坏块”。出于持久性目的,如果可能,延迟此故障非常重要。这可以使用磨损均衡来实现,磨损均衡是物理内存地址使用的均匀分布。另一种内部机制是垃圾收集,即释放块的重新复制。
这些过程首先补充了使数据存储成为可能的机制:逻辑地址和物理地址之间的映射。闪存介质控制器的效率是通过来自主机的用户数据与写入闪存的实际数据值之间的比率来衡量的。这使用写放大因子 (WAF) 来表示。
减少WAF是更长续航的关键之一。有一些工作量因素会影响 WAF,例如顺序访问和随机访问之间的差异、与页面相关的数据块大小以及块大小本身。因此,固件还确定闪存介质是否适合应用程序。
制造商如何提高效率
为了更好地理解,下面是另一种关于闪存工作原理的论述。单元块的页面必须连续编程,但只能删除完整的块。在标准过程中,逻辑地址和物理地址之间的映射是指块。这对于顺序数据非常有效,因为一个块的页面是连续写入的。连续收集的视频数据是理想的基于块分配的应用示例之一。
这对于随机数据是不同的。在这里,页面被写入许多不同的块中。这意味着对于每次内部重新编程,每页都必须删除一个完整的块。因此,WAF 高,耐久性降低。因此,基于页面的映射更适合非顺序数据。在这里,固件确保不同来源的数据按顺序保存在一个块的页面上。这减少了删除的数量——对耐用性有积极的影响——并提高了写入性能。然而,基于页面的映射增加了闪存转换层(FTL)的分配表。制造商通过集成 DRAM 来弥补这一点。因此,基于页面的映射的好处并非没有结果。
丰富的过度配置作为质量特征
如果数据介质的使用程度迫使 WAF 上升,则基于页面的映射也是有益的。闪存介质上存储的数据越多,固件必须来回移动的位就越多。制造商可以通过简单的过度配置来防止数据介质过载的问题。这是指仅为内部活动保留的闪存区域。按照惯例,这占总面积的 7%,按照千兆字节规范,十进制和二进制值之间存在差异。
如果预留 12% 而不是 7% 用于过度配置,则会产生令人惊讶的效果。对于具有相同硬件的两个 SSD 的耐久性比较(企业工作负载的 TBW),240 GB Swissbit 型号 X-60 durabit 其 12% 的区域保留用于过度配置,其值几乎是 256 GB 型号的两倍。 如果再看一下 DRAM 对耐用性的影响,240 GB durabit 版本的差异是 256 GB 标准版本的 10 倍(注:正如使用 MLC 作为 pSLC 时已经实现的那样,显着的积极耐用性效果可以通过上述内存容量或通过应用过度配置来达到)。
数据维护
纠错和磨损均衡是通用闪存产品中也使用的机制。对于高质量的工业 SDD 或闪存卡,制造商会进一步努力防止数据丢失和系统故障。因此,ECC监控、读取干扰管理和自动读取刷新等不同机制的组合确保了所有存储的数据都得到监控和按需刷新。这允许提前防止系统故障。(注意:应在不涉及主机应用程序的情况下确保数据完整性。这允许进程在存储卡内自主运行——不仅仅是在主机应用程序的读取请求之后出现累积位错误时,通常情况下)。
因此,高级数据护理管理搜索独立于应用程序对潜在错误的请求(图 3)。为此,所有写入的页面,包括固件和 FTL 的分配表,都在后台读取并根据需要刷新。这种预防性纠错有多种触发因素,包括定义的重复开关次数、P/E 周期数、读取数据量、读取重复/重新读取以及温度升高。
图 3.数据护理管理可抵消逐渐丢失的数据。因此,所有写入的块都在后台读取,并且在复制、修复和重写太多位错误的情况下。
知道选择什么
了解闪存技术的不同方面是选择最适合工业应用的存储解决方案的关键。当然,还应考虑电源故障保护机制、特别稳健的处理以及扩展温度范围的规范等标准 。
为特定应用指定的模块的长期可用性也很重要。这就是为什么一种闪存——3D NAND——在这里根本没有出现的原因。这项技术仍然太新,无法确保长期可用性,而且创新周期和设计变更对于工业产品生命周期来说仍然过于临时。
最终,这些 NAND 闪存设备的耐用性和数据保留经验值在选择工业存储技术时至关重要。优化这些值是工业闪存产品制造商的一项关键任务,客户应在购买前按这些数字。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !