存储技术
在SNIA存储开发人员会议的第一天,存储网络行业协会(SNIA)存储管理倡议(SMI)宣布完成SNIA箭鱼存储管理规范的1.0版。警告,首字母缩写风暴来临。
Swordfish存储管理规范扩展了分布式管理任务组(DMTF)红鱼应用程序编程接口(API),因此它可以管理存储设备的类型,并提供在现代数据中心找到的存储服务。SNIA Swordfish规范有助于为管理超大规模和云基础设施环境中的存储和服务器提供统一的方法,API提供了简化存储分配、监视和管理方式的功能。
由SNIA可伸缩存储管理技术工作组定义,SNIA箭鱼规范是涉及存储行业的领先公司的广泛行业协作的结果。据估计,今年发货的所有字节中有一半是超量程存储。超大规模存储的一个特殊问题是所谓的尾部延迟,这个话题是由东芝的Mark Carlson提出的。在任何大规模的存储设备,如SSD或HDD,将有一个性能的变化。最慢的设备(无论什么原因)都能影响整个系统的性能。
有多种方法可以解决尾延迟。简单的补救方法是标记每个I/O,因此识别数据条可以允许存储设备快速故障并返回错误,而不是大量开销重试并试图纠正错误。此外,慢速驱动器可以被识别并标记为失败,因此它们不被使用。然后,软件定义的存储可以自动找到新的位置来复制故障驱动器上的数据和保护信息。然而,这些补救方法最终没有使用某些驱动器,增加了总拥有成本(TCO)。
为了更智能地进行修复,需要有一种方法来识别并跟踪慢速媒体位置,并将其重新映射到更快的区域。以这种方式实现相同的结果,但驱动器不报废只是因为有一个区域有问题。对于当前驱动器,这可以通过仅在真正的媒体故障(包括可重复的慢响应区域)上重新映射逻辑块地址(LBA)来实现。然后,当耗尽空闲媒体重新映射到该驱动器时,该驱动器可能失败。这些驱动器的有效平均故障时间(MTTF)可能存在折衷,我们可能需要跟踪由此产生的平均大小减少时间。
在驱动器标准体中,正在进行更改,以便能够从LBA地址空间中移除慢速物理存储元素。当这种情况发生时,主机然后执行导致驱动器上容量较低的操作,然后由软件定义存储软件填充新数据。这些更改将需要新的命令和日志。另一个有助于尾延迟的概念是流。流将多个块与文件或对象相关联。流中的所有块可能作为一个组被删除,因此了解流中的块可以减少垃圾收集并允许SSD将与流相关联的LBA合并为一个或多个写块。可以提高总体性能,减少写入放大。除了提高性能外,这也提高了器件的耐久性。各种SSD接口规范正在被修改以利用这一点。
尾部延迟还可以通过允许主机控制各种后台操作的调度来改进,从而最小化对I/O操作的影响。标准也在进行中,以实现这个主机控制。最终我们可能会选择开放通道SSD,其中单个驱动器没有完整的固件Flash翻译层(FTL)。在这种情况下,FTL在主机上运行,通过诸如NVME之类的接口进行通信。这种方法在超规模客户中很流行,以减少尾部潜伏期。
在存在多个数据副本的情况下,这可以用于改进驱动器重建,其中主机不会为驱动器重建而烦恼已知的坏块,而是直接转到数据的另一个副本。另一种方法是使用逻辑块标记(LBM)对每个I/O提示进行排序,该逻辑块标记可用于区分一个I/O与另一个I/O的优先级,以及LBA范围内后续读取的可能性。这些提示允许软件定义的存储区更好地管理工作负载。
甚至更高级的方法包括I/O确定性,其中主机可以控制写和读的顺序,以提高响应时间的可预测性。对于超缩放机来说,这很可能是通过一类新的存储供应商来完成的,这类供应商根据客户规格将最好的类商品存储设备打包成机架,并以比传统存储制造商低得多的利润率操作。这些用户经常利用来自开源的硬件和软件,比如开放计算项目(OCP)或者中国一个叫做Scopio的项目,这个组织叫做开放数据中心委员会(ODCC)。
随着云存储的兴起,管理超海量存储的推动将变得更加关键。SNA剑鱼存储管理规范将是这一进化过程中的一个重要元素。在存储设备中设计支持减少尾部延迟的新标准将解决这些大型存储系统的一些最大问题。
全部0条评论
快来发表一下你的评论吧 !