闪存企业如何应对存储面临的挑战?

描述

自全闪存阵列首次进入市场以来,IT专业人士就已经考虑仅闪存数据中心概念的内在可能性。这样的数据中心不仅可立即响应生产数据库,还会响应非结构化数据请求、归档召回甚至备份和恢复任务。这个想法很有吸引力,但是全闪存数据中心现实吗?

全闪存数据中心似乎合理,这里主要有几个原因。首先,在过去五年间,闪存企业存储价格下降。其次,数据缩减技术(例如重复数据删除和压缩)在闪存环境中运行良好,因为闪存过剩性能允许这些进程运行,而同时对用户和应用程序几乎没有明显影响。这样的结果是,典型的全闪存阵列可将数据效率提高三到五倍。

全闪存数据中心可能实现的第三个原因是,闪存驱动器和模块可提供前所未有的密度:常见的是16TB驱动器,而50TB及更高驱动器即将推出。对于面临占地面积问题的数据中心,闪存密度可节省数百万美元的数据中心建设成本。

对于闪存企业存储,其存在的最重要的理由也许是高性能。在很多数据中心,全闪存无需额外的性能调整。大多数全闪存阵列提供的性能超过典型数据中心的需求。

全闪存数据中心可能实现的第三个原因是,闪存驱动器和模块可提供前所未有的密度:常见的是16TB驱动器,而50TB及更高驱动器即将推出。对于面临占地面积问题的数据中心,闪存密度可节省数百万美元的数据中心建设成本。

对于闪存企业存储,其存在的最重要的理由也许是高性能。在很多数据中心,全闪存无需额外的性能调整。大多数全闪存阵列提供的性能超过典型数据中心的需求。

为什么全闪存不合理

尽管有这么多优点,但全闪存设计也有其缺点。虽然闪存成本降低以及数据效率技术增加,但与高容量HDD相比,闪存企业存储价格仍然很高。此外,虽然大多数全闪存阵列供应商可复制到次级站点,但它们必须复制到运行相同硬件的另一个类似系统。如果全闪存阵列供应商只提供全闪存系统,则意味着灾难恢复(DR)站点也是全闪存,并且它主要处于闲置状态等待灾难发生。

对于全闪存数据中心来说,最大的挑战可能是生产存储中多达80%的数据处于闲置状态,多年没有用户访问。在昂贵的存储系统中,保存冷数据和过期数据很难证明其存在的合理性。

应对全闪存挑战

鉴于闪存企业存储的价格仍然很高,因此必须解决上述两个核心问题才能使全闪存数据中心变得有意义。首先,企业需要提出一种可行的灾难恢复策略,该策略不需要灾难恢复站点的闪存系统。其次,必须解决主存储中大多数数据已过期且不再被访问的现实。

我们有多种方法来应对灾难恢复挑战。首先,第一种选项是与存储系统供应商合作,将数据复制到基于硬盘的灾难恢复系统。在大多数情况下,这些供应商(如戴尔EMC、日立Vantara、IBM和西部数据的Tegile)首先都是通过混合闪存阵列进入市场,后来才转向全闪存。他们通常使用相同的存储软件用于混合和全闪存,并可从全闪存主存储系统复制到混合次级存储系统。此配置可降低灾难恢复站点存储系统的成本,同时可在灾难发生时提供近闪存性能。

另一种方法是使用第三方软件来将数据复制到灾难恢复站点。大多数基于软件的灾难恢复产品(例如Zerto Virtual Replication和Carbonite的DoubleTake)可从任何存储系统复制到任何存储系统,因此,灾难恢复站点存储系统甚至可以是基于硬盘的。

有些复制软件还可在云端或者托管服务提供商处运行,从而创建出第三种方法,基于云的灾难恢复。这些应用程序可将数据复制到云端,这不仅可消除灾难恢复站点存储系统的需求,还可消除对灾难恢复站点本身对需求。因为其中一些复制产品可在云端启动关键应用程序的虚拟实例。

过期数据和混合系统

过期数据是指用户不再访问但企业希望或必须保留一段时间的数据。大多数企业无法轻松识别和管理这些数据,这些数据只是位于主存储中。如果主存储是全闪存阵列,那么,企业就是在浪费资金。

企业可通过多种方式解决这种过期数据问题。他们可采用混合阵列,当闪存存储填满时自动从闪存企业存储转移数据到硬盘存储。这类似于克服灾难恢复瓶颈的混合系统。

这种混合系统的问题是,当闪存错失时会有性能变量,并且,必须从硬盘层访问数据。在这两层之间会有性能下降,但问题是用户或应用程序会感受到吗?在大多数情况下,答案是否定的。但这种担忧是合理的,以至于很多数据中心决定转向全闪存系统用于主存储。

当从闪存层检索数据几乎与全闪存相同时,了解混合系统性能变得至关重要。这里的关键是利用较低成本的闪存存储来创建更大的闪存层。当混合系统首次进入市场时,闪存很昂贵,闪存层相对较小,通常占总容量的3%到5%。因此,闪存层错失的可能性相对较高。而现在闪存存储价格较低,企业可决定将闪存层提高到容量的25%到50%。这样还可降低闪存错失的可能性,同时,企业仍然可从更经济的基于硬盘的定价中受益。

第二种方法是结合专用于全闪存的存储系统和对象存储系统。转移较少访问的数据到基于用户定义策略的对象存储系统。企业可为不同数据集设置不同策略。例如,所有办公室生产文档可能会在访问90天后移动到对象存储,但图像可在主存储保留一年。对于对象存储系统,企业需要数据管理软件来识别和移动旧数据到对象存储系统。

这里有一个额外步骤是,选择应用程序来执行此识别和移动,这个步骤可为数据管理奠定良好的基础。这是部署闪存的最便宜的方法。从本质上来看,该数据库对于主存储是全闪存,而对于所有次级存储则是基于硬盘的对象存储。数据管理软件会减缓主存储的增长,以及减少对保护存储的投资。

完全是关于数据管理

全闪存数据中心是可能实现的,但我们很难忽视它带来的两个基本问题:部署灾难恢复站点的成本以及所有过期数据。如果企业愿意承担成本,则可将所有过期数据保留在全闪存。但是,灾难恢复问题不容忽视。如果在远程数据中心部署大多时候闲置的全闪存阵列,则完全是浪费钱。更现实的方法是创建一种策略,其中所有活跃和接近活跃的数据都在全闪存中。当用户一年不访问数据时,系统会自动将数据归档到硬盘驱动器。

对于上述两个问题,混合系统可帮助解决,它包含闪存企业存储,它可随着时间推移自动转移数据到硬盘存储。数据管理策略可解决过期数据问题并可简化灾难恢复问题。混合云战略也是一个有趣的替代方案,也是数据中心可实现全闪存状态的唯一方法。

至于哪种方法最有效,这主要取决于企业。大多数人都反对数据管理战略,他们认为很难维护。混合方法在一定程度上可自动化数据管理,对于大多数企业来说,这是比全闪存更现实的方法。

云选项

混合云架构可同时解决灾难恢复和全闪存数据中心过期数据问题的方法。通过这种方法,全闪存设备放在本地站点,而所有数据都复制到云端。

本地闪存设备基本上是缓存,它会缓存新的更新的数据写入,并缓存最近访问的数据读取。然后,它会尽快将所有数据复制到云端。当数据到云端,它会复制到供应商拥有的另一个数据中心。其中有些产品还提供将应用程序实例化作为云中虚拟机的功能。这种混合云选项的挑战是,内部数据副本和云端之间的延迟性相对较高,并且,任何缓存错失都会引人注意。

延迟问题本身是小问题。无论连接速度有多快,数据都需要一定时间才能到达云数据中心—这可能在数千英里之外。降低延迟性的一种方法是将数据缓存在几百英里外的中间数据中心;这本质上是多层跨桥云服务。

在这个设计中,数据中心会拥有一个全闪存设备,可存储新写入和修改的数据以及最常访问的数据。该区域云数据中心将存储该数据副本以及所有非活动数据。然后,该区域云数据中心会将数据复制到公共云提供商以用于灾难恢复目的。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分