如何选择RAID磁盘阵列

电子说

1.3w人已加入

描述

介绍

RAID(Redundant Array of Independent Disks)是将多块物理硬盘通过RAID控制卡组合成虚拟的单块大容量硬盘使用,从而提供比单个硬盘更高的存储性能、更高的I/O性能及可靠性。

磁盘阵列(Redundant Arrays of Independent Disks,RAID)是一种用多个独立的磁盘组成一个大的磁盘系统,从而实现比单块磁盘更好的存储性能和更高的可靠性的技术。磁盘阵列有不同的类型,如RAID 0、RAID 1、RAID 5、RAID 6、RAID 10等,它们各有各的优缺点和适用场景。如果你想在电脑上组成磁盘阵列,你需要有相应的硬件或软件支持。你可以使用RAID卡或者操作系统提供的工具来创建和管理磁盘阵列。具体的操作步骤和方法可能根据你的硬件和软件配置而有所不同,你可以参考一些教程或者咨询专业人士来进行设置。

如何选择磁盘阵列

选择磁盘阵列类型的时候,你需要考虑你的需求和预算。不同类型的磁盘阵列有不同的特点和优缺点,主要涉及到以下几个方面:

存储容量:磁盘阵列的总容量取决于你使用的磁盘数量和大小,以及你选择的阵列模式。一般来说,RAID 0可以提供最大的存储容量,因为它没有冗余数据,但也最不安全。RAID 1可以提供最小的存储容量,因为它需要镜像所有的数据,但也最安全。RAID 5和RAID 6可以提供中等的存储容量,因为它们需要一定比例的磁盘空间来存储校验信息,但也可以提供一定程度的容错能力。RAID 10可以提供高于RAID 1但低于RAID 0的存储容量,因为它是RAID 0和RAID 1的组合。

性能:磁盘阵列的性能主要取决于你使用的磁盘速度和接口,以及你选择的阵列模式。一般来说,RAID 0可以提供最高的性能,因为它可以利用多个磁盘并行读写数据,但也最不稳定。RAID 1可以提供较低的性能,因为它需要同步写入两份数据,但也最稳定。RAID 5和RAID 6可以提供中等的性能,因为它们需要计算和写入校验信息,但也可以提高数据可靠性。RAID 10可以提供高于RAID 1但低于RAID 0的性能,因为它是RAID 0和RAID 1的组合。

可靠性:磁盘阵列的可靠性主要取决于你使用的磁盘质量和寿命,以及你选择的阵列模式。一般来说,RAID 0没有任何可靠性,因为它没有冗余数据,一旦有一个磁盘故障,就会导致整个阵列失效。RAID 1有最高的可靠性,因为它有完整的数据备份,即使有一个磁盘故障,也不会影响数据完整性。RAID 5和RAID 6有中等的可靠性,因为它们有校验信息,可以在有一个或两个磁盘故障时恢复数据,但如果超过这个限制,就会导致数据丢失。RAID 10有高于RAID 5和RAID 6但低于RAID 1的可靠性,因为它是RAID 0和RAID 1的组合。

综上所述,你应该根据你对存储容量、性能和可靠性的权衡来选择合适的磁盘阵列类型。一般来说:

如果你只追求最大的存储容量和最高的性能,并且不在乎数据安全性或者有其他备份方案,你可以选择RAID 0。

如果你只追求最高的数据安全性,并且不在乎存储容量或者性能损失,你可以选择RAID 1。

如果你想要平衡存储容量、性能和可靠性,并且可以接受一定程度的损失或者风险,你可以选择RAID 5或者RAID 6。

如果你想要同时享受较高的存储容量、性能和可靠性,并且可以承担较高的成本或者复杂度,你可以选择RAID 10。

0 2 n n 将数据分成块,平均分配到多个磁盘上,提高读写性能,但没有冗余数据,无法容错。
1 2 n/2 n 将数据完全复制到两个或更多的磁盘上,提高数据安全性,但降低存储容量和写入性能。
5 3 n-1 n-1 将数据和校验信息分成块,分散到多个磁盘上,提高存储效率和读取性能,可以容忍一个磁盘故障,但写入性能较低。
6 4 n-2 n -2 类似于RAID 5,但使用两个不同的校验信息,提高数据可靠性,可以容忍两个磁盘故障,但写入性能更低。
10 4 n/2 n/2 将多个RAID 1组合成一个RAID 0,提高存储容量、性能和可靠性,可以容忍多个磁盘故障(但不超过每个子阵列的一半),但成本和复杂度较高。
RAID级别 最少硬盘 可用容量 读写性能 安全性 特点

RAID0

RAID 0是一种使用条带技术(striping)的磁盘阵列类型,它将数据分为多份,平均分配到两块或以上的磁盘上,不包含任何冗余或校验信息12。RAID 0 的目的是提高磁盘的读写性能和吞吐量,因为数据可以同时或顺序地从多个磁盘读取或写入。

RAID 0 的优点是:

性能高:RAID 0 的读写性能理论上是单块磁盘的 n 倍(n 是磁盘数量),因为数据可以并行地访问多个磁盘。

空间利用率高:RAID 0 的存储空间利用率是100%,因为没有冗余或校验信息占用空间。

RAID 0 的缺点是:

可靠性低:RAID 0 不提供任何数据保护或容错能力,如果任何一块磁盘损坏,整个阵列将失效,导致全部数据丢失。

容量受限:RAID 0 的容量受限于最小的磁盘大小,如果使用不同大小的磁盘,那么多出来的空间将无法使用。

RAID 0 的适用场景是:

对性能要求高而对数据安全性要求低的场景,例如视频编辑、游戏、图像处理等。

对存储空间要求高而对数据安全性要求低的场景,例如临时文件、缓存文件、下载文件等。

如图所示,系统向三块硬盘组成的逻辑硬盘(RAID 0硬盘组)发出的I/O数据请求被转化为三项操作,其中的每一项操作都对应于一块物理硬盘。

通过建立RAID 0,原先顺序的数据请求被分散到所有的三块硬盘中同时执行。

三块硬盘的并行操作在理论上使同一时间内硬盘读写速度提升了3倍。虽然由于总线带宽等多种因素的影响,实际的提升速率会低于理论值,但是大量数据并行传输与串行传输比较,提速效果显著。

存储

RAID1

RAID 1是一种使用镜像技术(mirroring)的磁盘阵列类型,它将同一份数据无差别地写入两块或以上的磁盘,提供数据备份和冗余,提高数据的可靠性和可用性。RAID 1 的目的是提高磁盘的安全性和容错能力,因为任何一块磁盘损坏都可以用另一块磁盘恢复数据。

RAID 1 的优点是:

可靠性高:RAID 1 可以提供完整的数据冗余和错误修复能力,即使有一块或多块磁盘损坏,也不会影响数据的完整性和可访问性。

读取性能高:RAID 1 可以提高数据的读取性能,因为系统可以从多个磁盘并行地读取不同的数据段,类似于 RAID 0。

RAID 1 的缺点是:

存储空间利用率低:RAID 1 的存储空间利用率只有50%,因为每份数据都要在两块或以上的磁盘上重复存储。

写入性能低:RAID 1 的写入性能受限于最慢的磁盘,因为每次写入都要在所有的磁盘上同步进行。

RAID 1 的适用场景是:

对数据安全性要求高而对存储空间利用率要求低的场景,例如数据库、日志、备份等。

对读取性能要求高而对写入性能要求低的场景,例如文件服务器、邮件服务器、Web服务器等。

如图所示,系统向两块硬盘组成的逻辑硬盘(RAID 1硬盘组)发出I/O数据请求。

向硬盘Drive 0写入数据时,系统会同时把用户写入Drive 0的数据自动复制到Drive 1上。读取数据时,系统同时从Drive 0和Drive 1读取。

RAID5

RAID 5是一种使用条带和分布式奇偶校验技术(striping and distributed parity)的磁盘阵列类型,它将数据和校验信息分布到三块或以上的磁盘上,提供存储性能、数据安全和存储成本的平衡,提高数据的可靠性和可用性。RAID 5 的目的是提高磁盘的容错能力,因为它可以容忍最多损坏一块磁盘,而不影响数据的完整性和可访问性。

RAID 5 的优点是:

性能高:RAID 5 可以提高数据的读写性能,因为系统可以从多个磁盘并行地读写不同的数据段,类似于 RAID 0。

安全高:RAID 5 可以提供数据的冗余和错误修复能力,即使有一块磁盘损坏,也不会影响数据的完整性和可访问性。

成本低:RAID 5 的存储空间利用率较高,一般为 n-1/n(n 是磁盘数量),因为只有一份校验信息占用空间。

RAID 5 的缺点是:

可靠性低:RAID 5 只能容忍最多损坏一块磁盘,如果有两块或以上的磁盘损坏,整个阵列将失效,导致全部数据丢失。

写入性能低:RAID 5 的写入性能受限于校验信息计算和写入的开销,因为每次写入都要在所有的磁盘上同步进行校验信息的计算和写入。

RAID 5 的适用场景是:

对存储性能、数据安全和存储成本要求平衡的场景,例如数据库、日志、备份等。

如图所示,PA为A0、A1和A2的奇偶校验信息,PB为B0、B1和B2 的奇偶校验信息,以此类推。

RAID 5不对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到成员盘上,并且奇偶校验信息和相对应的数据分别存储于不同的硬盘上。当RAID 5的一个硬盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息可以恢复被损坏的数据。

RAID 5可以理解为是RAID 0和RAID 1的折衷方案:

RAID 5可以为系统提供数据安全保障,但保障程度要比RAID 1低而硬盘空间利用率要比RAID 1高,存储成本相对较低。RAID 5具有较RAID 0略低的数据读写速度,但写性能比写入单个硬盘时要高。

存储

RAID6

‍       RAID 6是一种使用条带和双重校验技术(striping and dual parity)的磁盘阵列类型,它将数据和两种不同的校验信息分布到四块或以上的磁盘上,提供更高的数据冗余性和容错能力,提高数据的安全性和可用性。RAID 6 的目的是提高磁盘的容灾能力,因为它可以容忍最多同时损坏两块磁盘,而不影响数据的完整性和可访问性。

RAID 6 的优点是:

可靠性高:RAID 6 可以提供更强的数据冗余和错误修复能力,即使有两块或多块磁盘损坏,也不会影响数据的完整性和可访问性。

读取性能高:RAID 6 可以提高数据的读取性能,因为系统可以从多个磁盘并行地读取不同的数据段,类似于 RAID 0。

RAID 6 的缺点是:

存储空间利用率低:RAID 6 的存储空间利用率受限于校验信息占用的空间,一般为 n-2/n(n 是磁盘数量),因为每份数据都要在两块或以上的磁盘上重复存储校验信息。

写入性能低:RAID 6 的写入性能受限于校验信息计算和写入的开销,因为每次写入都要在所有的磁盘上同步进行校验信息的计算和写入。

RAID 6 的适用场景是:

对数据安全性要求高而对存储空间利用率要求低的场景,例如数据库、日志、备份等。

对读取性能要求高而对写入性能要求低的场景,例如文件服务器、邮件服务器、Web服务器等。

如图所示,PA为数据块A0、A1、A2的第一个校验信息块,QA为第二个校验信息块;PB为数据块B0、B1、B2 的第一个校验信息框,QB为第二个校验信息块,以此类推。

数据块和校验块一起分散存储到RAID 6的各个成员盘上。当任意一个或两个成员硬盘出现故障时,控制卡可以从其他处于正常状态的硬盘上重新恢复或生成丢失的数据而不影响数据的可用性。

存储

RAID10

RAID 10是一种使用镜像和条带技术(mirroring and striping)的磁盘阵列类型,它将四块或以上的磁盘分为镜像对,再对每个镜像对进行条带化,兼备了 RAID 1 和 RAID 0 的优点,提高数据的可靠性和性能。RAID 10 的目的是提高磁盘的安全性和吞吐量,因为它可以容忍每个镜像对中的一块磁盘损坏,而不影响数据的完整性和可访问性。

RAID 10 的优点是:

可靠性高:RAID 10 可以提供完整的数据冗余和错误修复能力,即使有一块或多块磁盘损坏,也不会影响数据的完整性和可访问性。

性能高:RAID 10 可以提高数据的读写性能,因为系统可以从多个磁盘并行地读写不同的数据段,类似于 RAID 0。

RAID 10 的缺点是:

存储空间利用率低:RAID 10 的存储空间利用率只有50%,因为每份数据都要在两块或以上的磁盘上重复存储。

成本高:RAID 10 需要至少四块磁盘才能实现,且每增加一对磁盘就需要增加相应的成本。

RAID 10 的适用场景是:

对数据安全性要求高而不在乎存储空间利用率的场景,例如数据库、日志、备份等。

对读写性能要求高而不在乎成本的场景,例如视频编辑、游戏、图像处理等。

如图所示,Drive 0和Drive 1组成一个子组0,Drive 2和Drive 3组成一个子组1,子组内的两个硬盘互为镜像。

系统向硬盘发出I/O数据请求时,原先顺序的数据请求按照RAID 0的方式,被分散到两个子组中并行执行,同时通过RAID 1的方式,系统在向硬盘Drive 0写入数据的同时把数据自动复制到硬盘Drive 1上,向硬盘Drive 2写入数据的同时把数据自动复制到硬盘Drive 3上。

存储

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分