RAID5硬盘存在大量坏道离线的数据恢复案例

电子说

1.3w人已加入

描述

服务器数据恢复环境:

服务器+10个磁盘柜,每个磁盘柜24块磁盘;

9个磁盘柜的磁盘用来存储数据,另外1个磁盘柜用来存储元数据;

存储元数据的24块磁盘的组成结构:9组RAID1磁盘阵列+1组4盘位的RAID10磁盘阵列+4个全局热备盘;

存储数据的9×24=216块磁盘的组成结构:36组6盘RAID5阵列;36组RAID5磁盘阵列分为2个存储系统。

服务器数据恢复环境架构:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

注:Meta_LUN(元数据卷) Data_LUN(用户数据卷)

服务器故障:

存储数据的其中一个存储系统中一组RAID5阵列由于2块磁盘先后故障离线,该RAID5阵列失效,导致整个存储系统崩溃,无法使用。

服务器数据恢复过程:

1、将故障RAID5阵列中的6块成员盘编号标记,从磁盘柜中取出并接入到北亚企安数据备份服务器上,以只读方式对所有硬盘进行全盘镜像备份,后续的数据分析和数据恢复操作都基于镜像文件进行,避免服务器数据恢复过程中误操作对原始数据造成二次破坏。

备份过程:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

在备份过程中发现故障RAID5阵列中的1块离线硬盘存在大量的坏道,无法继续备份。由硬件工程师对该故障盘开盘&更换固件并进行修复,经过处理后硬盘可以继续备份,但坏道仍然存在。

部分镜像文件:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

2、基于镜像文件对故障RAID5阵列进行分析,获取RAID相关信息,利用这些信息虚拟重组RAID5阵列,将RAID中的LUN恢复成镜像文件。经过分析发现后离线硬盘损坏较为严重,存在大量坏道。

登录存储设备的管理界面,获取到StorNext文件系统中和卷相关的一些基本信息。

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

3、分析StorNext文件系统中的Meta卷和Data卷,发现该StorNext文件系统包含2个Data卷,每一个完整的Data卷都是由多组RAID中的LUN组成。通过分析这些LUN北亚企安数据恢复工程师研究出LUN之间组合的算法规律,虚拟重组出完整的Data卷。

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

4、分析Meta卷中的节点信息,目录项信息以及Meta卷和Data之间的对应关系。针对一个Meta卷管理多个Data卷的情况,北亚企安数据恢复工程师研究出Meta卷到Data卷的索引算法。

文件节点:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

目录块:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

5、通过上面通过分析研究获取到的全部信息,北亚企安数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,解析目录项和节点并获取完整的StorNext文件系统目录结构。解析每一个节点中的指针信息,并将这些信息记录在数据库中。

文件信息:

磁盘

北亚企安数据恢复——StorNext文件系统数据恢复

6、北亚企安数据恢复工程师编写文件提取程序读取数据库,结合解析出的信息以及两个Data卷之间的聚合算法提取数据。

数据验证:

随机抽样检测恢复出来的数据,没有发现。将数据移交给用户亲自验证,经过验证用户确认恢复数据完整可用。虽然故障硬盘存在大量坏道,所幸核心数据没有破坏,本次数据恢复工作完成。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分