服务器数据恢复—EMC存储raid5故障的数据恢复案例

电子说

1.3w人已加入

描述

服务器存储数据恢复环境:
EMC某型号存储,8块组建一组raid5磁盘阵列。上层操作系统采用zfs文件系统。

服务器存储故障&分析:
raid5阵列中有2块硬盘未知原因离线,raid5阵列崩溃,上层应用无法正常使用。

服务器数据恢复过程:
1、将故障服务器存储内的所有硬盘编号后取出,由硬件工程师检测所有磁盘是否存在硬件故障,经过检测没有发现有硬盘(包括两块掉线硬盘)存在物理故障。将所有磁盘以只读方式进行扇区级别的全盘镜像,镜像完成后将所有磁盘按照编号还原到原存储中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析底层数据,通过计算获取服务器raid5阵列的硬盘盘序、raid条带大小和其他raid阵列相关信息,利用获取到的raid相关信息重组raid5阵列。
3、由于该型号EMC存储中LUN是基于RAID的。raid5阵列重组出来后,北亚企安数据恢复工程师分析LUN在RAID阵列中的分配信息&LUN分配的数据块MAP。因为底层只有一个LUN,所以只需要分析一份LUN的信息即可。
4、根据分析出的LUN信息,使用北亚企安自主研发的程序解释LUN的数据MAP&导出LUN的所有数据。
5、对导出的lun进行文件系统解释,但是在文件系统解释过程中报错。分析报错内容并对文件系统解释程序进行调试,经过分析确认导致zfs文件系统解释过程中报错的原因是该存储中某些元文件损坏。北亚企安数据恢复工程师手动修复这些损坏的文件,直到可以完全正常解析zfs文件系统。
6、完成zfs文件系统的修复和解析后,验证恢复出来的数据没有发现问题。让用户方工程师对恢复出来的数据进行验证,经过反复验证,用户方工程师确认恢复数据完整有效。本次数据恢复工作完成。

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分