公司的服务器两块硬盘做的RAID1,每逢节假日移动硬盘备份数据。数据主要是一个ERP系统,或者说基本上就是一个邮件系统;一个外贸制单软件,图纸文件,再就是每个用户的个人文件(存在服务器端的,因为服务器做了卷影副本,可以方便的回退、恢复)。卷影副本,双硬盘RAID1,再加上移动硬盘备份,算是比较安全了,然而事情总有意外。周五早晨,服务器突然就蓝屏了,尝试了各种重启、安全模式、都是进到server2008的引导界面马上蓝屏。用光盘和u盘引导,试图重装,根本就读不到硬盘,加载了以前备份的RAID驱动程序,包括dell工程师发的驱动程序,都读不到硬盘。从命令行引导模式启动,发现是到了storport.sys就蓝屏。问题可能出在硬盘本身。 重启进入RAID设置,发现其中一块硬盘不在线(ready)状态,只有一块online。事后明白了,其中一块早已经坏了。RAID1的优点和缺点就在这里,两块硬盘互为备份,其中一块坏了,另一块还可以正常工作,坏的直接换掉即可。缺点就是,像我们这种对服务器一知半解,只要正常运行就不关注的,根本就不会知道其中一块已经坏了。后来知道了,坏的已经坏了两年了,你感受一下。当然你也可以想象一下独力支撑两年多、刚刚累半死的另一块硬盘的碎碎念。
拆掉一块试着重新启动,没有反应;只插另一块,还是加载到storport.sys就蓝屏。问题就很清楚了,一块全坏,一块半坏,只能拆下硬盘去信息城找数据恢复公司。
数据恢复公司的人有点像医生,先给你说情况的严重性,然后告诉你这个数据恢复基本上是砸钱,因为要用同规格的硬盘比对读取(这个说法不准确,但我不懂也没必要研究,大概意思);如果一块不行就要第二块。按照常理来说,昨天还好好运行的硬盘,恢复难度应该不太大,再说毕竟还有半个月前的备份。所以我心态也相对轻松,也不担心数据恢复出来对方坐地起价。报了价也没太多纠结,考虑到差两周的数据量对应的工作量,也是值得的。一共等了三天,这其中一半时间是等外地寄过来的同规格硬盘。
其中一块硬盘完全坏了,而且是2015年就坏了。所以想起来16年帮我重装系统的高手弟弟还有点小郁闷,高手有时候也会错过细节的。
另外一块的数据完全恢复了,因为数据量虽然不小,但文件夹设置的比较明了,用freefilesync镜像同步一下,可以很明确的看到过去两周的增量文件。所以恢复起来就很快了。最担心的外贸制单软件,反倒是最顺利的,可能是因为基本是纯粹的数据,数据库一共2G左右,很快就安装导入,数据都是最新的,没有丢失。反倒是不是很担心的邮件系统,近百G的数据量,导入虽然很顺利,但是系统启动以后服务不断的自动关闭,数据库需要重做,就在写这篇日志的时候,软件开发人员正在远程调整。
最终这次数据灾难还是恢复了,教训和结论如下:
1. 成败都在RAID1,要经常查看硬盘的状态,有问题及早更换。
2. 主数据盘以外,必须增加备份盘,设置自动备份。手动备份的频率肯定不行。
3. SERVER2008一旦卡在storport.sys,肯定是硬盘出问题了,别再浪费时间,找数据恢复公司。
作为一个外行,我每次处理这些问题,解决问题靠的是一般的常识、逻辑推理,外加咨询人士和搜索。网上搜的时候,往往是解决类似问题的文章里的一个细节或者一个关键词让人茅塞顿开,所以我就把这个过程写下来,希望能够帮到遇到类似的问题的人,特别像我一样冒充电工的机械工。
《数据灾难恢复记》留言数:0