POPPUR爱换
标题:
adaptec的31605的奇怪故障。有哪位达人知道怎么回事么?
[打印本页]
作者:
hcgxp
时间:
2010-2-17 20:25
标题:
adaptec的31605的奇怪故障。有哪位达人知道怎么回事么?
机器是使用asus的p5bv-c(单路的服务器板) cpu是E5300,普通的4G内存
然后raid卡是adaptec的31605
机箱是了联志的4211。全部安装了台达的8038的风扇。
硬盘是320G*2 raid1安装server 2008
然后12个1.5T硬盘做的raid 5EE,GPT格式13.6T
问题出现在大年30那天。他们最后一天上班的时候服务器上的13.6T的地方出现了问题。
可能是机箱的热插拔位置接触不好,0-7号硬盘没有认出来。
开机后报错了。于是拆下来用风枪仔细打扫干净。
在开机硬盘全部认出来了,但是raid卷显示出错了。
使用自带的软件让他重新online以后。分区恢复正常,状态显示compacting。
现在遇到的问题是,其中一部分比较新的数据出现了错误。
表现为jpg图片被打碎。raw档案不能打开。
但是更加古老的一些数据没有问题。
请问这是compating的问题,还是数据确实已经损坏了?
作者:
hcgxp
时间:
2010-2-17 20:28
补充一下,卡上的缓存是开的。
但是损坏的数据远多于缓存的量。
作者:
fishman
时间:
2010-2-18 09:02
raid5ee并不支持2盘及2盘以上同时离线,在0-7盘离线以后存储的数据都是无效的。
作者:
hcgxp
时间:
2010-2-18 09:48
0-7盘离线的时候根本就没有存过数据,那些数据都是离线前的数据。
那么多盘离线,阵列早就报错不能读写了。
只是回复后发觉一部分数据有损坏。
作者:
fishman
时间:
2010-2-18 10:10
个人认为那些数据都是在raid有问题的时候存储的。可能在你发现0-7盘离线之前raid已经故障了。
作者:
hcgxp
时间:
2010-2-18 10:13
raid卡是设置了自动报警的。一旦有故障会自动向我的邮箱发送邮件的。
但是我只接到0-7号盘的报警邮件,之前并没有发生其他错误。
恢复后的日志也一切正常。
而且0-7号盘失效后。并没有做过任何操作。
再检查是接触不良情况后。只是选择了让阵列重新online而已。
欢迎光临 POPPUR爱换 (https://we.poppur.com/)
Powered by Discuz! X3.4