POPPUR爱换

标题: 家里服务器上的intel 320 120G暴毙,惨啊 [打印本页]

作者: lucifersun    时间: 2012-10-15 23:15
标题: 家里服务器上的intel 320 120G暴毙,惨啊
年头上买的,之前用在笔记本上一直没什么问题,不过嫌容量小了点,前几个星期买了个240G的给笔记本装上。替换下来之后就装到家里的服务器上,挂个Win2k8 R2系统,还有4个虚拟机的VHD。
刚才居然暴毙,远程登陆上去,先是系统响应速度奇慢,然后蓝屏重启,CHKDSK出一大堆错误,然后又卡死,手动重启能进修复模式,但C盘分区进不去,拔出接到其它电脑上,显示E8错误有169个,而且C盘变成RAW了。
而且还看到16个CRC错误,很担心线或者笼子也有问题,但1转4笼子是ICY DOCK的,线是超微主板附带的,都不是什么杂牌货色,现在只能希望仅仅是硬盘个例。
明天去买两个WD的250G黑盘,还是Raid1可靠啊。

作者: bgbrd888    时间: 2012-10-15 23:33
24小时开启的么
作者: amd```fans    时间: 2012-10-16 00:22
有SMART数据么,请发来看下
作者: badboyiam    时间: 2012-10-16 03:53
SSD问题的可能性大,看看icy docky笼子的SATA接口有没有氧化。
作者: lucifersun    时间: 2012-10-16 08:38
回1楼
7x24小时开机的,换到服务器上,差不多连续工作了1个月不到点

回2楼
附上SMART截图
[attach]2058499[/attach]

回3楼
氧化应该不至于,装上去之前看过没什么问题,用了也就1个多月。等换上新硬盘,有系统之后再看看上面其它两个硬盘有没有CRC错误。


作者: runnie    时间: 2012-10-16 09:21
服务器就得上服务器硬盘
作者: per1-q1222    时间: 2012-10-16 09:23
其他看起來沒甚麼問題..
總覺得是connector或著cable的問題..
作者: lucifersun    时间: 2012-10-16 10:10
per1-q1222 发表于 2012-10-16 09:23
其他看起來沒甚麼問題..
總覺得是connector或著cable的問題..

P大,莫要吓我。ICY DOCK应该没那么差吧,刚订了一个M28SAB,还在路上飘着,难道得再去弄个14T?
刚才和Intel联系了保修服务,顺便问了这个问题的成因,按照Intel的说法,B8故障一般来说是SSD自身原因导致,外界原因影响不大。


作者: hammer999    时间: 2012-10-16 10:45
服务器还是不要上民用的固态硬盘吧。直接上SAS,稳定性不是家用固态能比的。
作者: per1-q1222    时间: 2012-10-16 10:56
lucifersun 发表于 2012-10-16 10:10
P大,莫要吓我。ICY DOCK应该没那么差吧,刚订了一个M28SAB,还在路上飘着,难道得再去弄个14T?[wacko>
...

有一種方式就是把SSD個別拆下來直接接到主板上的SATA port進行檢測...
根據你的SMART似乎沒有bad block跡象...


作者: lucifersun    时间: 2012-10-16 11:47
per1-q1222 发表于 2012-10-16 10:56
有一種方式就是把SSD個別拆下來直接接到主板上的SATA port進行檢測...
根據你的SMART似乎沒有bad block跡 ...

这次故障的整个过程比较诡异,我尽量回溯一下
先描述一下环境
服务器是超微X9SCL+-F,Xeon E3-1230,4G ECC x4,H700,ICY DOCK 1转4笼子一个,电源是ANTEC的TPN550。
硬盘除了发生故障的SSD之外,还有3.5寸仓库盘5个,2.5寸笔记本硬盘一个。SSD和笔记本硬盘在笼子里。
因为考虑全面替换成2.5平台,所以H700上原有的3.5硬盘都已经撤下了,新的硬盘笼子还没到,所以当时卡上就单挂了个250G的2.5寸 HDD。其余硬盘全部连接在主板SATA口上。
SSD上只有系统和4个虚拟机的VHD文件,使用频繁的共享文件都在笔记本硬盘上(H700),4个2T硬盘是仓库盘,1个500G专门用来备份数据。
系统是Win2008 R2企业版,安装了Hyper-V,文件服务(Windows Search)两个角色。

客户机都是Win7系统,因为把服务器上的共享目录添加到库中,所以才在服务器上添加了Windows Search。

昨天先是Win7提示“共享位置索引服务未工作”,于是远程登录上Server,打开“服务器管理”-“角色”-“文件服务”,发现Windows Search服务处于停止状态,随后发现窗口锁死点击无响应,但任务栏正常,就直接从开始菜单里打开了“Hyper-V管理”,显示有一台虚拟机在关机状态,而且启动报错,但有没有详细错误信息,余下3台都工作正常,能登陆上去。
强制关闭了“服务器管理”页面,重新打开,依然锁死,之后就远程连接中断,再连就连不上了,当时应该是蓝屏状态。

改用IPMI登陆上去,已经进入BIOS引导状态,系统启动,进CHKDSK,出现大堆Error,死机。重启后进修复模式,能访问到C盘,尝试用CHKDSK检测,死机,再次重启进修复模式,C盘进不去,I/O错误。

拔出硬盘,接到其它机器上,引导区还在,C盘RAW,SMART B8错误。

后来还通过IPMI看了下事件记录,当时还有几条内存、电压、风扇的记录,内存的事件描述是ECC错误,电压和风扇都是“未知原因”,所以也不清楚当时到底哪里出了问题。


作者: 爱喝可乐的小白    时间: 2012-10-16 12:07
羡慕有ipmi
作者: lucifersun    时间: 2012-10-16 12:28
爱喝可乐的小白 发表于 2012-10-16 12:07
羡慕有ipmi

没IPMI就要有键鼠显示器,更贵

作者: Mr.Anderson    时间: 2012-10-16 12:41
估计lz是折腾的主,以前玩DIY,没事老拆上拆下的,硬件经常坏
后来玩腻了,两三年都不开机箱,硬件就没坏过,顶多鼠标键盘换换
作者: lucifersun    时间: 2012-10-16 13:11
本帖最后由 lucifersun 于 2012-10-16 13:11 编辑
Mr.Anderson 发表于 2012-10-16 12:41
估计lz是折腾的主,以前玩DIY,没事老拆上拆下的,硬件经常坏
后来玩腻了,两三年都不开机箱,硬件就没坏过 ...

哪有,一年多前弄好的,也就拆了寥寥数次。第一次是发现山寨硬盘笼子有问题,掉盘,拆了,换成框架,直插。然后加内存拆过一次。接下来就是最近换SSD。或说这台机器也怪,零零碎碎问题一直没断过。换SSD的时候就出过问题,系统盘直接clone过去,拔了旧硬盘,SSD启动成功进系统,再重启一次居然就蓝屏了。换回旧硬盘,居然也是启动成功再重启蓝屏。用之前做的系统备份来恢复,还恢复失败。你说这不是见了鬼了。

我另外一台Atom的下载机,开到现在1年多了,从来没管过它,一点事情都没有,CPU天天烧在5、60度也没什么问题。


作者: Mr.Anderson    时间: 2012-10-16 13:42
lucifersun 发表于 2012-10-16 13:11
哪有,一年多前弄好的,也就拆了寥寥数次。第一次是发现山寨硬盘笼子有问题,掉盘,拆了,换成框架,直插 ...

不是接触不良就是兼容问题了,我也碰过类似的,换了主板才好

作者: per1-q1222    时间: 2012-10-16 13:54
lucifersun 发表于 2012-10-16 11:47
这次故障的整个过程比较诡异,我尽量回溯一下
先描述一下环境
服务器是超微X9SCL+-F,Xeon E3-1230,4G ...

沒有試過斷電, 拔掉 重新插入?


作者: lucifersun    时间: 2012-10-16 14:11
per1-q1222 发表于 2012-10-16 13:54
沒有試過斷電, 拔掉 重新插入?

第二次重启时候拔插过

作者: per1-q1222    时间: 2012-10-16 14:30
本帖最后由 per1-q1222 于 2012-10-16 14:30 编辑

你不是第一個..
剛剛去intel的forum查了一下..
似乎已有先例(b8 error)..
作者: 爱喝可乐的小白    时间: 2012-10-16 14:46
lucifersun 发表于 2012-10-16 12:28
没IPMI就要有键鼠显示器,更贵

带ipmi的主板。。。不便宜啊。。。
话说,要是ipmi可以做成插卡多好,哈哈~


作者: 爱喝可乐的小白    时间: 2012-10-16 14:48
ssd就是这样,偶尔有一个人倒霉坏了,也真心没办法,M4,830也都会啦其实~
作者: lucifersun    时间: 2012-10-16 14:49
per1-q1222 发表于 2012-10-16 14:30
你不是第一個..
剛剛去intel的forum查了一下..
似乎已有先例(b8 error)..[dry>

呃,我确实忘记去Intel的forum了,看了下,B8应该是SSD内部的数据传输故障,而且不少人都反应B8故障伴随系统锁死,无法启动。希望这次只是单纯硬盘故障


作者: lucifersun    时间: 2012-10-16 14:52
爱喝可乐的小白 发表于 2012-10-16 14:46
带ipmi的主板。。。不便宜啊。。。
话说,要是ipmi可以做成插卡多好,哈哈~

X9SCL和X9SCL-F的差价也就20刀,一个159,一个179,不贵的啦。好像Intel的板子都是用插卡式IPMI,不过这块卡可不止20刀。

作者: lucifersun    时间: 2012-10-16 14:54
爱喝可乐的小白 发表于 2012-10-16 14:48
ssd就是这样,偶尔有一个人倒霉坏了,也真心没办法,M4,830也都会啦其实~

关键现在SSD在Raid下没有Trim,我昨天就想过是不是再买一个330 120G,等返修回来直接组R1,但考虑到Trim还是算了,死扛出问题概率更高,何况我这个硬盘用的比较满,剩余20G都不到


作者: 结果    时间: 2012-10-16 15:07
服务器性质的电脑海韵系电源少碰
作者: 结果    时间: 2012-10-16 15:07
服务器性质的电脑海韵系电源少碰
作者: 结果    时间: 2012-10-16 15:19
满盘皆空?SSD死的感觉就是空,色空的境界,令人顿悟啊
作者: lucifersun    时间: 2012-10-16 19:15
系统灌上了,一起装在笼子里的另一个笔记本硬盘没有任何问题,SMART全部正常,CRC=0。看来应该是硬盘的个体故障了。
不过用过SSD,再换成5400prm的硬盘,这感觉真是痛苦啊,居然能慢到这个程度。
作者: 爱喝可乐的小白    时间: 2012-10-16 23:25
lucifersun 发表于 2012-10-16 14:52
X9SCL和X9SCL-F的差价也就20刀,一个159,一个179,不贵的啦。好像Intel的板子都是用插卡式IPMI,不过这块 ...

原来X9SCL-F价格不贵啊,我以前一直以为超微只有4k--5k的板子开始才有ipmi的,ipmi除了底层操作关系reboot之类,能不能也看见系统的画面?

作者: 爱喝可乐的小白    时间: 2012-10-16 23:26
lucifersun 发表于 2012-10-16 19:15
系统灌上了,一起装在笼子里的另一个笔记本硬盘没有任何问题,SMART全部正常,CRC=0。看来应该是硬盘的个体 ...

我本本用5400都收不了,何况你从ssd降回来。。。

作者: lucifersun    时间: 2012-10-17 07:11
爱喝可乐的小白 发表于 2012-10-16 23:25
原来X9SCL-F价格不贵啊,我以前一直以为超微只有4k--5k的板子开始才有ipmi的,ipmi除了底层操作关系reboo ...

全都能看到,从修改BIOS,安装系统,再到系统网络配置完成,全都在IPMI下完成。光盘和U盘也可以直接用本地实体设备或者ISO文件,直接映射成服务器上的设备

作者: zoufq    时间: 2012-10-17 09:09
在换一个三星830的ssd试试
作者: 爱喝可乐的小白    时间: 2012-10-17 09:13
lucifersun 发表于 2012-10-17 07:11
全都能看到,从修改BIOS,安装系统,再到系统网络配置完成,全都在IPMI下完成。光盘和U盘也可以直接用本地 ...

ipmi是用什么去连接的?

作者: lucifersun    时间: 2012-10-17 10:12
爱喝可乐的小白 发表于 2012-10-17 09:13
ipmi是用什么去连接的?

有客户端软件,或者直接浏览器登录,IPMI都集成web服务,上两张图吧


[attach]2059940[/attach]

[attach]2059939[/attach]

作者: stephenmaxmax    时间: 2012-10-17 11:50
本帖最后由 stephenmaxmax 于 2012-10-17 12:03 编辑
爱喝可乐的小白 发表于 2012-10-17 09:13
ipmi是用什么去连接的?

专门的一个网卡芯片做PHY,超微板子上一般配套的IPMI的PHY是螃蟹的芯片,一般是百兆。也就是专门有个螃蟹的百兆网口,这个网口专用于IPMI

但是我觉得超微的IPMI有一点不好, IPMI是由板载BMC来实现的,而板载集显是挂在BMC下面的,一旦集显的显存坏了,集显自检不过, BMC芯片就会卡住也自检不过,这时候IPMI根本连不上。我的显存就坏过一次,很头大,因为BMC芯片自检不过,整个主板就自检失败,所以即便找个显卡插上也是无效的,不得不返厂修理,花了不少时间。[attach]2060076[/attach]


作者: 爱喝可乐的小白    时间: 2012-10-17 11:59
lucifersun 发表于 2012-10-17 10:12
有客户端软件,或者直接浏览器登录,IPMI都集成web服务,上两张图吧

多谢多谢,目前只有机会用过iLO,新来的服务器我都没配置这个东西了。。。

作者: 爱喝可乐的小白    时间: 2012-10-17 12:00
stephenmaxmax 发表于 2012-10-17 11:50
专门的一个网卡芯片做PHY,超微板子上一般配套的IPMI的PHY是螃蟹的芯片,一般是百兆。也就是专门有个螃蟹 ...

好像看到过超微的板子也有用迈拓的G200之类的显卡的,至少惠普还是继续G200多头

作者: stephenmaxmax    时间: 2012-10-17 12:01
爱喝可乐的小白 发表于 2012-10-16 14:46
带ipmi的主板。。。不便宜啊。。。
话说,要是ipmi可以做成插卡多好,哈哈~

主板集成其实对用户来说比较省钱。

作者: lucifersun    时间: 2012-10-17 12:22
爱喝可乐的小白 发表于 2012-10-17 12:00
好像看到过超微的板子也有用迈拓的G200之类的显卡的,至少惠普还是继续G200多头

G200可以配合IPMI芯片啊





欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4