POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: jimmyjin
打印 上一主题 下一主题

【RAID大神per1-q1222成功救回!】 H700 VD 掉线, 无法导入Foreign Conf

  [复制链接]
21#
发表于 2012-7-16 18:46 | 只看该作者
本帖最后由 per1-q1222 于 2012-7-16 18:46 编辑

根據你其中的log紀載資訊...
07/15/12 23:56:42: ****  JUST READING CFG !!!!
07/15/12 23:56:42: createMegaraidCfg: ***** attempting to import a normal VD with targetID 255 while have all vds with pinned cache or no pinned cache
07/15/12 23:56:42: isForeignCfgComplete: Foreign - totAr: 0x1, totLd: 0x1, totSpare: 0x0
07/15/12 23:56:42: isForeignCfgComplete: MR_CFG  - totAr: 0x1, totLd: 0x1, totSpare: 0x0
07/15/12 23:56:53: EVT#45569-07/15/12 23:56:53: 218=Foreign Configuration Detected
07/15/12 23:56:53: ForeignImport requested for guidIndex 0xff.
07/15/12 23:56:53: parsePartitionsBVD : pd=5 emergency bit set
07/15/12 23:56:53: ddfValidateForCfg: ldAfterImport 0,  invalidLd 1, import 1
07/15/12 23:56:53: **** PinnedCacheDataStructures->pinned_cache_present 0
07/15/12 23:56:53: sscPinnedWindowInfo.ssd_window_pinned 0
07/15/12 23:56:53:  ld 0  targetId ff LdMapTargetIdToLd 0
07/15/12 23:56:53: ****  total_num_vds_pinned 0  number_pinned_vds_found_during_import 0
07/15/12 23:56:53: ****  NO PINNED CACHE !!!!
07/15/12 23:56:53: createMegaraidCfg: ***** attempting to import a normal VD with targetID 255 while have all vds with pinned cache or no pinned cache
07/15/12 23:56:53: isForeignCfgComplete: Foreign - totAr: 0x1, totLd: 0x1, totSpare: 0x0
07/15/12 23:56:53: isForeignCfgComplete: MR_CFG  - totAr: 0x0, totLd: 0x0, totSpare: 0x0
07/15/12 23:56:53: ForeignImport: Nothing to import
07/15/12 23:56:53: EVT#45570-07/15/12 23:56:53: 396=Foreign configuration auto-import did not import any drives

在我看來這可能是一個NVRAM上的metadata與PD上的COD不匹配引發..
回复 支持 反对

使用道具 举报

22#
 楼主| 发表于 2012-7-16 19:22 | 只看该作者
per1-q1222 发表于 2012-7-16 18:46
根據你其中的log紀載資訊...
07/15/12 23:56:42: ****  JUST READING CFG !!!!
07/15/12 23:56:42: creat ...

谢谢Per1大, 我觉得你的判断是对的!
受到前面一个帖子的启发, 你觉得这样做可以么? (当然前提是数据安全):
1. 关机, 把阵列盘取出
2. 开机, 进OS, 打开MSM,这时候应该一个Phy Disk都没有
3. 点选Clear conifg, 清除NVRAM中的config
4 关机
5。 阵列盘放入, 再开机 进OS /MSM
6. 尝试import , 不过这次是从COD上找到的config 期望能成功

你觉得这样可以么? 我想这样就可以避免COD和NVRAM mismatch, 其实有点像把旧阵列import到一块全新的H700上。  per1大觉得可行么?
回复 支持 反对

使用道具 举报

23#
发表于 2012-7-16 19:25 | 只看该作者
jimmyjin 发表于 2012-7-16 19:22
谢谢Per1大, 我觉得你的判断是对的!
受到前面一个帖子的启发, 你觉得这样做可以么? (当然前提是数据 ...

首先有兩個問題:
1. 你目前的盤確認是安全的?
2. 有換過盤序嗎?
回复 支持 反对

使用道具 举报

24#
发表于 2012-7-16 19:30 | 只看该作者
我就怕你的错误是存在硬盘上的,我之前升级硬盘固件,那个错误清了config都还是不行,换张卡也不行,明显是盘上数据出错......
回复 支持 反对

使用道具 举报

25#
 楼主| 发表于 2012-7-16 19:31 | 只看该作者
per1-q1222 发表于 2012-7-16 19:25
首先有兩個問題:
1. 你目前的盤確認是安全的?
2. 有換過盤序嗎?

1. 应该是吧, 设为offline前后都没有读/写
2.没有换盘序
回复 支持 反对

使用道具 举报

26#
发表于 2012-7-16 19:32 | 只看该作者
顶各位大神。。。。。。。。。。。。。。。。。。拜了
回复 支持 反对

使用道具 举报

27#
发表于 2012-7-16 19:33 | 只看该作者
jimmyjin 发表于 2012-7-16 19:31
1. 应该是吧, 设为offline前后都没有读/写
2.没有换盘序

那麼你可以嘗試這樣的做法(可能性)..
如果確認VD已找到..
但是..., 進OS沒有找到任何partition..
請馬上在論壇反映...
不要做任何操作...
回复 支持 反对

使用道具 举报

28#
 楼主| 发表于 2012-7-16 20:11 | 只看该作者
zyzs 发表于 2012-7-16 19:30
我就怕你的错误是存在硬盘上的,我之前升级硬盘固件,那个错误清了config都还是不行,换张卡也不行,明显是 ...

如果是你说的情况, 好像也没救了
回复 支持 反对

使用道具 举报

29#
 楼主| 发表于 2012-7-16 20:19 | 只看该作者
per1-q1222 发表于 2012-7-16 19:33
那麼你可以嘗試這樣的做法(可能性)..
如果確認VD已找到..
但是..., 進OS沒有找到任何partition..

得令! 试去了
Good Luck!
回复 支持 反对

使用道具 举报

30#
 楼主| 发表于 2012-7-16 20:31 | 只看该作者
per1-q1222 发表于 2012-7-16 19:33
那麼你可以嘗試這樣的做法(可能性)..
如果確認VD已找到..
但是..., 進OS沒有找到任何partition..

失败了..........
进MSM还是4个 unconfiged good PD, 尝试import , 还是失败.......
附件是scan得到的config, 我现在怀疑我手动offline这一步是大败笔

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

31#
发表于 2012-7-16 20:39 | 只看该作者
本帖最后由 zyzs 于 2012-7-16 20:40 编辑

回头写个的总结,让其他人学习下免得以后中招了......
不过我觉得还是有救的,找lsi工程师改下硬盘里面配置估计能恢复,毕竟数据都在
回复 支持 反对

使用道具 举报

32#
发表于 2012-7-16 21:14 | 只看该作者
jimmyjin 发表于 2012-7-16 20:31
失败了..........[cry>
进MSM还是4个 unconfiged good PD, 尝试import , 还是失败.......
附件是scan ...

如果您可以...
有用msn?
回复 支持 反对

使用道具 举报

33#
 楼主| 发表于 2012-7-16 21:24 | 只看该作者
per1-q1222 发表于 2012-7-16 21:14
如果您可以...
有用msn?

PM你了, 多谢 per1大古道热肠
回复 支持 反对

使用道具 举报

34#
 楼主| 发表于 2012-7-17 01:09 | 只看该作者
per1-q1222 发表于 2012-7-16 21:14
如果您可以...
有用msn?

per1-q1222大神深夜亲自远程操刀, 神奇滴救回了offline VD。
他老人家一直在我这里VNC忙到深夜一点, 不但恢复了VD , 还帮我优化了很多设置, 大感谢啊!!!

具体的技术阐述, 我就不专美了, 留给P大来讲解吧.........
回复 支持 反对

使用道具 举报

35#
发表于 2012-7-17 08:54 | 只看该作者
P大是好人啊,这种行为是一定要赞美的
回复 支持 反对

使用道具 举报

36#
发表于 2012-7-17 08:56 | 只看该作者
恭喜!等p大讲解!
回复 支持 反对

使用道具 举报

37#
发表于 2012-7-17 10:00 | 只看该作者
关注P大的过程讲解
回复 支持 反对

使用道具 举报

38#
发表于 2012-7-17 16:33 | 只看该作者
果然高人多,这些毕竟很少人能够熟练,坐等讲解
回复 支持 反对

使用道具 举报

39#
发表于 2012-7-18 18:14 | 只看该作者
本帖最后由 per1-q1222 于 2012-7-18 18:18 编辑

就這次的問題可能有幾種情況:
1. RAID Controller上NVRAM的DDF數據與VD上的COD不匹配...
2. COD不穩定

參考這個案例:
http://we.pcinlife.com/thread-1825181-1-1.html
使用OAR無效, COD並不是穩定...

到最後只好使用re-creating VD without initialization..
不會摧毀parity...
但是先前盤序一定要對..
因為條帶順序會影響數據結構....
盤序不對還是會死...
stripe size也要與先前的一樣..
如果確保之前沒有干涉到任何異常操作...
ex: rebuild, cc
可能有機會復原...
這次運氣好的是使用這個方式使得VD被復原..

不過LZ的其中一個PD的bad sector情況很嚴重....
一個案例:
http://www.osslab.com.tw/Storage/Enterprise/SAS%E8%88%87RAID/LSI/LSI_RAID_Software_Stack_Training/Media_Error_Count

另外LZ的Sense Code解讀是B-0-0:
請參考:
http://www.osslab.com.tw/Storage/Enterprise/SAS%E8%88%87RAID/LSI/LSI_RAID_Software_Stack_Training/Sense_Code_Message
很可惜這個Sense Code無法提供任何詳細資訊..
回复 支持 反对

使用道具 举报

40#
发表于 2012-7-18 18:47 | 只看该作者
太复杂了看不懂.........
请教p大个问题,我硬盘做成了jbod,硬盘全部放在一个机箱内,电源是独立的,用专用24针跳线启动电源
pc主机上的raid卡接2条线到jbod上的扩展卡,如果我不小心踢到了电源线导致jbod上面全部断电,pc主机上raid卡提示全部硬盘离线,这个时候最佳恢复方法是怎么样的?
直接启动jbod还是关了主机然后一起启动?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-4-8 10:00

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表