|
对MTBF的一点解释:
MTBF(Mean time between failure)常被翻译为不间断工作时间、平均无故障时间、连续工作时间之类,其实这都有些不确。这种翻译上的歧义加上厂家有意无意的误导是造成这种错误理解的根源。
MTBF严格意义上应表示为总运行时间/每错误,为简单地说明这个问题,在此借用一下很早以前IBM网站曾举的一个例子,假定某年美国人的死亡率为每一千人(一千块硬盘X1小时)1.1(硬盘故障率),则相应当年美国人的MTBF为910年(1000÷1.1=910小时/故障),这样就清楚地看出MTBF与寿命之间的关系:即使最长寿的人,也不可能活900年。
由上可见,MTBF是一项群体特征,而不是某个个体的一项参数,更与产品的使用寿命无关。比如对于一家有1000台PC运行的企业,当其为可能损坏的硬盘准备替换备件时,MTBF是一个有用的参数,而对于其中单独的某一台,这个参数没什么意义。
当然,厂家给出的MTBF并非简单地指(测试硬盘数量X运行时间)/(故障数),其结果的给出依据一套十分复杂的数学模型,在确保达到要求的温度范围内,以大样本数、长时间运行,在规定的容许故障率基础上,得出(总运行时间/故障硬盘数)的原始值,在此基础上加各种参数修正(所谓的修正以将该值放大为多,比如说硬盘理想的工作温度为25℃,而测试是在42℃下做的,而理论表明25℃时故障率比42℃时要低一倍,则相应地MTBF值便翻了番。其他如Duty Cycle、年POH等等皆为如此),最终得出了一个无比巨大的官方公布数字。
所以,MTBF只是一个参考数字,不同厂家之间的MTBF没有可比性,因为它们采用不同的数学模型来计算;即便同一厂家,其桌面级产品与企业级产品相比也无意义:企业级产品测试时的样本数、测试周期远远多于桌面级,(几)千块运行半年到九个月甚至更长,而桌面级多为(几)百块运行1个月至多不超过1000小时,二者最终数值的修正因子与修正方法也差别甚大,在某种意义上说,企业级产品的MTBF值的得出还算严谨,而桌面级则往往竞争的压力下变了味:大家可以看一下桌面级硬盘的参数,简直在进行数字竞赛,从几年前的几万小时一跃到如今的百万小时量级,难道大家真以为硬盘制造技术在短短几年内有如此突飞猛进的变化? |
|