T610服务器硬盘亮橙色灯,换了新硬盘问题无法解决。附上日志。

PowerEdge服务器

PowerEdge服务器
加入对PowerEdge服务器和系统管理实践的讨论

T610服务器硬盘亮橙色灯,换了新硬盘问题无法解决。附上日志。

这个问题已经回答Eahua (Dell Technology)

T610服务器硬盘亮橙色灯,换了新硬盘问题无法解决。硬盘放到另一台服务器确认是好的,服务器的硬盘接口全部用完了,没法测试插口的好坏,附上日志。DSET Report for [YCSP001 SvcTag-96YGQ2X-PE T610] on 02-16-2017 at 11.40 AM.zip

验证的回答
  • 更换背板前,先把数据备份了,关机拔电源线,再更换背板。

    另更换背板是可能导致硬盘状态变成Foreign的,但这不一定就会,即使是Foreign的状态,也没关系,我们在Raid BIOS 按F2把 Foreign的硬盘导入就好。(如图)

    注意所有硬盘需要在开机前全部插入,不要分开插入,以免造成数据异常。 

所有回复
  • 有点像是接口坏了,但这个通常硬盘故障也可能导致类似的报错。

    02/15/17 13:43:14: EVT#61016-02/15/17 13:43:14: 185=Enclosure PD 20(c None/p0) phy bad for slot 5

    先排除硬盘故障先。

    收集日志的时候,硬盘是插在上面的吗?如果不是,插上去之后再收集一次日志,有可能是硬盘在上面需要设置热备后重建。

  • 收集日志的时候,硬盘是插上去了的。硬盘我手插到另一台T710服务器里在陈列卡界面可以识别(显示外来硬盘),应可以确认硬盘是好的。接口故障是需要更换背板吗?数据不会丢失吧!

  • DSET Report for [YCSP001 SvcTag-96YGQ2X-PE T610] on 02-28-2017 at 02.47 PM.zip

  • 个人觉得虽然在另的服务器上检测到,但不代表就是背板的问题,可以的情况下有其它硬盘可以接在T610上重建阵列先看看,根据以下日志,硬盘接上后,一直在检测超时,所以先找硬盘重建尝试先。

    另假设更换背板,数据不会丢失,数据是保存的硬盘里面的,不是在背板。但以防万一建议在做任何操作前备份好数据。

    02/28/17 14:43:44: SES_MarkBadElement: enclPd 20 timeDiff cfc4c slot 5 badElmt 1 retryCnt 0 oldTime:0 currentTime:cfc4c
    02/28/17 14:43:54: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:43:54: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc56
    02/28/17 14:44:04: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:04: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc60
    02/28/17 14:44:14: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:14: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc6a
    02/28/17 14:44:24: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:24: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc74
    02/28/17 14:44:34: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:34: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc7e
    02/28/17 14:44:44: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:44: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc88
    02/28/17 14:44:54: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:44:54: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc92
    02/28/17 14:45:04: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:45:04: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc9c
    02/28/17 14:45:14: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:45:14: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfca6
    02/28/17 14:45:24: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:45:24: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcb0
    02/28/17 14:45:34: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:45:34: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcba
    02/28/17 14:45:44: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
    02/28/17 14:45:44: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcc4
    02/28/17 14:45:44: EVT#61471-02/28/17 14:45:44: 185=Enclosure PD 20(c None/p0) phy bad for slot 5

  • 硬盘有!但是没有了接口让我重建陈列,如果把原有的硬盘拔下来,插新硬盘重建陈列,那数据不是没有了。新手没有搞明白。麻烦指点下。非常感谢!

  • 哦!~你在纠结这个!

    这台T610的服务器有两组阵列,一组是146G*2 做的Raid1,一组是300GB*6 做的Raid5.

    目前有问题的硬盘在Raid5上,由于Raid5可以允许一个硬盘故障而不影响数据,所以你可以更换一个新的相同类型硬盘上去,然后阵列卡会通过算法校验从其它硬盘里把数据重建回来。

  • 旧的硬盘我拆下来更换了新的硬盘上去了,但是还是亮黄灯(硬盘没法识别)。只是旧硬盘品牌是日立,新的是希捷的。都是300G的。以前我也坏过硬盘换上新的就OK,但以前我Ctrl+R ,进陈卡PD界面查看,坏的盘会显示Fail或MISS,但这次坏的那个盘什么也不显示,8个盘位只显示7个。

  • 插上去后,收份日志看一下不!!

    如果使用的是相同类型的硬盘,那只能更换了背板了。

  • 今天的那份日志就是换了新盘的日志(附件是坏盘插上的日志),更换背板,我从DELL订配件自已能更换吗?(DELL上门费用太高了)需要注意什么?我知道所有的硬盘都必需拔下来。插回去全部硬盘PD界面状态就会变成foreign,Raid 5就没法import了。

    我还说明下亮黄灯的原因:

       春节开工,打扫卫生,顺便也把610的灰尘也吹也,可能是吹灰的气用大了点(直接用0.8MPA的压力吹),完了之后就黄灯了。   后悔中。。。。。。。。DSET Report for [YCSP001 SvcTag-96YGQ2X-PE T610] on 02-28-2017 at 07.28 PM.zip

        

  • 更换背板前,先把数据备份了,关机拔电源线,再更换背板。

    另更换背板是可能导致硬盘状态变成Foreign的,但这不一定就会,即使是Foreign的状态,也没关系,我们在Raid BIOS 按F2把 Foreign的硬盘导入就好。(如图)

    注意所有硬盘需要在开机前全部插入,不要分开插入,以免造成数据异常。 

  • 你好!我那背板能帮我看下部件号是多少啊?谢谢!

  • 2.5背板部件号:GW464 

    3.5背板部件号:F313F

  • 经过我反复测试,发现我背板没有问题。现在PD界面能认到硬盘了,但就是在Redy状态,没发重建陈列。我应怎么处理让他恢复数据。附上日志。DSET Report for [YCSP001 SvcTag-96YGQ2X-PE T610] on 03-02-2017 at 10.41 AM.zip

  • 那目前这种情况就好处理点,重启服务器到Raid BIOS,然后Ctrl+N到硬盘管理介面,光标选中目前硬盘按F2,然后设置为热备,如下图:

    另提醒一下,这台服务器的阵列卡电池坏了很久了需要更换,目前缓存禁用的情况下会导致性能有所下降。

    03/02/17 10:31:42: EVT#61576-03/02/17 10:31:42: 150=Battery needs replacement - SOH Bad

    电池部件号#NU209

  • 数据在Rebuliding 。非常感谢你的指导!还有个问题:陈列卡换电池,必需拆下来。插回去硬盘不会foreign状态吧!陈列不会丢失吧!