数据中心机房供电保证设备中,科华UPS电源、HVDC、发电机组等设备均在不同等级的机房广泛应用;UPS、HVDC电源体系因常年处于运转状况,会呈现一些故障;而在线式UPS电源因设计电路合理,驱动功率元件容量所取的余量较大,相对来说电源电路故障率较低,而由电池引起的故障率较高。正确的运用和保护好UPS电池的寿数是降低不间断电源故障率的关键因素。一起还要防备因UPS内部控制(接线、软件等)体系引起的异常停机事端!
下面是一个UPS因控制体系异常导致的停机事情,共享一下,希望引起各位运维同行的重视。
故障现象
电力监控体系忽然报出多条告警信息:科华UPS电源异常、UPS输出屏失电(电压、电流一起归0)、机房N个列头柜失电、科华UPS体系BCB电池开关跳位等;
先检查现场状况
值班人员立即参与查看报警UPS,现场状况如下:
1、现场UPS输入柜主路、旁路电源开关状况无异常;
2、输出柜各开关处于合闸方位,输出柜失电;
3、输出柜各开关对应机房列头柜失电;
4、报警UPS对应蓄电池组开关处于跳闸方位;重合无法合闸;
5、UPS本体各状况指示灯熄灭,报警灯常亮,一起伴有报警声;
应急方法
1、立即对科华UPS电源各开关状况及电量各参数进行查看,电源柜三相电源电压无异常,主路、旁路开关均处于合闸方位,电流为0;将UPS输出屏主进开关分闸;
2、按UPS本体故障清除键按钮;
3、将UPS输入主、旁路断路器分闸,静待30秒后康复合闸;此刻UPS自动转为旁路运转状况;
4、将UPS运转状况由旁路供电形式转换为正常整流逆变形式;查看UPS输出各项电量参数无异常;此刻再将电池组开关由跳位分闸到分位,然后重新进行合闸,开关康复正常合闸方位;
5、将UPS输出屏各开关康复合闸方位,机房失电列头柜康复供电;
6、通知UPS厂家人员参与对故障设备进行查看,排除故障危险;
故障原因排查
等待科华UPS电源厂家维护工程师到达现场,对UPS内部数据导出查看;发现在本UPS故障时,UPS本机发出了紧迫停机指令,导致UPS停机。随后对UPS本体仔细查看,发现EPO连线插头未插实!无其他异常现象。
结合现场实际状况:
1、UPS电源柜主、旁路开关状况正常,输出中断,BCB电池组开关跳闸,无法手动康复合闸状况;
2、UPS设备本体主、旁路输入回路锁死;
3、UPS设备市电输入主、旁路分(UPS本体断电)合闸后,UPS自动康复旁路运转形式;
4、手动发动逆变器,UPS切换至主路逆变供电状况;
5、合BCB电池开关操作成功。
以上现象符合EPO动作后紧迫停机特征,故本次故障可判定为UPS因内部错误指令导致停机故障。
后续改进方法:
科华UPS电源是设备是供电可靠性的最终一道保证,为保证数据中心供电安全可靠,保护团队举一反三,避免相似问题再次发生。
立即对所有UPS电源运转安全危险进行查看:全面查看UPS电源运转环境,查看风扇运转状况,确保UPS电源散热条件满足要求;查看UPS电池运转状况,确保电池具有后备保证能力;查看各UPS电源的内部EPO接线状况,避免相似故障再次发生。