Users Guide

Table Of Contents
2: 网络和电源中断 流程图
警报 CDEV4007 与可以如下分类的网络或电源问题有关:
间歇性/可恢复问题 短暂的电力或网络中断。管理员可以识别这些类型的故障,并在本地或远程执行恢复操作。请勿提升备份
主机箱。允许主机箱自动恢复连接,或让管理员修复电源或网络问题。
部分故障 两个管理模块都出现故障或失灵。但剩余的机箱组件正常工作。将备份主机箱提升为主机箱,以通过新的主机箱重
新获得组管理功能。有关提升备份并将故障主机箱恢复为生产状态的详细信息,请参阅主机箱的灾难恢复部分。
完全故障 灾难性故障。所有机箱组件(包括管理模块)都已损坏或未响应。将备份主机箱提升为主机箱,以通过新的主机箱
重新获得组管理功能。有关提升备份主机箱并清除对故障主机箱的引用的信息,请参阅主机箱的灾难恢复部分。
备份主机箱可接任作为主机箱的情形
本部分介绍了备份主机箱可以接任作为机箱组的主机箱的情形。
主机箱的灾难恢复
灾难性故障(如断电、断网和两个 MM 故障)可能会导致主机箱无法访问或不可用。在这些情况下,您可以提升备份主机箱,以接
替发生故障的主机箱来继续管理系统。
: 备份主机箱提升为新的主机箱时,将会恢复未暴露给故障的成员机箱的组管理功能。但是,在发生故障的主机箱上,对功能
可恢复的程度有限制。恢复基于故障主机箱中故障的严重性。
在恢复主机箱时,请记住以下事项:
1. 对备份主机箱运行“提升”任务之前:
a. “提升”任务是中断性操作,仅在无法恢复不可访问的主机箱时使用。例如,在主机箱的部分故障中,如果只是管理模块没
有响应,但计算工作正常,运行提升任务会中断在主机箱计算上仍在运行的工作负载。有关重新定位工作组件(即从故障主
机箱切换计算和网络)的信息,请参阅列表项 3.c“故障主机箱在投入生产之前恢复它所需的步骤”。
b. 在确定主机箱发生故障并且不可访问后,在对备份主机箱运行“提升”任务之前,您必须远程关闭主机箱的电源或从堆栈中
实际移除机箱。如果在运行提升任务之前,主机箱未关闭或没有从堆栈中移除,发生故障或存在部分故障的主机箱可能在提
升备份主机箱后复活,导致出现多个主机箱的情形。多个主机箱可能对机箱组的管理造成混淆和干扰。
2. 对备份主机箱上运行“提升”任务:
使用案例场景 125