Users Guide

2: 网络和电源中断 流程图
警报 CDEV4007 与可以如下分类的网络或电源问题有关
间歇性/可恢复问题 短暂的电力或网络中断。管理员可以识别这些类型的故障并在本地或远程执行恢复操作。请勿提升备份
主机箱。允许主机箱自动恢复连接或让管理员修复电源或网络问题。
部分故障 两个管理模块都出现故障或失灵。但剩余的机箱组件正常工作。将备份主机箱提升为主机箱以通过新的主机箱重
新获得组管理功能。有关提升备份并将故障主机箱恢复为生产状态的详细信息请参阅主机箱的灾难恢复部分。
完全故障 灾难性故障。所有机箱组件包括管理模块都已损坏或未响应。将备份主机箱提升为主机箱以通过新的主机箱
重新获得组管理功能。有关提升备份主机箱并清除对故障主机箱的引用的信息请参阅主机箱的灾难恢复部分。
备份主机箱可接任作为主机箱的情形
本部分介绍了备份主机箱可以接任作为机箱组的主机箱的情形。
主机箱的灾难恢复
灾难性故障如断电、断网和两个 MM 故障可能会导致主机箱无法访问或不可用。在这些情况下您可以提升备份主机箱以接
替发生故障的主机箱来继续管理系统。
: 备份主机箱提升为新的主机箱时将会恢复未暴露给故障的成员机箱的组管理功能。但是在发生故障的主机箱上对功能
可恢复的程度有限制。恢复基于故障主机箱中故障的严重性。
在恢复主机箱时请记住以下事项
1. 对备份主机箱运行“提升”任务之前
a. “提升”任务是中断性操作仅在无法恢复不可访问的主机箱时使用。例如在主机箱的部分故障中如果只是管理模块没
有响应但计算工作正常运行提升任务会中断在主机箱计算上仍在运行的工作负载。有关重新定位工作组件即从故障主
机箱切换计算和网络的信息请参阅列表项 3.c“故障主机箱在投入生产之前恢复它所需的步骤”。
b. 在确定主机箱发生故障并且不可访问后在对备份主机箱运行“提升”任务之前您必须远程关闭主机箱的电源或从堆栈中
实际移除机箱。如果在运行提升任务之前主机箱未关闭或没有从堆栈中移除发生故障或存在部分故障的主机箱可能在提
升备份主机箱后复活导致出现多个主机箱的情形。多个主机箱可能对机箱组的管理造成混淆和干扰。
2. 对备份主机箱上运行“提升”任务
100
使用案例场景