Users Guide
排除远程系统故障首先需要进行的步骤
以下是在排除 Managed System 高级别故障时常见的一些问题:
1. 系统开机还是关机?
2. 如果是开机,操作系统是运作正常、崩溃,或者只是冻结?
3. 如果是关机,电源是意外关闭的吗?
监测机箱电源并执行电源控制命令
可以使用 Web 界面或 RACADM 完成:
l 查看系统的当前电源状态。
l 当重新引导、打开或关闭系统电源时,通过操作系统执行秩序关机。
有关 CMC 上电源管理和配置电源预算、冗余和电源控制的信息,请参阅 Power Management(电源管理)。
查看电源预算状况
有关使用 Web 界面或 RACADM 查看机箱、服务器和 PSU 电源预算状态的说明,请参阅查看功耗状态。
执行电源控制操作
有关使用 CMC Web 接口或 RACADM 开机、关机、重设、关机后再开机的说明,请参阅执行机箱电源控制操作、执行 IOM 电源控制操作和执行服务器电源控制操作。
电源故障排除
使用下面的项目帮助排除电源故障并解决有关电源的问题:
l 问题:将“Power Redundancy Policy”(电源冗余策略)配置成了“AC Redundancy”(交流冗余),并发出电源设备冗余掉失事件。
¡ 解决方案 A:此配置要求 1 侧(左边 3 个插槽)至少有 1 个电源且 2 侧(右边 3 个插槽)至少有 1 个电源存在于模块化机柜中并可正常运行。另外,每侧的容量必须
足以支持机箱的合计功率分配以维持交流冗余。(为了获得完整的交流冗余,确保提供由 6 个电源设备组成的完整 PSU 配置。)
¡ 解决方案 B:确认所有电源设备是否正确连接到两个交流电网;1 侧的电源设备需要连接到一个交流电网;2 侧的电源设备需要连接到一个交流电网;且两个交流电网都需
要能正常运行。如果一个交流电网不工作,则交流冗余丢失。
l 问题:即使已连接交流线并且配电装置的交流输出良好,PSU 状态也显示为“Failed (No AC)”(失败 [无交流])。
¡ 解决方案 A:检查并更换交流电缆。检查并确认为电源供电的配电装置是否按预期方式工作。如果故障依然存在,请致电 Dell 客户服务更换电源。
¡ 解决方案 B:确认 PSU 连接的电压是否与其他 PSU 相同。如果 CMC 检测到在不同电压下工作的 PSU,则此 PSU 会被关闭并标记为“Failed”(故障)。
l 问题:动态电源设备接入已启用,但“Standby”(待机)状态中没有显示任何电源。
¡ 解决方案 A:剩余功率不足。一个或多个电源设备仅会在机柜内的剩余功率超过至少一个电源设备的容量时进入待机状态。
¡ 解决方案 B:机柜内的电源设备不完全支持动态电源设备接入。要确认是否是此情况,用 Web 界面关闭动态电源设备接入,然后再次打开。如果不能完全支持动态电源设
备接入,则会显示一条消息。
l 问题:将新服务器插入供电充足的机柜,但服务器无法开机。
¡ 解决方案 A:检查系统输入电源上限设置 - 它的配置可能太低,不允许任何额外服务器开机。
¡ 解决方案 B:检查是否在 110V 下工作。如果任何电源设备连接到 110V 分支电路,则在允许服务器开机前必须认可这是有效的配置。有关详情,请参阅“电源配置设
置”。
¡ 解决方案 C:检查最大节能设置。如果设置了此项,则允许服务器开机。有关详情,请参阅“电源配置设置”。
¡ 解决方案 D:检查与新插入服务器相关的插槽的服务器插槽电源优先权,确保它不低于任何其他服务器插槽电源优先权。
l 问题:可用电源不断变化,即便没有更改模块机柜配置
¡ 解决方案:CMC 1.2 和更高版本拥有动态风扇电源管理功能,如果机柜在接近峰值用户配置的电源上限操作,则会暂时减少服务器的分配;这将导致通过降低服务器性能为
风扇分配电源,以保证输入电源消耗低于“System Input Power Cap”(系统输入电源上限)。这是正常现象。
l 问题:报告 2000 W 作为“Surplus for Peak Performance”(峰值性能盈余)。
¡ 解决方案:机柜在当前配置中提供 2000 W 剩余电源,并且“System Input Power Cap”(系统输入电源上限)可安全地降低报告的此数值,而不会影响服务器性能。
l 问题:一部分服务器在交流电网故障后断电,甚至当机箱在带有六个电源设备的“AC Redundancy”(交流冗余)配置中运行时也是如此。