Deployment Guide
查看机柜 LED
您可以查看硬件上的 LED 以识别组件状态。如果问题导致无法访问 PowerVault Manager 或 CLI,查看机柜 LED 是唯一可用的选项。
但是,监控/管理通常使用存储管理界面在管理控制台完成,而不是依靠可机架安装的硬件组件的 LED 视距。
执行基本步骤
您可以使用上文中所述的任何可用选项执行包含故障隔离方法的基本步骤。
收集故障信息
故障发生时,收集尽可能多的信息。这样将帮助您确定解决故障所需的正确操作。
通过查看报告的故障开始:
● 故障与内部数据路径还是外部数据路径相关?
● 故障与硬件组件(例如磁盘驱动器模块、控制器模块或电源装置)相关吗?
通过将故障隔离到存储系统中的一个组件,您将能够更快速地确定必要的更正措施。
确定故障位置
发生故障时,模块故障 LED 将亮起。检查机柜背面的 LED 可将故障范围缩小到 CRU、连接或两者。LED 还可以帮助您识别报告故障
的 CRU 的位置。
查看 LED 时,使用 PowerVault Manager 可验证发现的任何故障。如果由于系统位置导致无法查看 LED,PowerVault Manager 还适用
于确定故障位置。此 web 应用程序可提供系统及其故障位置的可视化视图。PowerVault Manager 还提供关于 CRU、数据和故障的更
多信息。
查看事件日志
事件日志将记录所有系统事件。每个事件具有数字代码,可识别发生的事件类型,以及以下严重级别之一:
● 严重 - 发生的故障可能导致控制器关机。立即更正问题。
● 错误 - 发生的故障可能影响数据完整性或系统稳定性。尽快更正问题。
● 警告 - 发生的问题可能影响系统稳定性,而不是数据完整性。评估问题并根据需要更正。
● 通知 - 发生配置或状态更改,或发生的问题已被系统更正。无需立即操作。
事件日志记录所有系统事件。请查看日志以识别故障和故障原因。例如,如果用户更改通道设置但没有考虑所分配的存储资源,主
机可能丢失到磁盘组的连接。此外,故障类型可以帮助将问题隔离到硬件或软件。
隔离故障
有时,可能必须隔离故障。尤其是与数据路径相关时,因为组件数量会影响数据路径。例如,如果发生主机端数据错误,它可能由
于数据路径中的任何组件导致:控制器模块、线缆或数据主机。
如果机柜未初始化
要初始化所有机柜,可能最多需要两分钟。
如果机柜未初始化:
● 执行重新扫描
● 系统关机后再开机
● 确保电源线正确连接,并检查已连接的电源
● 检查事件日志中的错误
80
故障排除和解决问题