适用于 Nagios Core 的 Dell OpenManage 插件 版本 2.0 用户指南 2021 年 4 月 Rev.
注意、小心和警告 注: “注意”表示帮助您更好地使用该产品的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并告诉您如何避免此类问题。 警告: “警告”表示可能会导致财产损失、人身伤害甚至死亡。 © 2015 - 2021 Dell Inc. 或其子公司。保留所有权利。Dell、EMC 和其他商标是 Dell Inc.
目录 章 1: 适用于 Nagios Core 的 Dell OpenManage 插件版本 2.0 简介.......................................................... 5 章 2: Dell SPI 版本 4.0 的新增功能..................................................................................................... 6 章 3: 主要功能................................................................................................................................. 7 章 4: 支持值表......................................................................................................................
附录 A: 附录..................................................................................................................................
1 适用于 Nagios Core 的 Dell OpenManage 插件 版本 2.0 简介 本指南介绍了使用适用于 Nagios Core 的 Dell OpenManage 插件版本 2.0 的信息及其各种功能,例如查找、监测、启动控制台以及对 支持的 Dell 设备进行故障排除。此外还详细介绍了支持的 Dell 设备以及客户常见问题。 本插件提供了在 Nagios Core 管理的环境中监测 Dell 设备的功能。这款插件能赋予您对 Dell 设备全面的硬件级可见性,包括整体运行 状况监测和组件级运行状况监测。该插件提供了 Dell 设备的基本资源清册信息和事件监测。它还允许对受支持的 Dell 设备执行一对 一 Web 控制台启动,从而进一步执行故障排除、配置和管理活动。 有关设备支持的详细信息,请参阅“适用于 Nagios Core 的 Dell OpenManage 插件版本 2.0 用户指南”中的支持值表。 适用于 Nagios Core 的 Dell OpenManage 插件版本 2.
2 Dell SPI 版本 4.0 的新增功能 下表列出了 Dell SPI 版本 4.0 的新增特性和功能: 表.
3 主要功能 下表介绍了适用于 Nagios Core 的 Dell OpenManage 插件版本 2.0 的主要功能。 表.
4 支持值表 适用于 Nagios Core 的 Dell OpenManage 插件支持下表中列出的 Dell 设备。 Dell 数据中心可扩展解决方案 表. 3: 支持的 Dell 数据中心可扩展解决方案。 Dell 数据中心可扩展解决方案 (DSS) DSS 1500 DSS 1510 DSS 2500 Dell PowerEdge 服务器 表. 4: 支持的 Dell PowerEdge 服务器。 第 12 代 PowerEdge 服务器 第 13 代 PowerEdge 服务器 FM120x4 C4130 M420 C6320 M520 FC230 M620 FC430 M820 FC630 R220 FC830 R320 M630 R420 M830 R520 R430 R620 R530 R720xd R530xd R820 R630 R920 R730 T320 R730xd T420 R930 T620 T430 T630 Dell 机箱 表.
表. 5: 支持的 Dell 机箱。 (续) Dell PowerEdge FX2s Dell PowerEdge VRTX Dell PowerEdge M1000e Dell Compellent 存储阵列 表. 6: 支持的 Dell Compellent 存储阵列。 Compellent Series 40 Compellent SC4020 Compellent SC8000 Dell EqualLogic PS 系列存储阵列 表. 7: 支持的 Dell EqualLogic PS 系列存储阵列。 EqualLogic PS4100 EqualLogic PS6100 EqualLogic PSM4110 EqualLogic PS6210 EqualLogic PS6500 EqualLogic PS6510 Dell PowerVault MD 存储阵列 表.
5 设备查找和资源清册 主题: • • • • • • 关于设备查找 关于 Dell Device Discovery 公用程序 关于协议参数 查找 Dell 设备 设备信息 在 Nagios Core 控制台中查看 Dell 设备 关于设备查找 您可以在 Nagios Core 控制台中使用该插件查找受支持的 Dell 设备。受支持的 Dell 设备的监测协议如下: ● Dell 服务器使用 SNMP 协议或 WS-MAN 协议进行查找 注: 一次只能使用 SNMP 协议或 WS-MAN 协议查找 Dell 服务器,不能同时使用这两种协议。要使用 WS-MAN 协议重新查找 以前通过 SNMP 协议查找到的服务器,或者使用 SNMP 协议重新查找以前通过 WS-MAN 协议查找到的服务器,请使用 -f 选项和所需协议的参数运行查找脚本。 例如: 对于某个使用 SNMP 协议查找到的服务器,如果想使用 WS-MAN 协议查找该相同设备,请导航至 / dell/scripts,并运行以下 PERL 脚本: perl dell_device_discovery.
perl dell_device_discovery.pl -H | -F | -S [-P ] [-c ] [-t ] [f] [-d] 表. 9: Dell Device Discovery 公用程序选项 选项 简要说明 说明 -h 帮助 显示帮助文本。 -H 主机 主机 IP 地址或 FQDN 名称。 -S 子网 带掩码的子网。 -F 文件 绝对路径包含由换行符分隔的 IP 地址或 FQDN 名称列表的文件。 -P 协议 用于监测的协议。允许的选项有 1 (SNMP) 和 2 (WS-MAN)。 如果未使用 -P,将默认为使用 SNMP 协 议查找 Dell 服务器。 此值可选。 配置文件 -c 协议特定的配置文件。 默认文件 为 .dell_device_comm_params.
表. 10: 根据所选协议创建的默认服务 (续) 服务 SNMP WS-MAN 协议 Dell 服务器物理磁盘状态 √ √ Dell 服务器虚拟磁盘状态 √ √ Dell 服务器风扇状态 √ √ Dell 服务器电池状态 √ √ Dell 服务器侵入状态 √ √ Dell 服务器网络设备状态 √ √ Dell 服务器电压探测器状态 √ √ Dell 服务器控制器状态 √ √ Dell 服务器电流探测器状态 √ √ Dell 服务器 CPU 状态 √ X Dell 服务器电源设备状态 √ X Dell 服务器温度探测器状态 √ √ Dell 服务器 SD 卡状态 X √ Dell 服务器 FC NIC 状态 X √ Dell 服务器保修信息 √ √ 详细服务 表.
表. 12: 基于 SNMP 协议为 Dell Compellent 存储阵列创建的默认服务 (续) 服务 Dell Storage Compellent 整体运行状况状态 Dell Storage Compellent 信息 Dell Storage Compellent 管理陷阱 Dell Storage Compellent 控制器陷阱 Dell Storage Compellent 控制器整体运行状况状态 Dell Storage Compellent Controller 信息 详细服务 Dell Storage Compellent 物理磁盘状态 Dell Storage Compellent 卷状态 Dell Storage Compellent 控制器保修信息 表.
● Dell 服务器 FC NIC 状态 如果您不希望监测 Dell Server FC NIC Status 服务,只需用 # 在这一行的开头进行注释,如下所示: #Dell Server FC NIC Status 如此一来,在 Nagios Core 控制台中就不会为查找到的 Dell 服务器创建该服务。 关于协议参数 在查找过程中,根据您所选择的协议(SNMP 或 WS-MAN),您可以设置参数文件 .dell_device_comm_params.cfg 中协议的 值。 .dell_device_comm_params.cfg 文件位于以下位置:/dell/scripts。提供的选项如下: 表. 15: 参数文件 协议通信参数 说明 SNMP snmp.version 用于输入 SNMP 版本。默认版本为 2。 snmp.community 用于输入 SNMP 团体字符串的用户宏。 snmp.retries 用于输入超时发生时必须发送 SNMP 请求的次数。默认重试值 为 1。 snmp.
1. 使用 Nagios 管理员权限登录到 Nagios Core。 2. 导航至目录 /dell/scripts。 3. 通过选项 perl dell_device_discovery.pl -h 运行 Dell Device Discovery 公用程序 此时将显示脚本语法和有关选项的信息。有关更多信息,请参阅关于 Dell Discovery 公用程序。 根据您的要求,请执行以下操作: 注: 运行该公用程序之前,请确保已更新协议相关信息;有关更多信息,请参阅关于协议参数。 要使用 IP 地址或 FQDN 查找设备,请运行以下命令: ● perl dell_device_discovery.pl -H 要使用子网掩码进行查找,请运行以下命令: ● perl dell_device_discovery.pl -S 子网掩码的格式示例:11.98.149.0/24 要使用文件中的 IP 地址列表进行查找,请运行以下命令: ● perl dell_device_discovery.
表.
表.
2.
6 监测 Dell 设备 如下文中所述,您可以对 Dell 设备的多个方面进行监测。 主题: • • • Dell 设备的整体运行状况状态 监测 Dell 设备的组件运行状况 监测 SNMP 警报 Dell 设备的整体运行状况状态 您可以在 Nagios Core 控制台中监测 Dell 设备的整体运行状况状态。整体运行状况状态即受支持的 Dell 设备组件的汇总状态。 关于整体运行状况状态 设备整体运行状况状态根据配置的时间间隔定期轮询。默认情况下,整体运行状况状态服务计划为每小时运行一次。 表.
表.
表.
表.
表. 18: Dell 设备组件运行状况信息 (续) 服务 状态 说明 使用 WS-MAN 时显示 的属性 使用 SNMP 时显示的属 性 ● 大小(GB) ● 可用空间(GB) Dell 服务器 FC NIC 状 态 提供 Dell 服务器中 FC NIC 的整体运行状况状 态。 ● 连接状态 不可用 ● FQDD ● 固件版本 ● 链接速度 ● 名称 Dell 服务器保修信息 提供 Dell 服务器的保修 信息状态。 服务标签 服务级别详细信息 项目号 类型 发货日期 (UTC) 开始日期 (UTC) 结束日期 (UTC) 剩余天数 ● ● ● ● ● ● ● ● 表.
表.
表. 19: Dell 机箱组件运行状况信息 (续) 服务 状态 Dell 机箱 IO 模块状态 说明 使用 WS-MAN 时显示的属性 提供 Dell 机箱中的 IO 模块在最 ● 状态 坏情况下的运行状况状态汇 ● FQDD 总。 ● 名称 ● 部件号 ● 插槽 ● IPv4 地址 ● 结构类型 ● 启动 URL Dell 机箱插槽信息 提供 Dell 机箱中的插槽在最坏 情况下的运行状况状态汇总。 ● 状态 ● 插槽编号 ● 主机名 ● 型号 ● 服务标签 ● iDRACIP Dell 机箱 KVM 状态 Dell 机箱保修信息 提供 Dell 机箱中的 KVM(键 盘、视频、鼠标)在最坏情况 下的运行状况状态汇总。 ● 状态 提供 Dell 机箱的保修信息状 态。 ● ● ● ● ● ● ● ● ● 名称 服务标签 服务级别详细信息 项目号 类型 发货日期 (UTC) 开始日期 (UTC) 结束日期 (UTC) 剩余天数 表.
表. 20: Dell EqualLogic 组件运行状况信息 (续) 服务 状态 Dell Storage EqualLogic 组存 储池信息 说明 使用 WS-MAN 时显示的属性 提供存储池中所有 Dell EqualLogic 存储阵列在最坏情 况下的运行状况状态汇总。 ● 名称 ● 成员计数 ● 卷计数 Dell Storage EqualLogic 组保 修信息 服务标签 服务级别详细信息 项目号 类型 发货日期 (UTC) 开始日期 (UTC) 结束日期 (UTC) 剩余天数 提供 Dell EqualLogic 存储阵列 的保修信息状态。 ● ● ● ● ● ● ● ● 说明 使用 WS-MAN 时显示的属性 提供 Dell Compellent 存储阵列 中物理磁盘在最坏情况下的运 行状况状态汇总。 ● 状态 表.
Dell 机箱机柜状态仅显示机柜的主要状态。有关更多信息,请参阅 Dell.com/support 上提供的 Dell PowerEdge VRTX 机箱控制台 或 Dell PoweEdge VRTX 机箱用户指南。 注: 表. 23: 单位和说明 设备 说明 GHz 千兆赫兹 W 瓦特 GB 千兆字节 RPM 每分钟转数 A 安培 V 伏特 MB 兆字节 默认情况下,上述服务计划为每四个小时运行一次。 监测 Dell 设备的组件运行状况状态 要监测 Dell 设备的组件运行状况状态,请执行以下操作: 1. 在 Nagios Core 用户界面中的当前状态下,选择服务。 2.
表.
7 启动 Dell 设备特定的控制台 要为受支持的 Dell 设备启动控制台,请执行以下操作: 1. 在 Nagios Core 控制台中的当前状态下,选择以下任意一项: ● 主机 ● 服务 ● 主机组 > (执行额外的主机操作图标)(位于 Dell 设备旁边)。 2. 单击 随即会在新窗口中启动相应的 Dell 控制台。 主题: • Dell 设备及其控制台 Dell 设备及其控制台 您可以从受支持的 Dell 设备启动各种 Dell 控制台,从而获取所监测 Dell 设备的更多信息。 表.
8 Dell 设备的保修信息 使用该项功能可以访问查找到的 Dell 设备的保修信息。此功能可用于在 Nagios Core 控制台中监测 Dell 设备的保修详细信息。要获取 保修信息,必须具备活动的互联网连接。如果没有直接接入互联网而是使用代理设置接入,请确保解析 etc/hosts 文件中的主机名 api.dell.
• 查看保修信息 查看保修信息 在查看查找到的 Dell 设备的保修信息之前,请确保满足以下条件: ● 具有活动的互联网连接。 ● 正确配置了 dell_pluginconfig.cfg 文件(位于 Dell_OpenManage_Plugin > resources 文件夹)中的保修报告参数。 ● RemainingDaysWarning 和 RemainingDaysCritical 的值进行了适当配置。否则保修将处于未知状态。 ● 查找到的设备具备有效的服务标签。 成功查找设备后,其保修信息将显示在状态信息列。要查看 Dell 设备的详细信息,请执行以下操作: 1. 查找 Dell 设备。 2.
9 移除 Dell 设备 您可以移除不想监测的 Dell 设备。 1. 导航至 /dell/config/objects,然后删除相应的 .cfg 文件。 2.
10 所生成警报的知识库 (KB) 消息 在 Nagios Core 控制台中,您可以根据查找到的 Dell 设备的 KB 消息,获取该设备生成的 SNMP 警报的更多信息。 查看 KB 信息 要查看查找到的 Dell 设备所生成 SNMP 警报的 KB 消息,请执行以下步骤: 1. 登录 Nagios Core 控制台。 2. 在左侧窗格中,单击当前状态下的服务。 3. 导航至服务下的相应设备的陷阱或警报,右键单击状态信息下的更多信息超链接,然后选择在新选项卡中打开。 相应设备的 KB 消息将显示在新选项卡中。 4. 在 KB 消息页面,搜索相应的事件 ID 或 Nagios Core 控制台中显示的 KB 消息,进一步查看此警报的详细信息。 例如: 要查看机箱陷阱的 KB 消息,请执行以下操作: 1. 向下滚动到服务下的 Dell 机箱陷阱,右键单击状态信息下的更多信息超链接,然后选择在新选项卡中打开。 2.
11 故障排除 本节列出了使用适用于 Nagios Core 的 Dell OpenManage 插件时可能遇到的问题及其解决方法。 确保满足要求,或执行本节中列出的步骤。 适用于 Nagios Core 的 Dell OpenManage 插件安装脚本失败 1. 您有足够的权限运行该脚本。 推荐:Nagios 管理员。 2. 满足安装指南中提到的前提条件。 3. 为安装脚本提供了正确的输入。 适用于 Nagios Core 的 Dell OpenManage 插件卸载脚本失败 1. 您有足够的权限运行该脚本。 推荐:Nagios 管理员。 2. 卸载脚本从 Dell OpenManage 插件的安装位置运行。 查找脚本无法执行 1. 查找脚本具有相应的权限。 推荐:Nagios 管理员。 2. 运行脚本时提供相应的参数。 所选协议为 1 (SNMP) 时,查找脚本没有为 IPv4 或 IPv6 地 址或主机创建主机和服务定义文件 1. 2. 3. 4.
所选协议为 2 (WS-MAN) 时,查找脚本没有为 IPv4 或 IPv6 地址或主机创建主机和服务定义文件 1. OpenWSMAN 及其 Perl 绑定已安装。 2. IP 地址或主机可访问。 3. 运行查找之前,在以下文件中已正确配置相应的协议凭据: dell_resource.cfg .dell_device_comm_params.cfg 4. 对于 IPv6 地址,请确保 Perl 模块 Socket6 安装在相同的 Perl 库路径中。 5. 至少有一项适用的服务在以下服务模板中已启用: dell_server_services_template.cfg 。 Dell 设备的 IP 地址或主机名在查找设备后更改 移除旧的配置文件,然后使用新的 IP 地址或主机名重新查找 Dell 设备。 Nagios Core 控制台没有显示使用 Dell 查找脚本查找到的 Dell 设备 1. 主机和服务定义文件位于 /dell/config/objects 文件夹中。 2. 运行查找后,Nagios 服务已重新启动。 3.
2. 提供的 IP 地址或主机可访问。 3. IP 地址或主机上已启用 SNMP。 4. 在以下文件中已正确配置相应的 SNMP 参数: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage 插件特定服务显示消息“与主机通信时发 生 WSMAN 错误” 1. 已安装 OpenWSMAN 及其 Perl 绑定和 Net-IP。 2. 提供的 IP 地址或主机可访问。 3. 在以下文件中已正确配置相应的 WS-MAN 参数: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage 插件特定服务显示消息“组件信息 = 未 知” 注: 如果组件在查找到的 Dell 设备中不可用,则这是预期的消息。 如果组件可用但您仍收到此消息,则此消息是由于协议超时。在 .dell_device_comm_params.cfg 文件中设置所需的协议特定 超时值。 无法查看 Nagios Core 控制台中 Dell 设备生成的 SNMP 警报 1.
有关下载和安装 RACADM 的更多信息,请转至“en.community.dell.com/techcenter/systems-management/w/wiki/3205.racadmcommand-line-interface-for-drac”。 无法在 Nagios Core 控制台中监测查找到的 Dell 设备的保修 信息 ● 确保具有活动的互联网连接。如果未直接接入互联网而是使用代理设置接入,请确保解析 etc/hosts 文件中的主机名 api.dell.com。 如果仍无法查看保修信息,应确保系统上安装了 Java 版本 1.6 或更高版本。如果是在安装 Dell 插件后安装 Java,请执行以下步骤: 1. 安装 JAVA。 2. 导航至 /dell/install,然后运行以下命令: install.sh java 3. 重新启动 Nagios Core 服务。 4.
12 常见问题 1. 问:能否提供有关适用于 Nagios Core 的 Dell OpenManage 插件许可的信息? 答:您可以免费安装和使用此插件。 2. 问:该插件支持哪些 Dell 硬件型号? 答: 有关支持的 Dell 平台的列表,请参阅支持值表。 3. 问:我的数据中心内有早期的各代服务器(第 9 代 - 第 11 代)。我是否仍可使用该插件监测这些服务器? 答:不可以。您无法使用此插件监测早期的各代服务器(第 9 代到第 11 代)。使用此插件,您只能通过 iDRAC with LC 监测 Dell 服务器,即支持第 12 代及以后各代 Dell PowerEdge 服务器。Nagios Exchange 中提供其他插件,您可以使用这些插件监测早期的 各代服务器。 4.
A 附录 使用 iDRAC Web 控制台配置 iDRAC 的 SNMP 参数 1. 启动 iDRAC(第 12 代以及更高版本的 Dell PowerEdge 服务器)Web 控制台,然后导航至控制台中的网络 > 服务。 2. 配置 SNMP 代理属性: a. 将“已启用”设置为 True,将 SNMP 协议设置为 All (SNMP v1/v2/v3)。 b. 使用团体字符串设置 SNMP 团体名称。 c. 单击应用提交配置。 注: 本插件仅使用 SNMP v1 或 SNMP v2 协议与 iDRAC 通信。 使用 RACADM 脚本配置 iDRAC 的 SNMP 参数 1. 通过运行以下 ssh 命令启动 iDRAC RACADM CLI: ssh root@ 2. 通过运行以下命令将命令模式更改为 racadm: racadm 3. 通过运行以下命令设置 SNMP 团体字符串: racadm set idrac.SNMP.AgentCommunity 4. 通过运行以下命令启用 SNMP 代理: racadm set idrac.SNMP.
● 根据要求配置团体字符串和 IP 目标列表部分底部的 SNMP 警报端口号,然后单击应用。 ● 在 SNMP 陷阱格式部分,选择所需的 SNMP 陷阱格式,然后单击应用。 使用 RACADM 配置 iDRAC 的 SNMP 陷阱目标地址 1. 通过运行以下 ssh 命令启动 iDRAC RACADM CLI: ssh root@ 2. 通过运行以下命令将命令模式更改为 racadm: racadm 3. 运行以下命令,设置用于接收警报的 iDRAC SNMP 端口: racadm set idrac.SNMP.AlertPort 4. 运行以下命令,启用 SNMP 监测协议: racadm set idrac.SNMP.TrapFormat (<陷阱格式>的值:0– SNMPv1,1–SNMPv2,2–SNMPv3) 5. 运行以下命令,设置 SNMP 陷阱目标: racadm set iDRAC.SNMP.Alert.DestAddr.