适用于 Nagios Core 的 Dell EMC OpenManage 插 件版本 3.
注、小心和警告 注: “注”表示帮助您更好地使用该产品的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并说明如何避免此类问题。 警告: “警告”表示可能会造成财产损失、人身伤害甚至死亡。 © 2015 -2018 Dell Inc. 或其子公司。保留所有权利 Dell、EMC 和其他商标为 Dell Inc. 或其子公司的商标。其他商标均为其各自所有者的商标。 2018 - 04 Rev.
目录 1 适用于 Nagios Core 的 Dell EMC OpenManage 插件版本 3.0 简介................................................................. 5 2 Dell EMC OpenManage 插件版本 3.0 的新增功能.......................................................................................... 6 3 主要功能........................................................................................................................................................8 4 Support matrix.....................................................................................
保修信息的属性.............................................................................................................................................................. 36 配置 Dell EMC 保修信息的参数....................................................................................................................................36 查看保修信息...................................................................................................................................................................
1 适用于 Nagios Core 的 Dell EMC OpenManage 插 件版本 3.0 简介 本指南提供了有关使用适用于 Nagios Core 的 Dell EMC OpenManage 插件版本 3.0 的信息及其各种功能,例如查找、监测、启动控制 台以及对受支持的 Dell EMC 设备进行故障排除。本指南还提供受支持的 Dell EMC 设备和客户常见问题的详细信息。 此插件提供监测 Nagios Core 管理的环境中的 Dell EMC 设备的功能。此插件可让您全面了解 Dell EMC 设备的硬件级信息,包括总体 和组件级运行状况监测。该插件提供了 Dell EMC 设备的基本资源清册信息和事件监测。插件还支持一对一 Web 控制台启动受支持的 Dell EMC 设备,以执行进一步的故障排除、配置和管理活动。 有关设备支持的详细信息,请参阅“适用于 Nagios Core 的 Dell EMC OpenManage 插件版本 3.0 用户指南”中的“支持值表”。 适用于 Nagios Core 的 Dell EMC OpenManage 插件版本 3.
2 Dell EMC OpenManage 插件版本 3.0 的新增功能 下表列出了 Dell EMC OpenManage 插件版本 3.0 的新特性和功能: 表. 1: 新特性和功能 新增特色 说明 对新的 Dell EMC 设备的支持 使用此版本可以查找和监测的新型 Dell EMC 设备如下: • 新推出的第 14 代 Dell EMC PowerEdge 服务器(通过 Integrated Dell Remote Access Controller (iDRAC) with Lifecycle Controller (LC) 进行) • OEM 服务器 • Dell EMC 网络交换机 有关设备支持的详细信息,请参阅“适用于 Nagios XI 的 Dell EMC OpenManage 插件版本 3.
新增特色 说明 查看保修信息 此功能可让您查看 OEM 服务器和 Dell EMC 网络交换机的保修信息。 查看知识库 (KB) 消息 您可以通过与这些警报关联的知识库文章,获取有关 SNMP 警报的更多信息。您可以查看 OEM 服务器和 HCI 平台的知识库消息。 Dell EMC OpenManage 插件版本 3.
3 主要功能 下表介绍了适用于 Nagios Core 的 Dell EMC OpenManage 插件版本 3.0 的主要功能。 表.
4 Support matrix Dell EMC OpenManage Plug-in version 3.0 for Nagios Core supports the Dell EMC devices as listed in the following tables. Datacenter Scalable Solutions Table 3. Supported Datacenter Scalable Solutions. Datacenter Scalable Solutions (DSS) DSS 1500 DSS 1510 DSS 2500 Hyper-converged Infrastructure (HCI) Platforms Table 4.
PowerEdge Servers Table 5. Supported PowerEdge Servers.
Compellent SC-Series Storage Arrays Table 7. Supported Compellent Storage Arrays. Compellent Series 40 Compellent SC4020 Compellent SC5020 Compellent SC7020 Compellent SC8000 Compellent SC9000 EqualLogic PS-Series Storage Arrays Table 8. Supported EqualLogic PS-Series Storage Arrays.
Dell EMC Network Switches Table 10.
5 设备查找和资源清册 主题: • About device discovery • About Dell EMC device discovery utility • 查找 Dell EMC 设备 • 设备信息 About device discovery You can discover the supported Dell EMC devices with this plug-in in the Nagios Core console. The monitoring protocols for the supported Dell EMC devices are as follows: • Dell EMC Servers are discovered using SNMP or WSMan protocol or Redfish REST APIs. • Dell EMC Chassis are discovered using WSMan protocol.
About Dell EMC device discovery utility To run the Dell Device Discovery Utility, navigate to /dell/scripts, and run the following Python command: python dellemc_nagios_discovery_service_utility.py -h All the available Dell EMC device discovery utility options are displayed. Table 11. Dell EMC Device Helper Utility options Options Description -h Displays the help message. --host Host IP address or HostName to be discovered.
Options Description --force --force rewrites the config file. --warranty.criticalDays Warranty critical days. Allowed value is [1-365]. Default value is 10. NOTE: The value of Warranty critical days should be less than Warranty warning days. --warranty.warningDays Warranty warning days. Allowed value is [1-365]. Default value is 30. --nagios.type Decides the output format of the host file. Allowed options is 0 for .cfg format and 1 for .xml format. Default values is 0. Table 12.
Services SNMP WSMan Protocol Redfish Protocol Dell EMC Server Physical Disk Status √ √ X Dell EMC Server Virtual Disk Status √ √ X Dell EMC Server Fan Status √ √ √ Dell EMC Server Battery Status √ √ X Dell EMC Server Intrusion Status √ √ X Dell EMC Server Network Device Status √ √ √ Dell EMC Server Voltage Probe Status √ √ √ Dell EMC Server Controller Status √ √ √ Dell EMC Server Amperage Probe Status √ √ X Dell EMC Server CPU Status √ √ √ Dell EMC Server Power Su
Services Dell EMC Chassis PCIe Devices Status (This service is applicable to PowerEdge VRTX Chassis and PowerEdge FX2/FX2s Chassis only) Table 15.
Services Basic Services Dell EMC Storage PS-Series Group Information Dell EMC Storage PS-Series Member Traps Dell EMC Storage PS-Series Member Group Traps Detailed Services Dell EMC Storage PS-Series Member Physical Disk Status Dell EMC Storage PS-Series Group Volume Status Dell EMC Storage PS-Series Group Storage Pool Status Dell EMC Storage PS-Series Group Storage Pool Information Dell EMC Storage PS-Series Member Warranty Information Table 18.
• 要使用文件路径通过 WSMAN 协议/ Redfish REST API 查找: python dellemc_nagios_discovery_utility.py --file= --http.user=root -http.password=calvin --output.file=/usr/local/nagios/dell/config/objects/ • 要使用子网掩码通过 SNMP 或 WSMan 协议/ Redfish REST API 查找: python dellemc_nagios_discovery_utility.py --subnet= --snmp.version=2 -http.user=root --http.password=calvin --output.
服务 状态 • 严重 • 警告 说明 显示的属性 注: “机箱标签”仅适用 于模块化服务器,“节点 ID”仅适用于 PowerEdge FM120x4 注: “系统配置锁定模 式”、“iDRAC 组管理 器状态”和“iDRAC 组 名称”仅适用于第 14 代 服务器 Dell EMC 机箱信息 • 型号 • 操作系统名称 • 操作系统版本 • iDRAC URL • iDRAC 固件版本 • 服务主机 FQDN • VMM URL • 系统配置锁定模式 • iDRAC 组名称 • iDRAC 组管理器状态 • 确定 • 未知 • 严重 • CMC 固件版本 • 警告 • CMC URL • 整体控制器 • 服务标签 此服务提供 Compellent Controller IP 的基本设备资源清 册信息。 服务标签 机箱名称 型号名称 • 未知 • 主控制器 • 严重 • 控制器名称 • 警告 • 型号名称 • Compellent URL • 整体 Storage Center Dell
服务 状态 Dell EMC Storage PS 系列组信 可能为以下状态: 息 • 确定 Dell EMC Storage MD 系列信 息 Dell EMC 网络交换机信息 说明 此服务提供 EqualLogic 组的基 本设备资源清册信息 显示的属性 • RAID 状态 • 固件版本 • RAID 策略 • 组名称 • 组 IP • 存储池 • 容量 (GB) • 组名称 • 成员计数 • 未知 • 卷数 • 严重 • 组 URL • 警告 • 确定 • 未知 此服务提供 PowerVault MD• Series 存储阵列的基本设备资源 • 清册信息 • • 严重 • 全球 ID • 警告 • 存储设备名称 • 主机名 可能为以下状态: 可能为以下状态: 此服务提供网络交换机的基本 信息。 整体存储阵列 服务标签 产品 ID • 确定 • 型号 • 未知 • 服务标签 • 严重 • 序列号 • 警告 • MAC 地址 • 管理 IP • 固件版本 有关各
6 监测 Dell EMC 设备 如下文中所述,您可以对 Dell EMC 设备的多个方面进行监测。 主题: • Dell EMC 设备的整体运行状况状态 • 监测 Dell EMC 设备的组件运行状况 • 监测 SNMP 警报 Dell EMC 设备的整体运行状况状态 在 Nagios Core 控制台中,您可以监测 Dell EMC 设备的整体运行状况状态。整体运行状况状态是受支持的 Dell EMC 设备组件的汇总 状态。 运行状况实例 您可以使用 Nagios Core 控制台来监测所有 Dell EMC 设备的运行状况实例。运行状况实例指示已查找到的 Dell EMC 设备的运行状况 状态。实例显示在状态信息选项卡下。 默认情况下,会在 Nagios Core 控制台中显示已查找到的设备的不正常实例。根据监测要求,您可以在主机配置文件中更改 -excludeinstance 的值。更改值后,重新启动 Nagios 服务。 注: 要在 Nagios Core 控制台查看 Dell EMC 设备的任何服务的所有实例,请导航至 /dell/config/ obje
服务 状态 说明 使用 WSMan 时显示 的属性 使用 SNMP 时显示的 属性 • 未知 • 风扇 • 侵入 • 严重 • 侵入 • 内存 • 内存 • 电池 • 电池 • CPU • CPU • 温度 • 温度 使用 Redfish 时显示的 属性 Dell EMC 机箱整 体运行状况状态 提供 Dell EMC 机箱的全局运 行状况状态。 整体机箱 不可用 不可用 Dell EMC Storage PS 系列成员整体 运行状况 提供 EqualLogic 存 储阵列的全局 运行状况状 态。 不可用 整体成员 不可用 Dell EMC Storage SC 系列整体运行 状况状态 提供 Compellent 存 储阵列的全局 运行状况状 态。 不可用 整体 Storage Center 不可用 Dell EMC Storage SC 系列控制器整 体运行状况状态 提供 Compellent 存 储阵列控制器 的全局运行状 况状态。 不可用 整体控制器 不可用 Dell EMC Storage MD 系
监测 Dell EMC 设备的组件运行状况 您可以监测受支持的 Dell EMC 设备个别组件的运行状况。 About monitoring component health of Dell EMC devices This is a periodic poll based health monitoring of a Dell EMC device’s component level health status. Once the discovery utility is run with the relevant option, the corresponding services are created. These services run periodically and update the overall health of the components. The component’s status and information are displayed in the Nagios Core user interface.
Service Dell EMC Server Fan Status Dell EMC Server Intrusion Status Dell EMC Server Network Device Status Dell EMC Server CPU Status Dell EMC Server Power Supply Status Status Description Provides overall health status of the fans in Dell EMC Server without considering the redundancy status. Provides overall health status of the chassis intrusion in Dell EMC Servers. Provides the worst case aggregate health status of the NIC in Dell EMC Servers.
Service Status Description Attributes displayed Attributes displayed when using WSMan when using SNMP voltage probe in Dell • EMC Servers. Provides the worst case aggregate health status of the storage controllers in Dell EMC Servers. Dell EMC Server Controller Status Provides overall health status of the amperage probe in Dell EMC Servers.
Service Status Description Applicable only to PowerEdge VRTX chassis. Dell EMC Chassis PCIe Devices Status Dell EMC Chassis Fan Status Dell EMC Chassis Power Supply Status Dell EMC Chassis Controller Status Applicable only to PowerEdge VRTX chassis. Dell EMC Chassis Enclosure Status Applicable only to PowerEdge VRTX chassis.
Service Status Dell EMC Chassis IO Module Status Description Attributes Displayed Provides the worst case aggregate health status of the IO module in Dell EMC Chassis.
Service Status Description Attributes Displayed • Provides the worst case • aggregate health status of the EqualLogic Group volume status. • Dell EMC Storage PS-Series Group Volume Status Dell EMC Storage PS-Series Group Storage Pool Information Provides warranty information status for the EqualLogic storage arrays. Status Name • TotalSize(GB) • AssociatedPool Provides the worst case • aggregate health status of all the • EqualLogic storage arrays in a storage pool.
Table 25. PowerVault MD warranty information Service Status Description Dell EMC Storage MD-Series Warranty Information The following states are possible: Provides warranty information status for the PowerVault MD • OK storage arrays. • Warning Attributes Displayed when using SNMP • ServiceTag • Service Level Details • Item number Device Type • Unknown • • Critical • Ship Date(UTC) • Start Date(UTC) • End Date(UTC) • Days Remaining Table 26.
Service Dell EMC Network Switch Warranty Information Description Provides warranty information status for the Dell EMC Network Switch Attributes Displayed when using SNMP • Type • Name • ServiceTag • Service Level Details • Item Number • Device Type • Ship Date • Start Date • End Date • Days Remaining NOTE: For more information about monitoring the health of the Compellent controllers, see the specific Dell Compellent Controllers User’s Guide at Dell.com/support.
Viewing Dell EMC devices in the Nagios Core console To view the Dell EMC devices in the Nagios Core console, ensure that the devices are already discovered and inventoried. You can view the discovered Dell EMC devices in Nagios Core in the Hosts or the Services view: 1 To view the hosts in the Nagios Core, select Hosts under Current Status in the left pane. The hosts are displayed in the right pane.
监测 SNMP 警报 关于 SNMP 警报监测 您可以异步接收从设备转发的 SNMP 警报。 收到 SNMP 警报后,相应设备的服务将在 Nagios Core 控制台中显示警报摘要消息以及上次接收的警报的严重性。 表.
服务 状态 • Dell EMC Storage MD 系列陷阱 Dell EMC 网络交换机陷阱 说明 未知 可能为以下状态: • 确定 • 警告 • 严重 • 未知 可能为以下状态: • 确定 • 警告 • 严重 • 未知 提供 PowerVault MD 系列存储阵列的陷阱 信息。 提供 Dell EMC 网络交换机的陷阱信息。 查看 SNMP 警报 前提条件: • 具有 SNMPTT 的 Nagios Core 已安装和配置,并且 SNMPTT 上的 Dell 集成已配置。 • 在支持的 Dell EMC 设备中通过 Nagios Core 服务器配置了 SNMP 陷阱目标。 注: 要接收来自 PowerVault MD 34/38 系列存储阵列的 SNMP 陷阱,必须在 Modular Disk Storage Manager (MDSM) 控制台 中为该设备配置 SNMP 陷阱目标。 有关在 iDRAC 界面中配置 SNMP 陷阱目标的信息,请参阅附录。 要查看 SNMP 警报,请执行以下操作: 在 Nagios Core 用户界面中,选择
7 启动 Dell EMC 设备特定的控制台 要为受支持的 Dell EMC 设备启动控制台: 1 2 在 Nagios Core 控制台中的当前状态下,选择以下任意一项: • 主机 • 服务 • Host Group(主机组) > () 单击 Dell EMC 设备旁边的 (执行额外的主机操作图标)。 随即会在新窗口中启动相应的 Dell EMC 控制台。 Dell EMC 设备及其控制台 您可以从受支持的 Dell EMC 设备启动各种 Dell EMC 控制台,从而获取所监测 Dell EMC 设备的更多信息。 表.
8 Dell EMC 设备的保修信息 使用此功能,您可以访问查找到的 Dell EMC 设备的保修信息。此功能允许您在 Nagios Core 控制台中监测 Dell EMC 设备的保修详细 信息。检索保修信息需要活动的 Internet 连接。如果未直接接入互联网而是使用代理设置接入,请确保解析主机名 api.dell.
查看保修信息 在查看查找到的 Dell EMC 设备的保修信息之前,请确保满足以下条件: • 具有活动的互联网连接。 • 查找到的设备具备有效的服务标签。 成功查找设备后,其保修信息将显示在状态信息列。要查看 Dell EMC 设备的详细信息: 1 查找 Dell EMC 设备。 2 单击服务下的 < Dell EMC 设备> 保修信息。 所选设备的详细信息显示在服务状态信息页面。 例如: 要查看 VRTX 机箱的保修服务信息,请单击 Dell EMC 机箱保修信息。 注: EqualLogic 存储阵列的保修服务仅关联 EqualLogic 成员 IP。 Compellent 存储阵列的保修服务仅关联 Compellent 控制器 IP。 Dell EMC 设备的保修信息 37
9 卸下 Dell EMC 设备。 您可以移除不想监测的 Dell EMC 设备。 1 导航到 /dell/config/objects,并删除相应的 .
10 Knowledge Base messages for the generated alerts You can get more information about the SNMP alerts generated by the discovered Dell EMC devices from the KB messages for that device in the Nagios Core console. Viewing KB messages To view the KB messages for an SNMP alert generated by a discovered Dell EMC device complete the following steps: 1 Log in to the Nagios Core console. 2 In the left pane, click on Services under Current Status.
11 故障排除 本节列出了使用适用于 Nagios Core 的 Dell EMC OpenManage 插件时可能遇到的问题及其解决方法。 确保满足要求,或执行本节中列出的步骤。 对于 Ubuntu 设置,无法从 Nagios Core 控制台中的 Dell EMC 设备接收 SNMP 陷阱。 解决办法:将 /libexec/eventhandlers/submit_check_result 中的 #!/bin/sh 替换为 #!/bin/bash,然后重新启动 SNMPTT and Nagios 服务。 Nagios 控制台无法获取 eqlMemberGatewayIPAddrChanged 陷阱 解决办法:更改 EqualLogic 成员网关 IP 地址后,您需要确保从 EqualLogic 成员或 EqualLogic 组到陷阱侦听器的连接可用。 适用于 Nagios Core 的 Dell EMC OpenManage 插件安 装脚本失败 1 您有足够的权限运行该脚本。 推荐:Nagios 管理员。 2 满足安装指南中提到的前提条件。 3 为安装脚本提供了正
查找脚本没有为 IPv4 或 IPv6 地址或主机创建主机和 服务定义文件 1 OMSDK 已安装。 2 IP 地址或主机可访问。 3 指定的 IP 地址或主机上已启用 SNMP 或 WSMan 或 Redfish。 4 在查找期间传递了相应的协议参数。 Dell EMC 设备的 IP 地址或主机名在查找设备后更改 移除旧的配置文件,然后使用新的 IP 地址或主机名重新查找 Dell EMC 设备。 Nagios Core 控制台没有显示使用 Dell EMC 查找脚本 查找到的 Dell EMC 设备 1 主机和服务定义文件位于 /dell/config/objects 文件夹中。 2 运行查找后,Nagios 服务已重新启动。 3 主机和服务定义文件具有相应的权限。 Nagios Core 控制台没有显示使用 Dell EMC 查找脚本 查找到的 Dell EMC 设备的陷阱服务 1 SNMPTT 已安装。 2 如果未安装 SNMPTT,则不会为任何查找到的 Dell EMC 设备创建服务。 3 安装 SNMPTT 后,请确保执行陷阱集成。
Dell EMC OpenManage 插件特定服务显示消息“组件信息 = 未知” 注: 如果组件在查找到的 Dell EMC 设备中不可用,则这是预期的消息。 如果组件可用但您仍收到此消息,则此消息可能是由于协议超时。在位于 /dell/config/objects 的主机配置 文件中设置所需的协议特定超时值。 无法查看 Nagios Core 控制台中 Dell EMC 设备生成的 SNMP 警报 1 执行陷阱集成,从 /dell/install 运行以下命令: ./install.sh trap 2 二进制文件 /libexec/eventhandlers/submit_check_result 存在。 3 陷阱配置文件 Dell_Agent_free_Server_Traps.
要更新上述配置文件中的新的 IP 地址,请运行以下命令并重新启动 SNMPTT 服务: sed -i s///g /dell/config/templates/Dell*_Traps.
12 常见问题 1 问:能否提供有关适用于 Nagios Core 的 Dell EMC OpenManage 插件许可的信息? 答:您可以免费安装和使用此插件。 2 问:该插件支持哪些 Dell EMC 硬件型号? 答:有关支持的 Dell EMC 平台的列表,请参阅支持值表。 3 问:我的数据中心中配备了更早一代的服务器(第 9 代 - 第 11 代)。我仍然能够使用插件监测这些服务器吗? 答:不可以,您无法使用此插件监测较早几代的服务器(第 9 代 - 第 11 代)。您仅可以通过 iDRAC with LC 监测 Dell 服务器, 支持使用此插件监测第 12 代和更高版本的 PowerEdge 服务器。Nagios Exchange 中提供其他插件,让您可以监测较早一代的服 务器。 4 问:监测 Dell 服务器的带内与带外 (OOB) 方法有什么区别? 答:有两种方法可监测 Dell 服务器,一种是使用带内方法(通过将名为 OpenManage Server Administrator (OMSA) 的软件安装到 服务器操作系统上),另一种是带外方法(通过 iDRAC with LC
A 附录 使用 iDRAC Web 控制台配置 iDRAC 的 SNMP 参数 1 启动 iDRAC(第 12 代和第 13 代 PowerEdge 服务器)Web 控制台,然后导航至控制台中的 iDRAC 设置 > 网络 > 服务。 对于第 14 代 PowerEdge 服务器,启动 iDRAC Web 控制台并导航至 iDRAC 设置 > 服务 2 配置 SNMP 代理属性: a 将“已启用”设置为 True,将 SNMP 协议设置为 All (SNMP v1/v2/v3)。 b 使用团体字符串设置 SNMP 团体名称。 c 单击应用提交配置。 注: 本插件仅使用 SNMP v1 或 SNMP v2 协议与 iDRAC 通信。 使用 iDRAC Web 控制台配置 iDRAC 的 SNMP 陷阱目 标地址 对于第 12 代和第 13 代 PowerEdge 服务器。 1 登录到 iDRAC。 2 选择 概览 > 警报。 3 在右侧窗格中,执行以下操作: • 在警报部分中,启用 警报。 • 在警报筛选器部分中,选择类别和严重性下所需的字段。 • 在警报和远程系统日志配