适用于 Nagios Core 的 Dell OpenManage 插件 版本 1.
注、小心和警告 注: “注”表示可以帮助您更好地使用计算机的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并说明如何避免此类问题。 警告: “警告”表示可能会造成财产损失、人身伤害甚至死亡。 版权所有 © 2015 Dell Inc. 保留所有权利。 本产品受美国、国际版权和知识产权法律保护。 Dell™ 和 Dell 徽标是 Dell Inc. 在美国和 / 或其他管辖区域的商标。所有此处提及的其他商标和产品名称可能是其各自所属公司的商标。 2015- 01 Rev.
目录 1 适用于 Nagios Core 的 Dell OpenManage 插件版本 1.0 简介......................... 5 2 支持值表.................................................................................................................. 6 Dell PowerEdge 服务器......................................................................................................................... 6 3 设备查找和资源清册............................................................................................... 7 关于设备查找.....................................................
Nagios Core 控制台没有显示使用 Dell 查找脚本查找到的 Dell 设备的陷阱服务................................21 Dell OpenManage 插件特定服务显示消息“创建 SNMP 会话时出错”.................................................. 21 Dell OpenManage 插件特定服务显示消息“与主机通信时发生 WSMAN 错误”....................................22 Dell OpenManage 插件特定服务显示消息“组件信息 = 未知”............................................................. 22 无法查看 Nagios Core 控制台中 Dell 设备生成的 SNMP 警报............................................................22 接收 Dell 设备警报后整体运行状况状态没有刷新....................
适用于 Nagios Core 的 Dell OpenManage 插件版本 1.0 简介 1 本指南提供了有关使用适用于 Nagios Core 的 Dell OpenManage 插件版本 1.0 及其各种功能(例如查找、监 测、启动控制台以及对支持的 Dell 设备进行故障排除)的信息。本指南还详细介绍了支持的 Dell 设备以及客 户常见问题。 通过使用 Integrated Dell Remote Access Controller (iDRAC) with Lifecycle Controller (LC),适用于 Nagios Core 的 Dell OpenManage 插件版本 1.0 能够在数据中心内通过无代理带外方法监测第 12 代及以后各代 Dell PowerEdge 服务器。 本插件提供的功能特色如表 1 中所述。 表.
2 支持值表 适用于 Nagios Core 的 Dell OpenManage 插件支持下表中列出的 Dell 设备。 Dell PowerEdge 服务器 注: 在 PowerEdge 服务器名称格式 yxxx 中;y 表示字母(其中 M 表示模块化,R 表示机架式,T 表示 塔式),而 x 表示数字。 yx2x 系统 yx3x 系统 PowerEdge M820 PowerEdge M630 PowerEdge M620 PowerEdge R730XD PowerEdge M520 PowerEdge R730 PowerEdge M420 PowerEdge R630 PowerEdge R920 PowerEdge R530 PowerEdge R820 PowerEdge R430 PowerEdge R720xd PowerEdge T630 PowerEdge R620 PowerEdge T430 PowerEdge R520 PowerEdge FC630 PowerEdge R420 PowerEdge R320 PowerEdge R220
3 设备查找和资源清册 关于设备查找 您可以使用无代理查找方法通过本插件查找第 12 代及以后各代 Dell PowerEdge 服务器。您可以选择 SNMP 或 WS-MAN 协议。 只能使用 SNMP 或 WS-MAN 协议(两者不能同时使用)一次查找一个特定的 Dell 设备。 您必须使用 Dell Device Discovery 公用程序查找 Dell 设备。如果查找成功,则创建查找到的设备、主机和服 务定义文件。对于设备,建议具有唯一的主机名和 IP 地址。在 Nagios Core 中,确保您要查找的服务器的主 机和服务定义不存在。 您可以使用以下任意一项来查找设备: • 设备的 IP 地址或 FQDN • 子网掩码 • 包含设备 IP 地址或 FQDN 列表的文件 关于 Dell Device Discovery 公用程序 要运行 Dell Device Discovery 公用程序;您必须从位置:/dell/scripts 运行以下 PERL 脚本: perl dell_agent_free_server_discovery.
选项 简要说明 说明 -F 文件 用于输入文件名及绝对路径。该文 件必须包含以一个新行分隔的主机 设备 IP 地址或 FQDN 列表。 -P 协议 SNMP 或 WS-MAN 协议的选项。 -c 配置文件 用于配置协议参数。默认文件 为 .dell_device_comm_params. cfg。有关更多信息,请参阅关于 协议参数。 -t 模板 用于指定服务模板文件及绝对路 径。默认文件为 dell_server_services_temp late.cfg -f 强制 用于覆盖现有主机配置文件。 -d 所有服务 用于监测所有服务。如果不带此选 项运行公用程序,则创建三项基本 服务。有关更多信息,请参阅表 3. 根据所选协议创建的默认服务。 根据查找过程中您所选择的选项,将运行以下服务: • • 如果运行 perl dell_agent_free_server_discovery.
服务 SNMP WS-MAN 协议 Dell 服务器风扇状态 √ √ Dell 服务器电池状态 √ √ Dell 服务器侵入状态 √ √ Dell 服务器网络设备状 态 √ √ Dell 服务器 CPU 状态 √ X Dell 服务器电源设备状 态 √ X Dell 服务器温度探测器 状态 √ X Dell 服务器电压探测器 状态 √ X Dell 服务器控制器状态 √ X Dell 服务器电流状态 √ X Dell 服务器 SD 卡状态 X √ 关于协议参数 在查找过程中,根据您所选择的协议(SNMP 或 WS-MAN),您可以设置参数文 件 .dell_device_comm_params.cfg 中协议的值。 .dell_device_comm_params.cfg 文件位于以下位置:/dell/scripts。提供的选项如 下: 表. 4: 参数文件 协议通信参数 说明 SNMP snmp.version 用于输入 SNMP 版本。默认版本为 2。 snmp.
协议通信参数 说明 wsman.retries 用于输入超时发生时必须发送 WS-MAN 请求的次 数。默认重试值为 2。 注: 您可以在以下位置提供的文件 snmp.community 中配置用户宏 wsman.username、 wsman.password 和 dell_resources.cfg:/dell/resources/。 查找 Dell 服务器 您可以使用 Dell 插件查找第 12 代及以后各代 Dell PowerEdge 服务器。 前提条件: • 如果您使用 SNMP 协议进行查找,请确保已启用 SNMP 版本 1 或 SNMP 版本 2c,团体字符串在 iDRAC 中已设置且已配置。有关更多信息,请参阅附录。 • Nagios Core 与 iDRAC with LC 之间的安全网络连接已建立。 • (建议)iDRAC 设备必须有可解析的 FQDN。 • 如果您使用 WS-MAN 协议,建议您使用 WS-MAN 服务帐户而不是 WS-MAN 通信的默认服务帐户。 要查找 Dell 服务器,请执行以下操作: 1.
• 对于 -P 选项,选择一个协议: – – 对于 SNMP,该值为 1。 对于 WS-MAN,该值为 2。 4. 查找公用程序脚本运行后,通过运行命令 /bin/nagios -v /usr/local/ nagios/etc/nagios.cfg 验证 Nagios 配置。 5. 请确保不存在错误,然后通过运行命令 service nagios restart 重新启动 Nagios Core。 6. 您可以在以下日志文件路径中查看记录的信息:/var/dell/ discovery_.
查看设备信息 要在 Dell 服务器信息服务运行后查看有关设备的信息,请执行以下操作: 在 Nagios Core 控制台中的当前状态下,选择服务。 在 Nagios Core 控制台中查看 Dell 设备 前提条件:Dell 设备在 Nagios Core 中进行查找和资源清册。 您可以在 Nagios Core 的主机或服务视图中查看查找到的 Dell 设备: 1. 要在 Nagios Core 中查看主机,请选择当前状态下的主机。 主机将在右侧窗格中显示。 2.
4 监测 Dell 设备 您可以监测 Dell 设备的以下几个方面。 整体运行状况 您可以监测 Dell 设备以了解其整体运行状况状态。 关于整体运行状况 整体运行状况状态是 Dell 设备组件的汇总状态。 设备的整体运行状况状态根据配置的时间间隔定期轮询。默认情况下,Dell 服务器整体运行状况状态服务计划 为每小时运行一次。 表.
注: 存储状态属性表示存储组件(如物理磁盘、虚拟磁盘、控制器等)的累积运行状况状态。 查看整体运行状况 在您的数据中心环境中监测查找到的 Dell 设备的运行状况之前,请确保可访问这些查找到的设备。 要查看 Dell 设备的整体运行状况,请执行以下操作: 1. 在 Nagios Core 用户界面中的当前状态下,选择服务。 2.
服务 Dell 服务器风扇状 态 Dell 服务器电池状 态 Dell 服务器侵入状 态 Dell 服务器网络设 备状态 Dell 服务器 CPU 状 态 Dell 服务器电源设 备状态 Dell 服务器温度探 测器状态 状态 说明 提供 Dell 服务器中 风扇的整体运行状 况状态。 提供 Dell 服务器中 电池的整体运行状 况状态。 提供 Dell 服务器中 机箱侵入的整体运 行状况状态。 提供 Dell 服务器中 NIC 在最坏情况下 的运行状况状态。 提供 Dell 服务器中 CPU 的整体运行状 况状态。 提供 Dell 服务器中 电源设备的整体运 行状况状态。 提供 Dell 服务器中 温度探测器的整体 运行状况状态。 使用 WS-MAN 时显 使用 SNMP 时显示 示的属性 的属性 • 布局 • 布局 • 条带大小 • 条带大小 • 介质类型 • 介质类型 • 状态 • 状态 • FQDD • FQDD • 状态 • 状态 • 速度 (RPM) • 速度 (RPM) • 状态 • 状态 • 位
服务 状态 Dell 服务器电压探 测器状态 Dell 服务器控制器 状态 Dell 服务器电流探 测器状态 Dell 服务器 SD 卡 状态 使用 WS-MAN 时显 使用 SNMP 时显示 示的属性 的属性 说明 提供 Dell 服务器中 电压探测器的整体 运行状况状态。 提供 Dell 服务器中 存储控制器在最坏 情况下的运行状况 状态。 提供 Dell 服务器中 电流探测器的整体 运行状况状态。 提供 Dell 服务器中 SD 卡的整体运行状 况状态。 不可用 不可用 不可用 • 状态 • FQDD • 状态 • 写保护 • 初始化的状态 • 大小(GB) • 可用空间 (GB) • 读数(摄氏度) • 读数 • 状态 • 位置 • 状态 • 读数 (V) • 读数 • 状态 • FQDD • 位置 • 固件版本 • 高速缓存大小 (MB) • 状态 • 位置 • 状态 • 读数 (A) 或读数 (W) 不可用 注: 实际状态为“未知”时,Nagios 控制台在“状态信息”列中将
默认情况下,上述服务计划为每四个小时运行一次。 监测 Dell 设备的运行状况 要监测 Dell 设备的运行状况,请执行以下操作: 1. 在 Nagios Core 用户界面中的当前状态下,选择服务。 2. 选择关联的服务以监测 Dell 设备的运行状况。 服务器的运行状况监测通过 iDRAC with LC 执行,相应的详细信息在其各自的组件运行状况服务中显示 并采用适当的严重性运行状况颜色。 监测 SNMP 警报 关于 SNMP 警报监测 您可以异步接收从设备转发的 SNMP 警报。 收到 SNMP 警报后,Dell 服务器陷阱服务将在 Nagios Core 控制台中显示警报摘要消息和警报严重性。 表.
启动 iDRAC Web 控制台 要启动 iDRAC 设备的控制台,请执行以下操作: 1. 2.
移除 Dell 设备 6 您可以移除不想监测的 Dell 设备。 1. 导航至 /dell/config/objects,然后删除相应的 .cfg 文件。 2.
7 故障排除 本节列出在使用适用于 Nagios Core 的 Dell OpenManage 插件版本 1.0 时可能遇到的问题及其解决方法。 确保满足要求,或执行本节中列出的步骤。 适用于 Nagios Core 的 Dell OpenManage 插件安装脚本失 败 1. 您有足够的权限运行该脚本。 推荐:Nagios 管理员。 2. 满足安装指南中提到的前提条件。 3. 为安装脚本提供了正确的输入。 适用于 Nagios Core 的 Dell OpenManage 插件卸载脚本失 败 1. 您有足够的权限运行该脚本。 推荐:Nagios 管理员。 2. 卸载脚本从 Dell OpenManage 插件的安装位置运行。 查找脚本无法执行 1. 查找脚本具有相应的权限。 推荐:Nagios 管理员。 2. 运行脚本时提供相应的参数。 所选协议为 1 (SNMP) 时,查找脚本没有为 IPv4 或 IPv6 地址 或主机创建主机和服务定义文件 1. Net-SNMP 已安装。 2. IP 地址或主机可访问。 3. 指定的 IP 地址或主机上已启用 SNMP。 4.
。 所选协议为 2 (WS-MAN) 时,查找脚本没有为 IPv4 或 IPv6 地址或主机创建主机和服务定义文件 1. OpenWSMAN 及其 perl 绑定已安装。 2. IP 地址或主机可访问。 3. 运行查找之前,在以下文件中已正确配置相应的协议凭据: dell_resource.cfg .dell_device_comm_params.cfg 4. 对于 IPv6 地址,请确保 Perl 模块 Socket6 安装在相同的 Perl 库路径中。 5. 至少有一项适用的服务在以下服务模板中已启用: dell_server_services_template.cfg 。 Dell 设备的 IP 地址或主机名在查找设备后更改 移除旧的配置文件,然后使用新的 IP 地址或主机名重新查找 Dell 设备。 Nagios Core 控制台没有显示使用 Dell 查找脚本查找到的 Dell 设备 1. 主机和服务定义文件位于 /dell/config/objects 文件夹中。 2. 运行查找后,Nagios 服务已重新启动。 3.
2. 提供的 IP 地址或主机可访问。 3. IP 地址或主机上已启用 SNMP。 4. 在以下文件中已正确配置相应的 SNMP 参数: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage 插件特定服务显示消息“与主机通信时发 生 WSMAN 错误” 1. OpenWSMAN 及其 perl 绑定和 Net-IP 已安装。 2. 提供的 IP 地址或主机可访问。 3. 在以下文件中已正确配置相应的 WS-MAN 参数: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage 插件特定服务显示消息“组件信息 = 未知” 注: 如果组件在查找到的 Dell 设备中不可用,则这是预期的消息。 如果组件可用但您仍收到此消息,则此消息是由于协议超时。在 .dell_device_comm_params.cfg 文件 中设置所需的协议特定超时值。 无法查看 Nagios Core 控制台中 Dell 设备生成的 SNMP 警报 1.
如果您已安装非默认版本的 Perl 版本,或 Perl 绑定不可用,则转至 github.
8 常见问题 1. 问:能否提供有关适用于 Nagios Core 的 Dell OpenManage 插件许可的信息? 答:您可以免费安装和使用此插件。 2. 问:该插件支持哪些 Dell 硬件型号? 答: 有关支持的 Dell 平台的列表,请参阅支持值表。 3. 问:我的数据中心内有早期的各代服务器(第 9 代 - 第 11 代)。我是否仍可使用该插件监测这些服务 器? 答:不可以。您无法使用此插件监测早期的各代服务器(第 9 代到第 11 代)。使用此插件,您只能通过 iDRAC with LC 监测 Dell 服务器,即支持第 12 代及以后各代 Dell PowerEdge 服务器。Nagios Exchange 中提供其他插件,您可以使用这些插件监测早期的各代服务器。 4.
A 附录 从 Web 控制台配置 SNMP 设置 1. 启动 iDRAC(第 12 代及以后各代 Dell PowerEdge 服务器)Web 控制台,导航到控制台中的网络 → 服 务。 2. 配置 SNMP 代理属性: a. 将“已启用”设置为真,将“SNMP 协议”设置为“所有”(SNMP v1/v2/v3)。 b. 使用团体字符串设置 SNMP 团体名称。 c. 单击应用提交配置。 注: 该插件仅使用 SNMP V1 或 SNMP V2c 协议与 iDRAC 进行通信。 从 RACADM CLI 配置 SNMP 设置 1. 通过运行以下 ssh 命令启动 iDRAC RACADM CLI: ssh root@ 2. 通过运行以下命令将命令模式更改为 racadm: racadm 3. 通过运行以下命令设置 SNMP 团体字符串: racadm set idrac.snmp.agentcommunity 4. 通过运行以下命令启用 SNMP 代理: racadm set idrac.snmp.