Nagios Core 適用的 Dell EMC OpenManage 附 掛程式 3.
註、警示與警告 註: 「註」表示可以幫助您更有效地使用產品的重要資訊。 警示: 「警示」表示有可能會損壞硬體或導致資料遺失,並告訴您如何避免發生此類問題。 警告: 「警告」表示可能的財產損失、人身傷害或死亡。 © 2020 Dell Inc. 或其子公司。版權所有,翻印必究。Dell、EMC 及其他商標均為 Dell Inc.
目錄 1 Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.1 版簡介.........................................................5 2 新增的內容................................................................................................................................... 6 3 重要功能...................................................................................................................................... 8 4 支援矩陣..............................................................................................................
11 故障診斷....................................................................................................................................48 12 常見問題................................................................................................................................... 52 附錄 A: 附錄................................................................................................................................
1 Nagios Core 適用的 Dell EMC OpenManage 附 掛程式 3.1 版簡介 本指南提供有關使用 Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.1 版及其功能的資訊;這些功能例如受支援的 Dell EMC 裝置的探索、監控、啟動主控台和故障診斷。也提供受支援的 Dell EMC 裝置之詳細資料,以及客戶的常見問題。 此附掛程式提供監控 Dell EMC 裝置的功能,並可讓您完全掌握 Dell EMC 裝置的硬體層級,包括整體和元件層級的健全狀況監控。附 掛程式提供基本的清查資訊,並進行 Dell EMC 裝置的事件監視。附掛程式也支援受支援 Dell EMC 裝置的一對一網路主控台啟動,以 進行進一步的故障診斷、組態和管理活動。 如需裝置支援的詳細資料,請參閱「Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.1 版使用者指南」中的支援矩陣。 Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.
2 新增的內容 表 1. Dell EMC OpenManage 附掛程式 3.1 版的新特色與功能 新特色 說明 支援新款 Dell EMC 裝置 使用此版本,您可以探索和監視下列新 Dell EMC 裝置: • • • • • Dell EMC PowerEdge MX7000 模組化機箱 PowerVault ME4 儲存陣列 支援 iDRAC9 型 PowerEdge 伺服器 OEM 伺服器 Dell EMC Network Switch 如需裝置支援的詳細資料,請參閱「Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.
表 1. Dell EMC OpenManage 附掛程式 3.
3 重要功能 表 2. Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.
4 支援矩陣 Nagios Core 適用的 Dell EMC OpenManage 附掛程式 3.1 版支援下表所列的 Dell EMC 裝置。 表 3. 對作業系統的支援 作業系統 RHEL 7.7 RHEL 8.0 Ubuntu 18.04.3 Ubuntu 16.04.3 SLES 15 SP1 和 12 SP4 表 4. 對 Nagios Core 的支援 Nagios Core 3.5.1 4.4.5 資料中心可擴充解決方案 表 5. 支援的資料中心可擴充解決方案。 資料中心可擴充解決方案 (DSS) DSS 1500 DSS 1510 DSS 2500 DSS 7000 DSS 9620 DSS 7500 DSS 9000R DSS 9630 DSS 8440 DSS 9600 超融合基礎設施 (HCI) 平台 表 6.
表 6.
表 7. 支援的 PowerEdge 伺服器。(續) 第 12 代 PowerEdge 伺服器 第 13 代 PowerEdge 伺服器 iDRAC 9 型 PowerEdge 伺服器 R520 R430 R540 R620 R530 T440 R720xd R530xd T640 R820 R630 R6415 R920 R730 R7415 T320 R730xd R7425 T420 R830 R240 T620 R930 R340 R720 T130 R740xd2 C6320p T330 R840 C6320 T430 R940XA R420xr T630 T140 C5230 T340 FC640 MX740C MX840C R6515 R6525 C6525 XR2 C4140 R7515 R7525 PowerEdge 機箱 表 8.
表 9. 支援的 Compellent Storage Arrays。(續) Compellent 儲存裝置系列 Compellent SC5020 Compellent SC7020 Compellent SC8000 Compellent SC9000 EqualLogic PS-Series Storage Arrays 表 10. 支援的 EqualLogic PS 系列儲存裝置陣列。 EqualLogic PS 系列 EqualLogic PS4000 EqualLogic PS6000 EqualLogic PS4110 EqualLogic PS6010 EqualLogic PS4210 EqualLogic PS6610 EqualLogic PS4100 EqualLogic PS6100 EqualLogic PS6210 EqualLogic PS6110 EqualLogic PS6500 EqualLogic PS6510 PowerVault MD 系列儲存裝置陣列 表 11.
Dell EMC Network Switch 表 13.
5 裝置探索和清查 主題: • • • • 關於裝置探索 關於 Dell EMC 裝置探索公用程式 探索 Dell EMC 裝置 裝置資訊 關於裝置探索 支援之 Dell EMC 裝置的監視通訊協定如下: • • • • 使用 REST 通訊協定探索 Dell EMC PowerEdge MX7000 模組化機箱和 PowerVault ME4 儲存陣列。 您可以使用 SNMP 或 WSMan 通訊協定,或 Redfish 通訊協定來探索 Dell EMC 伺服器。 探索 Dell EMC 機箱時是使用 WSMan 通訊協定。 Dell EMC 儲存裝置和 Dell EMC Network Switch 使用 SNMP 通訊協定來探索。 註: 若為 iDRAC 韌體版本 3.30.30.
表 14. Dell EMC Helper Utility 選項 選項 說明 -h 顯示可用的選項清單 --host 探索到的主機 IP 位址或主機名稱。 --File 提供的檔案名稱與路徑包含 IP 位址 / 主機名稱 / 遮罩子網路, 並以新的行分隔。 --subnet 若要取得遮罩子網路。 --all 此選項可用來顯示詳細的服務。 如果新增 --all 參數,結果會顯示所有的詳細服務。依預設,只會 顯示基本的服務。 --prefProtocol PrefProtocol 用於監視。允許的選項為 1 (SNMP)、2 (WSMan) 和 3 (Redfish)。此值是選擇性的。 註: 此參數僅適用於 Dell EMC 伺服器。依預設,如果有傳遞 Redfish 參數,就會以 Redfish 通訊協定來探索伺服器。否 則如果有傳遞 SNMP 參數,就會透過 SNMP 來探索。 --output.file 這樣會顯示以 .
表 14. Dell EMC Helper Utility 選項(續) 選項 說明 --warranty.warningDays 保固警告天數,允許的值為 [1-365]。預設值為 30。 --nagios.type 決定主機檔案的輸出格式,允許的選項為 0 (適用於 .cfg 格式) 和 1 (適用於 .xml 格式)。 預設值是 0。 --addservices 新增服務以在主機或主機群組層級監控。 --removeservices 在主機或主機群組層級移除監控的服務。 --hostgroup 在主機群組層級新增或移除服務 --excludeinstance 在監控期間排除元件的例項 --service 在提供元件名稱的同時與 excludeinstance 一起使用 --listservices 列出主機或多個主機的服務 (使用 -File,--subnet) 或主機群組 表 15.
表 16.
表 17. 根據 WSMan 通訊協定為所有 Dell EMC 機箱建立的預設服務(續) 服務 Dell EMC 機箱管理模組狀態 Dell EMC 機箱溫度警報狀態 註: 提供給所有 Dell EMC 機箱的所有詳細服務清單,也適用於 MX7000,但使用 REST 通訊協定。 表 18.
表 20. 根據 SNMP 通訊協定為 EqualLogic PS 系列儲存陣列建立的預設服務 服務 基本服務 Dell EMC Storage PS 系列成員整體健全狀況 Dell EMC Storage PS 系列成員資訊 Dell EMC Storage PS 系列群組資訊 Dell EMC Storage PS 系列成員設陷 Dell EMC Storage PS 系列成員群組設陷 詳細服務 Dell EMC Storage PS 系列成員實體磁碟狀態 Dell EMC Storage PS 系列磁碟群組區狀態 Dell EMC Storage PS 系列群組儲存集區狀態 Dell EMC Storage PS 系列群組儲存集區資訊 Dell EMC Storage PS 系列成員保固資訊 表 21.
表 22. 根據 REST 通訊協定為 PowerVault ME4 系列儲存陣列建立的預設服務(續) 服務 Dell EMC Storage ME4 系列儲存機櫃狀態 Dell EMC Storage ME4 系列磁碟區狀態 GUI 服務名稱和元件名稱 下表列出個別主機群組 GUI 命名和其元件命名清單 表 23.
表 23.
表 23.
表 23.
元件服務 列出已新增或要新增的主機層級和主機群組層級的服務 下列命令僅會列出所有已探索到的元件服務: • --listservices:列出所有已新增或要新增的監控服務 列出探索到主機已新增或要新增的元件服務 語法:以下指令檔/語法可協助使用者查看主機已新增或要新增的服務清單。 python dellemc_nagios_discovery_service_utility.py --host= --listservices output.file= 範例: python dellemc_nagios_discovery_service_utility.py --host=100.28.45.36 --listservices output.file=/usr/local/nagios/dell/config/objects 註: 如果未提供 output.
範例: python dellemc_nagios_discovery_service_utility.py --host=100.98.67.123 -addservices="NIC,Disk,Controller" --removeservices="StorageEnclosure,VDisks" output.file=/usr/local/nagios/dell/config/objects - 新增或移除在指定主機群組下探索到的所有主機或裝置的元件服務 語法:下列指令檔或語法可協助使用者在主機群組下新增和移除服務: python dellemc_nagios_discovery_service_utility.py --host= -addservices= --removeservices= -output.file=
• 使用檔案路徑,以 WSMan 通訊協定來探索: python dellemc_nagios_discovery_utility.py --file= --prefProtocol=2 --http.user=root --http.password=calvin --output.file=/usr/local/nagios/dell/config/ objects/ • 使用檔案路徑,以 Redfish REST 應用程式發展介面來探索: python dellemc_nagios_discovery_utility.py --file= --prefProtocol=3 --http.user=root --http.password=calvin --output.file=/usr/local/nagios/dell/config/ objects/ • 使用檔案路徑,以 SNMP 來探索: python dellemc_nagios_discovery_utility.
表 24.
表 24.
6 監視 Dell EMC 裝置 您可以監控 Dell EMC 裝置的各層面,如下列各節所述。 主題: • • • Dell EMC 裝置的整體健全狀況 監視 Dell EMC 裝置的元件健全狀況 監視 SNMP 警示 Dell EMC 裝置的整體健全狀況 您可以在 Nagios Core 主控台中監視 Dell EMC 裝置的整體健全狀況。整體健全狀況是支援的 Dell EMC 裝置元件的彙總狀態。 健全狀況例項 您可使用 Nagios Core 主控台來監視所有 Dell EMC 裝置的健全狀況例項。健全狀況例項代表探索到的 Dell EMC 裝置的健全狀況。例 項會顯示在狀態資訊標籤之下。 根據預設,Nagios Core 主控台會顯示探索到的裝置之不健全狀況例項。根據監視需求,您可以變更主機組態檔案內的 -excludeinstance 值。變更值之後,重新啟動 Nagios 服務。 註: 若要在 Nagios Core 主控台中檢視 Dell EMC 裝置任何服務的所有例項,請導覽至 /dell/config/ objects,並按一下探索到的裝置之 cfg 檔案。
表 25.
探索公用程式以相關選項執行時,會建立對應的服務。這些服務定期執行,並更新元件的整體健全狀況。Nagios Core 使用者介面會 顯示元件的狀態與資訊。 「狀態資訊」欄中元件資訊的格式是 =, =。 例如:Status=CRITICAL, FQDD=Fan.Embedded.1, State=Enabled 表 26.
表 26.
表 26.
表 27.
表 27.
表 28. EqualLogic 元件健全狀況資訊(續) 服務 狀態 說明 顯示的屬性 • • • • • 裝置類型 出貨日期(UTC) 開始日期(UTC) 結束日期(UTC) 剩餘天數 表 29.
表 31.
表 32.
表 33. 單位和說明(續) 單位 說明 W 瓦特 GB 十億位元組 RPM 每分鐘轉數 A 安培 V 伏特 MB 百萬位元組 上述服務預設排定每四小時一次。 排除例項 用於排除所有服務元件例項的指令檔: python dellemc_nagios_discovery_service_utility.py --host="IP address" -service="Servicename" --excludeinstance=" operator " output.file= 探索公用程式指令檔使用有效的引數執行時,它應排除元件的例項。以下為提供的引數: 1. --主機:裝置的主機名稱或 IP 2. --服務:排除例項的元件名稱 3.
您可以在 Nagios Core 的主機或服務檢視中,檢視探索到的 Dell EMC 裝置: 1. 若要在 Nagios Core 檢視主機,請在左窗格的目前狀態下選取主機。 右窗格隨即顯示主機。 2.
表 34.
檢視 SNMP 警示 先決條件: • • 已安裝設定 Nagios Core with SNMPTT,並在 SNMPTT 設定 Dell 整合。 支援的 Dell EMC 裝置已用 Nagios Core 伺服器設定 SNMP 陷阱目的地。 註: 若要從 PowerVault MD 34/38 系列儲存陣列接收 SNMP 設陷,必須在 Modular Disk Storage Manager (MDSM) 主控 台設定該裝置的 SNMP 陷阱目的地。 如需在 iDRAC 介面設定 SNMP 陷阱目的地的資訊,請參閱附錄。 若要檢視 SNMP 警示: 在 Nagios Core 使用者介面的目前狀態下選取服務,然後瀏覽至個別 Dell EMC 裝置特定設陷服務。 狀態資訊只會顯示上次收到的 SNMP 警示,而且狀態會更新警示的嚴重程度。若要檢視收到的所有 SNMP 警示,請選取報告 > 警示 > 歷程記錄。 42 監視 Dell EMC 裝置
7 啟動特定 Dell EMC 裝置主控台 若要為支援的 Dell EMC 裝置啟動主控台: 1. 在 Nagios Core 主控台目前的狀態下,選取下列其中一項: • • • 主機 服務 主機群組 > (執行額外的主機的動作圖示)。 2. 按一下 Dell EMC 裝置旁邊的 個別 Dell EMC 主控台隨即在新視窗中啟動。 主題: • Dell EMC 裝置及其主控台 Dell EMC 裝置及其主控台 您可以從支援的 Dell EMC 裝置啟動各種 Dell EMC 主控台,取得所要監視 Dell EMC 裝置的更多相關資訊。 表 35.
8 Dell EMC 裝置保固資訊 使用此功能時,您可以存取探索到的 Dell EMC 裝置之保固資訊。此功能可讓您監控主控台中的 Dell EMC 裝置保固詳細資料。需有可 用的網際網路連線才能取得保固資訊。如果沒有直接的網際網路存取,且使用代理設定存取網際網路,請務必解析 etc/hosts 檔案 中 api.dell.
若要檢視 VRTX 機箱的保固服務資訊,請按一下 Dell EMC 機箱保固資訊。 註: 若為 EqualLogic 儲存陣列,保固服務只會與 EqualLogic 成員 IP 相關聯。 若為 Compellent 儲存陣列,保固服務只會與 Compellent 控制器 IP 相關聯。 Dell EMC 裝置保固資訊 45
9 移除 Dell EMC 裝置 您可以移除不想要監視的 Dell EMC 裝置。 1. 請瀏覽至 /dell/config/objects 並刪除對應的 .cfg 檔案。 2.
10 適用所產生警示的知識庫訊息 您可以在 Nagios Core 主控台,從已探索之 Dell EMC 裝置的 KB 訊息,取得關於該裝置所產生之 SNMP 警示的更多資訊。 檢視 KB 訊息 若要檢視已探索之 Dell EMC 裝置產生的 SNMP 警示 KB 訊息,請完成下列步驟: 1. 登入 Nagios Core 主控台。 2. 在左窗格中,在目前狀態下按一下服務。 3. 在服務下,前往個別裝置設陷或警示,在狀態資訊下的更多資訊超連結按右鍵,然後選取在新的索引標籤開啟。 個別裝置的 KB 訊息隨即顯示於新的索引標籤。 4. 在 KB 訊息頁面中,以 Nagios Core 主控台顯示的方式,搜尋個別事件 ID 或 KB 訊息,檢視此警示相關的進一步詳細資料。 例如: 若要檢視機箱設陷的 KB 訊息: 1. 在服務下,向下捲動至 Dell 機箱設陷,在狀態資訊下的更多資訊超連結按一下滑鼠右鍵,然後選取在新的索引標籤開啟。 2.
11 故障診斷 本章節列出使用 Nagios Core 適用的 Dell EMC OpenManage Plug-in 時可能會遇到的問題及其因應措施。 請確定您符合需求,或執行本節列出的步驟。 在修改密碼片語時,Nagios 主控台顯示「錯誤: :主機 IP/主機名稱無回應」 解決方案:如果密碼片語已變更,使用者需要重新探索裝置。 Nagios 探索指令檔顯示「錯誤:設定的密碼片語為空 或不正確」 解決方案:依在後續安裝需求中的定義來設定密碼片語,因為它不能為空的密碼片語文字,長度應最少 10 個字元,最多 25 個字 元。 註: 密碼片語文字為空也會影響裝置檢查 (監控) Nagios 探索指令檔顯示「錯誤:巨集 $OMINAGIOSRESPATH$ 有無效的路徑或找不到檔 案」 解決方案:在位置 等中的 resource.cfg 有巨集 $OMINAGIOSRESPATH$,當中的路徑無效。使用正確的路徑將巨 集更新至有該密碼片語的檔案。 Nagios 探索指令檔顯示「錯誤:未設定 resource.
在 Ubuntu 設定適用的 Nagios Core 主控台中未收到 Dell EMC 裝置的 SNMP 設陷 解決方式:在 /libexec/eventhandlers/submit_check_result 中,以 #!/bin/bash 取代 #!/bin/sh,然後重新 啟動 SNMPTT 及 Nagios 服務。 Nagios 主控台未收到 eqlMemberGatewayIPAddrChanged 設陷 解決方式:變更 EqualLogic 成員閘道 IP 位址後,您需要確定從 EqualLogic 成員或 EqualLogic 群組至陷阱接聽程式有可用的連線。 Nagios Core 適用的 Dell EMC OpenManage Plug-in 安裝指令檔失敗 1. 您有的權限足夠執行指令檔。 建議使用:Nagios 管理員。 2. 符合安裝指南所述的先決條件。 3. 您在安裝指令檔提供正確的輸入。 Nagios Core 適用的 Dell EMC OpenManage Plug-in 解除安裝指令檔失敗 1.
Nagios Core 主控台未顯示用 Dell EMC 探索指令檔探 索到的 Dell EMC 裝置 1. /dell/config/objects 資料夾有主機和服務定義檔案。 2. 執行探索後,Nagios 服務已重新啟動。 3. 主機和服務定義檔案擁有適當權限。 Nagios Core 主控台未針對用 Dell EMC 探索指令檔探 索到的 Dell EMC 裝置顯示設陷服務 1. 已安裝 SNMPTT。 2. 如果未安裝 SNMPTT,就不會為任何探索到的 Dell EMC 裝置建立服務。 3. 安裝 SNMPTT 後,請確定有執行設陷整合。 若要執行設陷整合,請從 /dell/install 執行命令: ./install.sh trap 4. 設陷整合完成後,重新啟動 SNMPTT 服務,然後執行命令: service snmptt restart Dell EMC OpenManage Plug-in 特定服務顯示「Error while creating SNMP Session」(建立 SNMP 階段作 業時發生錯誤) 訊息 1.
無法在 Nagios Core 主控台中監視已探索之 Dell EMC 裝置的保固資訊 • 請確定您具備有效的網際網路連線。如果沒有直接的網際網路存取,且使用代理設定存取網際網路,請務必解析 etc/hosts 檔 案中 api.dell.com 這個主機名稱。 如果您仍無法檢視保固資訊,請確定您已在系統中安裝 Java 1.6 版或更新版本。如果 Java 是在安裝 Dell EMC 附掛程式之後安裝,請 執行下列步驟: 1. 安裝 JAVA。 2. 瀏覽至 /dell/install,執行以下命令: ./install.sh java 3. 重新啟動 Nagios Core 服務。 4. 重新探索 Dell EMC 裝置。 收到 Dell EMC 裝置警示後,整體健全狀況未重新整 理 如果沒有為探索到的 Dell EMC 裝置建立整體健全狀況服務,那麼 Dell EMC 裝置設陷就不會觸發整體健全狀況。如果裝置有整體健全 狀況服務,則請確定下列事項: 1.
12 常見問題 1. 問題:您可以提供有關 Nagios Core 適用的 Dell EMC OpenManage Plug-in 授權相關資訊嗎? 回答:您可以免費安裝和使用這個外掛程式。 2. 問題:這個外掛程式支援哪些 Dell EMC 硬體機型? 回答:如需支援的 Dell EMC 平台清單,請參閱支援表格。 3. 問題:我的資料中心有舊版伺服器 (第 9 代到第 11 代)。我還是可以用外掛程式監視它們嗎? 回答:不可以,您無法用這個外掛程式監視舊版伺服器 (第 9 代到第 11 代)。您只能使用支援第 12 代和更新版 PowerEdge 伺服器 的這個外掛程式,透過 iDRAC (含 LC) 監視 Dell 伺服器。Nagios Exchange 有其他外掛程式可供使用,讓您得以監視舊版伺服器。 4.
A 附錄 使用 iDRAC Web 主控台設定 iDRAC 的 SNMP 參數 1. 啟動 iDRAC (第 12 代與第 13 代的 PowerEdge 伺服器) Web 主控台,然後導覽至主控台內的 iDRAC 設定 > 網路 > 服務。 若為第 14 代 PowerEdge 伺服器,請啟動 iDRAC Web 主控台並導覽至 iDRAC 設定 > 服務 2. 設定 SNMP 代理程式的內容: a. 將啟用設為 True,SNMP 通訊協定設為 All (SNMP v1/v2/v3)。 b. 以社群字串設定 SNMP 社群名稱。 c. 按一下套用提交組態。 註: 附掛程式只用 SNMP v1 或 SNMP v2 通訊協定與 iDRAC 通訊。 使用 iDRAC Web 主控台設定 iDRAC 的 SNMP 陷阱 目的地位址 第 12 代和第 13 代 PowerEdge 伺服器。 1. 登入 iDRAC。 2. 選取概觀 > 警示。 3.