Nagios Core 適用的 Dell OpenManage 附掛程式 2.
註、警示與警告 註: 「註」表示可以幫助您更有效地使用產品的重要資訊。 警示: 「警示」表示有可能會損壞硬體或導致資料遺失,並告訴您如何避免發生此類問題。 警告: 「警告」表示可能的財產損失、人身傷害或死亡。 © 2015-2021 Dell Inc. 或其子公司。版權所有,翻印必究。Dell、EMC 與其他商標均為 Dell Inc.
目錄 章 1: Dell OpenManage Plug-in Version 2.0 for Nagios Core 簡介......................................................... 5 章 2: Dell SPI 4.0 版新增內容............................................................................................................ 6 章 3: 主要特色................................................................................................................................. 7 章 4: 支援矩陣..........................................................................................................
附錄 A: 附錄................................................................................................................................
1 Dell OpenManage Plug-in Version 2.0 for Nagios Core 簡介 本指南就使用 Dell OpenManage Plug-in Version 2.0 for Nagios Core 及其各種功能,提供相關資訊,例如探索、監視、啟動主控台和 故障排除支援的 Dell 裝置。本指南也針對支援的 Dell 裝置及客戶常見問題提供詳細資料。 這個外掛程式提供的功能,可監視 Nagios Core 所管理環境中的 Dell 裝置。有了這個外掛程式,Dell 裝置的硬體層級一覽無疑,包括 整體和元件層級的健康狀況監視。這個外掛程式提供 Dell 裝置的基本清查資訊和事件監視。這個外掛程式還支援以一對一 Web 主控 台方式啟動支援的 Dell 裝置,進行進一步的疑難排解、組態和管理活動。 如需裝置支援的更多詳細資料,請參閱《Dell OpenManage Plug-in Version 2.0 for Nagios Core 使用者指南》的支援矩陣。 Dell OpenManage Plug-in Version 2.
2 Dell SPI 4.0 版新增內容 下表列出 Dell SPI 4.0 版的新增特色及功能: 表 1.
3 主要特色 Dell OpenManage Plug-in Version 2.0 for Nagios Core 的主要功能如下表所述。 表 2.
4 支援矩陣 Dell OpenManage Plug-in for Nagios Core 支援下表所列的 Dell 裝置。 Dell Datacenter Scalable Solutions 表 3. 支援的 Dell Datacenter Scalable Solutions。 Dell Datacenter Scalable Solutions (DSS) DSS 1500 DSS 1510 DSS 2500 Dell PowerEdge 伺服器 表 4.
表 5. 支援的 Dell 機箱。 (續) Dell PowerEdge FX2s Dell PowerEdge VRTX Dell PowerEdge M1000e Dell Compellent Storage Arrays 表 6. 支援的 Dell Compellent Storage Arrays。 Compellent 系列 40 Compellent SC4020 Compellent SC8000 Dell EqualLogic PS-Series Storage Arrays 表 7. 支援的 Dell EqualLogic PS 系列 Storage Arrays。 EqualLogic PS4100 EqualLogic PS6100 EqualLogic PSM4110 EqualLogic PS6210 EqualLogic PS6500 EqualLogic PS6510 Dell PowerVault MD Storage Arrays 表 8.
5 裝置探索和清查 主題: • • • • • • 關於裝置探索 關於 Dell Device Discovery Utility 關於通訊協定參數 探索 Dell 裝置 裝置資訊 在 Nagios Core 主控台檢視 Dell 裝置 關於裝置探索 若使用此外掛程式,即可在 Nagios Core 主控台探索支援的 Dell 裝置。支援之 Dell 裝置的監視通訊協定如下所示: ● 探索 Dell 伺服器使用的是 SNMP 或 WS-MAN 通訊協定 註: 探索 Dell 伺服器時,SNMP 或 WS-MAN 通訊協定只能二擇一,兩個無法同時使用。若要使用 WS-MAN 通訊協定,重新 探索之前透過 SNMP 通訊協定探索到的伺服器,請使用 -f 選項,搭配所需通訊協定的參數執行探索指令碼;反之亦然。 例如: 如果已使用 SNMP 通訊協定找到伺服器,但想要使用 WS-MAN 通訊協定探索同一個裝置,請先瀏覽至 / dell/scripts,然後執行下列 PERL 指令碼: perl dell_device_discovery.
表 9. Dell Device Discovery Utility 選項 選項 簡短說明 說明 -h 說明 顯示說明文字。 -H 主機 主機 IP 位址或 FQDN 名稱。 -S 子網路 遮罩子網路。 -F 檔案 有絕對路徑的檔案,內含新行字元分隔 IP 位址清單或 FQDN 名稱。 -P 通訊協定 監視用通訊協定。允許選項 1 (SNMP) 和 2 (WS-MAN)。 如果未使用 -P,預設會使用 SNMP 通訊 協定探索 Dell 伺服器。 此值是選擇性的。 組態檔案 -c 特定通訊協定組態檔案。 預設的檔案 是 .dell_device_comm_params.cfg 。如需更多資訊,請參閱關於通訊協定參 數。 範本 -t 有絕對路徑的範本檔案,用於自訂的服務 監視。 預設檔案是 dell_device_services_template.
表 10. 根據選取的通訊協定,會為 Dell 伺服器建立預設服務 (續) 服務 SNMP WS-MAN 通訊協定 Dell 伺服器虛擬磁碟狀態 √ √ Dell 伺服器風扇狀態 √ √ Dell 伺服器電池狀態 √ √ Dell 伺服器入侵狀態 √ √ Dell 伺服器網路裝置狀態 √ √ Dell 伺服器電壓警報狀態 √ √ Dell 伺服器控制器狀態 √ √ Dell 伺服器電流警報狀態 √ √ Dell 伺服器 CPU 狀態 √ X Dell 伺服器電源供應器狀態 √ X Dell 伺服器溫度警報狀態 √ √ Dell 伺服器 SD 卡狀態 X √ Dell 伺服器 FC NIC 狀態 X √ Dell 伺服器保固資訊 √ √ 表 11.
表 12. 根據 SNMP 通訊協定為 Dell Compellent 儲存陣列建立的預設服務 (續) 服務 Dell Storage Compellent 管理設陷 Dell Storage Compellent 控制器設陷 Dell Storage Compellent 控制器整體健全狀況狀態 Dell Storage Compellent 控制器資訊 詳細服務 Dell Storage Compellent 實體磁碟狀態 Dell Storage Compellent 磁碟區狀態 Dell Storage Compellent 控制器保固資訊 表 13.
#Dell 伺服器 FC NIC 狀態 在 Nagios Core 主控台不會為探索到的 Dell 伺服器建立此服務。 關於通訊協定參數 探索時,取決於您所選取的通訊協定是 SNMP 還是 WS-MAN,可以在 .dell_device_comm_params.cfg 這個參數檔案設定通 訊協定的值。 .dell_device_comm_params.cfg 這個檔案會在下列位置:/dell/scripts。提供的選項包括: 表 15. 參數檔案 通訊協定通訊參數 說明 SNMP snmp.version 用於輸入 SNMP 版本。預設版本是 2。 snmp.community 用於輸入 SNMP 社群字串的使用者巨集。 snmp.retries 用於輸入若發生逾時必須傳送 SNMP 要求的次數。預設的重試 值為 1。 snmp.timeout 用於輸入 SNMP 逾時值 (以秒為單位)。預設的逾時值為 3 秒。 snmp.port 用於輸入 SNMP 連接埠值。預設的 SNMP 連接埠值為 161。 WS-MAN wsman.
指令碼語法和選項相關資訊隨即顯示。如需更多資訊,請參閱關於 Dell Discovery Utility。 根據您的需求,請執行下列動作: 註: 執行公用程式之前,請確定已更新通訊協定相關資訊,如需更多資訊,請參閱關於通訊協定參數。 若要使用 IP 位址或 FQDN 探索裝置: ● perl dell_device_discovery.pl -H 若要使用子網路遮罩探索: ● perl dell_device_discovery.pl -S 子網路遮罩的格式範例:11.98.149.0/24 若要使用檔案內的 IP 位址清單探索: ● perl dell_device_discovery.pl -F ● 若為 -P 選項,請選擇通訊協定: 註: 務必在檔案提供新行分隔的 IP 清單。 4. 系統提示您確認探索 Dell 裝置時,請按下 Y,然後按 Enter 繼續。若要結束探索程序,依序按下任何其他按鍵和 Enter,或是按 下 Enter 結束。 5.
表 16.
表 16.
2.
6 監視 Dell 裝置 您可以監視 Dell 裝置的各層面,如下列各節所述。 主題: • • • Dell 裝置的整體健全狀況狀態 監視 Dell 裝置的元件健全狀況 監視 SNMP 警示 Dell 裝置的整體健全狀況狀態 您可以在 Nagios Core 主控台監視 Dell 裝置的整體健全狀況狀態。整體健全狀況狀態是支援之 Dell 裝置元件的彙總狀態。 關於整體健全狀況狀態 根據設定的間隔時間,裝置的整體健全狀況狀態會定期輪詢。整體健全狀況狀態服務預設排定一小時一次。 表 17.
表 17.
表 18.
表 18.
表 18. Dell 裝置的元件健全狀況資訊 (續) 服務 Status (狀態) Dell 伺服器 SD 卡狀態 說明 使用 WS-MAN 時顯示 屬性 使用 SNMP 時顯示屬性 就 Dell 伺服器內的 SD 卡,提供整體健全狀況 狀態。 ● Status (狀態) 無法使用 ● FQDD ● State (狀態) ● WriteProtected ● InitializedState ● Size (GB) (大小) ● AvailableSpace (GB) Dell 伺服器 FC NIC 狀 態 ● ConnectionStatus 就 Dell 伺服器內的 FC NIC,提供整體健全狀況 ● FQDD 狀態。 ● FirmwareVersion (韌 體版本) 無法使用 ● LinkSpeed ● Name Dell 伺服器保固資訊 提供 Dell 伺服器保固資 訊狀態。 ● ● ● ● ● ● ● ● ServiceTag 服務層級詳細資料 項目編號 類型 出貨日期 (UTC) 開始日期 (UTC) 結束日期 (UTC) 剩餘天數 表 19.
表 19.
表 19.
表 20.
註: 如需監視 Compellent 控制器健全狀況的更多資訊,請參閱特定的 Dell Compellent 控制器使用者指南,網址是:Dell.com/ support。 Dell 機箱機櫃狀態僅顯示機櫃的主要狀態。如需更多資訊,請參閱 Dell PowerEdge VRTX 機箱主控台或 Dell PoweEdge VRTX 機 箱使用者指南,網址是:Dell.com/support。 註: 表 23. 單位和說明 Unit (單位) 說明 GHz 吉赫 W 瓦特 GB 十億位元組 RPM 每分鐘轉數 A 安培 V 伏特 MB 百萬位元組 上述服務預設排定每四小時一次。 監視 Dell 裝置的元件健全狀況 若要監視 Dell 裝置的元件健全狀況: 1. 在 Nagios Core 使用者介面目前的狀態下,選取服務。 2.
表 24.
7 啟動特定 Dell 裝置主控台 若要為支援的 Dell 裝置啟動主控台: 1. 在 Nagios Core 主控台目前的狀態下,選取下列其中一項: ● 主機 ● 服務 ● 主機群組 > 2. 按一下 (執行額外的主機動作圖示) 在 Dell 裝置旁。 個別 Dell 主控台隨即在新視窗中啟動。 主題: • Dell 裝置及其主控台 Dell 裝置及其主控台 您可以從支援的 Dell 裝置啟動各種 Dell 主控台,取得所要監視 Dell 裝置的更多相關資訊。 表 25.
8 Dell 裝置保固資訊 使用此功能,您可以存取已探索到的 Dell 裝置保固資訊。此功能可讓您在 Nagios Core 主控台監視 Dell 裝置保固詳細資料。取得保固 資訊需要有連線中的網際網路。如果沒有直接的網際網路存取,且是使用 Proxy 設定存取網際網路,請務必解析 etc/hosts 檔案中 api.dell.
• 檢視保固資訊 檢視保固資訊 請確認下列事項,才能檢視探索到之 Dell 裝置的保固資訊: ● 網際網路連線中。 ● 在 Dell_OpenManage_Plugin > resources 資料夾提供的 dell_pluginconfig.cfg 檔案,正確設定保固報告參數。 ● RemainingDaysWarning 與 RemainingDaysCritical 的值設定正確無誤,否則保固會處於未知狀態。 ● 探索到的裝置有有效的服務標籤。 成功探索到裝置後,Status Information 欄便會顯示其保固資訊。若要檢視 Dell 裝置的詳細資料, 1. 探索 Dell 裝置。 2.
9 移除 Dell 裝置 您可以移除您不想監視的 Dell 裝置。 1. 瀏覽至 /dell/config/objects,刪除對應的 .cfg 檔案。 2.
10 適用所產生警示的知識庫 (KB) 訊息 您可以在 Nagios Core 主控台,從已探索到 Dell 裝置的 KB 訊息,取得該裝置所產生之 SNMP 警示的更多資訊。 檢視 KB 訊息 若要檢視已探索 Dell 裝置產生的 SNMP 警示 KB 訊息,請完成下列步驟: 1. 登入 Nagios Core 主控台。 2. 在左窗格中,在 Current Status 下按一下 Services。 3. 在 Service 下,瀏覽至個別裝置設陷或警示,在 Status Information 下的 More Information 超連結按一下滑鼠右鍵,然後選取 Open in new tab。 個別裝置的 KB 訊息隨即顯示於新的索引標籤。 4. 在 KB 訊息頁面中,以 Nagios Core 主控台顯示的方式,搜尋個別事件 ID 或 KB 訊息,檢視此警示相關的進一步詳細資料。 例如: 若要檢視機箱設陷的 KB 訊息: 1.
11 故障排除 本章節列出使用 Dell OpenManage Plug-in for Nagios Core 時可能遭遇的問題及其因應之道。 請確定您符合需求,或執行本節列出的步驟。 Dell OpenManage Plug-in for Nagios Core 安裝指令碼失敗 1. 您有的權限足夠執行指令碼。 建議使用:Nagios 管理員。 2. 符合安裝指南所述的事前準備作業。 3. 您在安裝指令碼提供正確的輸入。 Dell OpenManage Plug-in for Nagios Core 解除安裝指令碼失 敗 1. 您有的權限足夠執行指令碼。 建議使用:Nagios 管理員。 2. 解除安裝指令碼從安裝 Dell OpenManage Plug-in 的位置執行。 探索指令碼無法執行 1. 探索指令碼有適當權限。 建議使用:Nagios 管理員。 2. 執行指令碼時提供適當的引數。 所選的通訊協定為 1 (SNMP) 時,探索指令碼並未為 IPv4 或 IPv6 位址或主機建立主機與服務定義檔案 1. 2. 3. 4.
所選的通訊協定為 2 (WS-MAN) 時,探索指令碼並未為 IPv4 或 IPv6 位址或主機建立主機與服務定義檔案 1. 已安裝 OpenWSMAN 及其 Perl 繫結。 2. IP 位址或主機可連線。 3. 執行探索之前,先在下列檔案正確設定適當的通訊協定憑證: dell_resource.cfg .dell_device_comm_params.cfg 4. 若為 IPv6 位址,請確定安裝 Perl Module Socket6 的位置是在同一個 Perl 程式庫路徑。 5. 至少在下列服務範本啟用其中一個適用的服務: dell_server_services_template.cfg 。 裝置探索後,Dell 裝置的 IP 位址或主機名稱變更 用新的 IP 位址或主機名稱移除舊的組態檔案,然後重新探索 Dell 裝置。 Nagios Core 主控台未顯示用 Dell 探索指令碼探索到的 Dell 裝置 1. /dell/config/objects 資料夾有主機和服務定義檔案。 2. 執行探索後,Nagios 服務已重新啟動。 3.
2. 所提供的 IP 位址或主機可連線。 3. IP 位址或主機已啟用 SNMP。 4. 已在下列檔案正確設定適當的 SNMP 參數: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage Plug-in 特定服務顯示「與主機通訊時發生 WSMAN 錯誤」的訊息 1. OpenWSMAN 及其 Perl 繫結和 Net-IP 已安裝。 2. 所提供的 IP 位址或主機可連線。 3. 已在下列檔案正確設定適當的 WS-MAN 參數: dell_resource.cfg .dell_device_comm_params.cfg Dell OpenManage Plug-in 特定服務顯示「元件資訊 = 不 明」的訊息 註: 如果探索到的 Dell 裝置無法使用該元件,就會出現這個訊息。 如果元件可供使用卻還是收到這個訊息,那麼出現這個訊息的原因便在於通訊協定逾時。在 .dell_device_comm_params.
如需下載及安裝 RACADM 的更多資訊,請前往「en.community.dell.com/techcenter/systems-management/w/wiki/3205.racadmcommand-line-interface-for-drac」 無法在 Nagios Core 主控台監視已探索到之 Dell 裝置的保固 資訊 ● 請確定網際網路連線中。如果沒有直接的網際網路存取,且使用 Proxy 設定存取網際網路,請務必解析 etc/hosts 檔案中 api.dell.com 這個主機名稱。 如果您仍無法檢視保固資訊,那麼請確定系統已安裝 1.6 以上版本的 Java。如果是先安裝 Dell 外掛程式才安裝 Java,那麼請執行下 列步驟: 1. 安裝 JAVA。 2. 瀏覽至 /dell/install,執行以下命令: install.sh java 3. 重新啟動 Nagios Core 服務。 4.
12 常見問題集 1. 問題:您可以就 Dell OpenManage Plug-in for Nagios Core 的授權提供相關資訊嗎? 回答:您可以免費安裝和使用這個外掛程式。 2. 問題:這個外掛程式支援哪些 Dell 硬體機型? 回答:如需支援的 Dell 平台清單,請參閱支援矩陣。 3. 問題:我的資料中心有舊版伺服器 (第 9 代 – 第 11 代)。我還是可以用外掛程式監視它們嗎? 回答:不可以,您無法用這個外掛程式監視舊版伺服器 (第 9 代到第 11 代)。您只能透過 iDRAC with LC 監視 Dell 伺服器,支援第 12 代以後的 Dell PowerEdge 伺服器使用此外掛程式。Nagios Exchange 有其他外掛程式可供使用,讓您得以監視舊版伺服器。 4.
A 附錄 使用 iDRAC Web 主控台設定 iDRAC 的 SNMP 參數 1. 啟動 iDRAC (第 12 代以後的 Dell PowerEdge 伺服器) Web 主控台,然後在主控台瀏覽至 Network > Services。 2. 設定 SNMP 代理程式的內容: a. 將 Enabled 設為 True,SNMP 通訊協定設為 All (SNMP v1/v2/v3)。 b. 以社群字串設定 SNMP 社群名稱。 c. 按一下套用提交組態。 註: 外掛程式只用 SNMP v1 或 SNMP v2 通訊協定與 iDRAC 通訊。 使用 RACADM 指令碼設定 iDRAC 的 SNMP 參數 1. 執行下列 ssh 命令,啟動 iDRAC RACADM CLI: ssh root@ 2. 執行下列命令,將命令模式變更為 racadm: racadm 3. 執行下列命令,設定 SNMP 社群字串: racadm set idrac.SNMP.AgentCommunity 4.
4. 在右窗格中,按一下 SNMP and Email Settings 標籤,然後執行下列動作: ● 在 IP Destination List 部分,依需求填入 Destination Address 欄位,確定已勾選其個別 State 核取方塊,然後按一下 Apply。 ● 依需求在 IP Destination List 部分底部設定 Community String 和 SNMP Alert Port Number,然後按一下 Apply。 ● 在 SNMP Trap Format 部分,選取所需的 SNMP 設陷格式,然後按一下 Apply。 使用 RACADM 設定 iDRAC 的 SNMP 設陷的目的地位址 1. 執行下列 ssh 命令,啟動 iDRAC RACADM CLI: ssh root@ 2. 執行下列命令,將命令模式變更為 racadm: racadm 3. 執行下列命令,設定接收警示用的 iDRAC SNMP 連接埠: racadm set idrac.SNMP.AlertPort 4.