適用於 Microsoft System Center Virtual Machine Manager 的 Dell EMC Server PRO Management Pack 5.
註、警示與警告 註: 「註」表示可以幫助您更有效地使用產品的重要資訊。 警示: 「警示」表示有可能會損壞硬體或導致資料遺失,並告訴您如何避免發生此類問題。 警告: 「警告」表示有可能會導致財產損失、人身傷害甚至死亡。 © 2009 - 2017 Dell Inc. 著作權所有,並保留一切權利。版權所有,翻印必究。Dell、EMC 與其他商標均為 Dell Inc.
目錄 1 簡介................................................................................................................................................................4 此版本新特色.....................................................................................................................................................................5 概觀........................................................................................................................................................................
1 簡介 本文件適用於使用 Dell EMC Server PRO Management Pack (Dell EMC PRO Pack) 來監視 Dell 系統,並在發現系統不足時採取補救動 作的系統管理員。 Dell EMC PRO Pack 5.
此版本新特色 Dell EMC PRO Pack 的發行重點包括: • 支援 OpenManage Server Administrator 8.4 到 9.0.
• 當監視的硬體進入不良狀態時,產生 PRO 提示。 • 執行虛擬機器即時移轉,且無停機時間。如需詳細資訊,請參閱虛擬機器即時移轉。 • 覆寫 Dell EMC PRO Pack 預設復原動作。如需詳細資訊,請參閱覆寫復原動作。 • 透過實作 PRO 提示提供的補救動作,將停機時間降至最低。兩個補救動作為: • 限制:在此模式中,維護工作完成前建議先暫時停用伺服器,以放置新的虛擬機器。 • 限制和移轉:在此模式中,建議將所有正在執行的虛擬機器,從不良的伺服器移轉到良好的伺服器,以免服務中斷。如需詳 細資訊,請參閱執行復原動作。 瞭解 PRO 提示管理 本章節說明一般的 Dell EMC Server PRO Pack 設定,以及與 PRO 提示管理相關的事件順序。 圖 1.
順序號 事件 8 成功執行後,VMM 主控台會顯示 PRO 提示的狀態為 Resolved (已解決)。 9 PRO 提示從 VMM PRO Tip (PRO 提示) 視窗消失。 10 PRO 作用中警示會從 Operations Manager 中消失。 有關事件類型和關聯補救動作的詳細資訊,請參閱警示與復原動作。 支援的作業系統 Dell EMC Server PRO Pack 在受管系統與管理站支援的作業系統如下: 受管系統: 支援的作業系統。如需詳細資訊,請參閱 Technet.microsoft.com/en-us/library/gg610649.aspx。 管理站: 支援的作業系統: • 若為 Operations Manager 2016,請參閱 Technet.microsoft.com/en-us/library/dn997272(v=sc.16).aspx • 若為 Operations Manager 2012 R2 或 Operations Manager 2012 SP1 或 Operations Manager 2012,請參閱 Technet.
2 使用 Dell EMC Server Performance Resource Optimization Pack 本章建議使用 PRO Pack 的步驟。 主題: • 規劃 PRO 環境的提示 • 使用 VMM 監視 • 在 Operations Manager 使用 PRO 特定警示監視 • 使用健全狀況總管重設警示 • 覆寫復原動作 • 警示與復原動作 規劃 PRO 環境的提示 您可以規劃啟用與環境相關的 PRO 監視。依預設,所有 PRO 監視在 Dell EMC Server PRO Pack 中皆為停用。如需警示清單和復原動 作,請參閱 警示與復原動作。選擇您要啟用的警示。使用 OpsMgr 主控台中的 OpsMgr Authoring Console (撰寫主控台) (或) Authoring Pane (撰寫窗格),建立可啟用與 PRO 監視相關之管理組件的覆寫。 啟用 PRO 監視的步驟如下: 1 啟動 OpsMgr 主控台。 2 在 Navigation (瀏覽) 窗格上,按一下 Authoring (製作)。 3 在 Authoring (撰寫) 標籤中,選取 Mana
圖 2.
• VMM 主控台的 Jobs (作業) 區段會顯示一個項目。此項目顯示作業狀態為 Completed (已完成),如下圖所示: 圖 3.
• 狀態檢視 警示檢視 警示檢視採用表格格式顯示 Dell PRO 特定警示,並且提供嚴重性層級、來源、名稱、解決狀態,以及建立日期與時間的相關資訊。 若要存取 Alert View (警示檢視): 1 啟動 Operations Manager 主控台。 2 按一下 Monitoring (監視) 索引標籤。 3 按一下 Dell Server PRO Pack > Dell Server PRO Alerts。 這些警示顯示在螢幕的右側,如下圖所示。 圖 4. Dell Server PRO Alerts 狀態檢視 採用表格格式顯示探索到的 Dell 系統。狀態檢視顯示物件的名稱、路徑及 Dell 系統的儲存健全狀況。您可以透過定義應顯示哪些物件 和資料的顯示方式,將狀態檢視個人化。 圖 5.
若要手動重設警示: 1 在 Actions (動作) 功能表中,按一下 Health Explorer (健全狀況總管)。 2 在要關閉的警示上按一下右鍵。 3 選取 Reset Health (重設健全狀況)。 警示會從 PRO Tip (PRO 提示) 視窗中消失。 覆寫復原動作 PRO Pack 5.
圖 6. 覆寫內容 警示與復原動作 下表列出警示及推薦補救動作: 表 2.
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 1105;5105 風扇感應器偵測到無法修 復的值 錯誤 風扇感應器偵測到無法修 復的錯誤。隨附感應器和 機箱位置資訊、先前的狀 態以及風扇感應器偵測到 的值。 限制 1153;5153 電壓感應器偵測到警告值 警告 特定系統中的電壓感應器 超出其警告閾值。隨附感 應器和機箱位置資訊、先 前的狀態以及電壓感應器 偵測到的值。 限制 1154;5154 電壓感應器偵測到故障值 錯誤 特定系統中的電壓感應器 超出其故障臨界值。 限制和移轉 1155;5155 電壓感應器偵測到無法修 復的值 錯誤 特定系統中的電壓感應器 偵測到無法修復的錯誤。 隨附感應器和機箱位置資 訊、先前的狀態以及電壓 感應器偵測到的值。 限制和移轉 1203;5203 電流感應器偵測到警告值 警告 中的電流感應器超出其警 告臨界值。 限制 1204;5204 電流感應器偵測到故障值 錯誤 特定系統中的電流感應器 超出其
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 件拔除、故障或不存在。 隨附冗餘裝置和機箱位 置、先前冗餘狀態以及完 整冗餘所需的裝置數。 1353;5353 電源供應器偵測到警告 警告 特定系統中的電源感應器 讀數超出可定義的警告臨 界值。 限制 1354;5354 電源供應器偵測到故障 錯誤 電源已斷開或出故障。 限制 1355;5355 電源供應感應器偵測到無 法修復的值 錯誤 特定系統中的電源供應感 應器偵測到無法修復的錯 誤。隨附感應器和機箱位 置、先前狀態、電源供應 器類型、其他電源供應器 的狀態以及組態錯誤類型 資訊。 限制 1403;5403 記憶裝置狀態警告 警告 記憶裝置修正率超出可接 受的值。 限制 1404;5404 記憶裝置錯誤 錯誤 記憶裝置修正率超出可接 受的值,記憶體備用記憶 單元已啓用,或發生多位 元的 ECC 錯誤。 限制和移轉 1405;5405 記憶體裝置狀態無法修復 錯誤 記憶體裝置狀態無法修
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 1505;5505 系統的交流電源線感應器 故障 錯誤 指定系統中的交流電源線 感應器故障。無法監視交 流電源線狀態。隨附感應 器和機箱位置資訊。 限制和移轉 1603;5603 處理器感應器偵測到警告 值 警告 特定系統中的處理器感應 器處於流速控制狀態。隨 附感應器和機箱位置、先 前的狀態以及處理器感應 器狀態資訊。 限制 1604;5604 處理器感應器偵測到故障 值 錯誤 特定系統的處理器感應器 已停用,有組態錯誤或發 生超出極限溫度。隨附感 應器和機箱位置、先前的 狀態以及處理器感應器狀 態。 限制和移轉 1605;5605 處理器感應器偵測到無法 修復的值 錯誤 特定系統中的處理器感應 器故障。隨附感應器和機 箱位置、先前的狀態以及 處理器感應器狀態。 限制和移轉 1703;5703 電池感應器偵測到警告值 警告 特定系統中的電池感應器 偵測到電池處於可預知故 障狀態。 限制 17
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2082 虛擬磁碟重建故障 嚴重 虛擬磁碟中包含的實體磁 碟發生故障或損毀。 限制 2083 實體磁碟重建故障 嚴重 虛擬磁碟中包含的實體磁 碟發生故障或損毀。 限制 2094 回報預測故障 警告 預測此實體磁碟有故障。 限制 2100 溫度超出最大警告臨界值 警告 實體磁碟機箱太熱。有好 幾種因素可能導致溫度過 高。 限制 2101 溫度低於最小警告臨界值 警告 實體磁碟外殼太冷。 限制 2102 溫度超出最大故障臨界值 嚴重 實體磁碟機箱太熱。有好 幾種因素可能導致溫度過 高。 限制和移轉 2103 溫度低於最小故障臨界值 嚴重 實體磁碟外殼太冷。 限制和移轉 2112 機箱關機 嚴重 實體磁碟機箱太熱或太 冷,超出允許的最高或最 低溫度範圍。 限制和移轉 2122 冗餘降級 警告 一或多個機櫃元件故障。 例如,風扇或電源供應器 可能已經故障。 限制
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2201 通用熱備份發生故障 警告 控制器無法與指定為通用 熱備份的磁碟進行通訊。 磁碟可能已經故障或取出 了。 限制 2203 專用熱備份發生故障 警告 控制器無法與指定為專用 熱備份的磁碟進行通訊。 限制 2206 唯一適用的熱備份磁碟為 警告 SATA 磁碟。SATA 磁碟無 法取代 SAS 磁碟 唯一可以指定為熱備份磁 碟的實體磁碟使用 SATA 技術。 限制 2207 唯一適用的熱備份磁碟為 警告 SAS 磁碟。SAS 磁碟無法 取代 SATA 磁碟 唯一可以指派為熱備份的 限制 實體磁碟使用 SAS 技術。 2213 超過最多充電次數 警告 虛擬磁碟或機箱遺失了資 料冗餘。若是虛擬磁碟, 虛擬磁碟中有一或多個實 體磁碟故障。 限制 2246 控制器電池已收到影響 警告 電池溫度高。這可能是由 於電池正在充電。 限制 2264 有設備遺失 警告 控制器無法與裝置通訊。 裝置
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2289 控制器 DIMM 上的多位元 嚴重 ECC 錯誤 在讀取或寫入作業過程 中,遇到一個涉及多位元 的錯誤。 限制和移轉 2290 控制器 DIMM 上的單位元 警告 ECC 錯誤 在讀取或寫入作業過程 中,遇到一個涉及單位元 的錯誤。 限制 2292 與機箱失去通訊 嚴重 控制器與機箱管理模組 (EMM) 失去通訊。纜線 可能鬆脫或受損。 限制和移轉 2293 EMM (機櫃管理模組) 故 障 錯誤 故障可能由 EMM 的功率 損耗引起。 限制和移轉 2298 機箱有一個損壞的感應器 警告 機箱有一個損壞的感應 器。機箱感應器監視風扇 速度、溫度探針等。 限制 2299 損壞的 PHY 嚴重 實體連接或 PHY 有問 題。 限制 2300 機箱不穩定故障 嚴重 控制器接收不到機箱發出 的持續回應。 限制和移轉 2301 機箱硬體錯誤 嚴重 機箱或機箱元件處於失敗
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2318 偵測到電池或電池充電器 有問題。電池效能狀況不 佳。 電池或電池充電器無法正 常運作。 限制 2319 控制器 DIMM 上的單位元 警告 ECC 錯誤。DIMM 受損。 雙排記憶體模組 (DIMM) 開始發生故障。 限制和移轉 2320 單位元 ECC 錯誤。DIMM 嚴重 嚴重受損。 DIMM 發生故障。資料即 將遺失,或資料可能即將 毀損。 限制和移轉 2321 單位元 ECC 錯誤。控制 嚴重 器 DIMM 停止運作。不會 有進一步的報告 雙排記憶體模組 (DIMM) 發生故障。資料即將遺失 或資料即將毀損。 限制和移轉 2322 直流電源供應器關閉 嚴重 電源供應器已關閉。使用 者關閉了電源供應器,或 是電源供應器受損。 限制和移轉 2324 交流電源供應器纜線已移 除 嚴重 電源線可能被拉出或移 除。電源線也有可能過 熱、變形而無法使用。 限制和移轉 2327 NVR
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2350 在重建和復原作業過程中 出現無法修復的磁碟媒體 錯誤 嚴重 重建和復原作業遇到無法 修復的磁碟媒體錯誤。 限制 2355 機箱韌體下載失敗。 警告 系統無法將韌體下載至機 箱。控制器可能已經與機 箱失去通訊。資料傳輸可 能有問題,或下載媒體可 能毀損。 限制和移轉 2356 SAS SMP 通訊錯誤 嚴重 此警示的文字由韌體產 生,可視情況而改變。本 文件中提及的 SMP 是指 SAS 管理通訊協定。 限制 2357 SAS 擴充裝置錯誤 嚴重 機箱可能出現問題。驗證 機箱及其元件的健康狀 況。 限制 2387 偵測到虛擬磁碟損壞區塊 媒體錯誤 錯誤 虛擬磁碟損壞區塊原因在 於,一或多個成員實體磁 碟上出現無法修復的損壞 區塊。 限制和移轉 2396 一致性檢查偵測到多個無 法更正的媒體錯誤 嚴重 實體磁碟有媒體錯誤。 限制 2397 一致性檢查完成時發生無 法更正的錯誤
Dell 事件 ID Operations Manager 的警 重要性 示說明和 VMM 中的 PRO 提示 警示原因 Dell PRO 提示推薦的補救 動作 2911 快取 LUN 讀/寫故障 嚴重 訊息中提到的快取 LUN 無法順利執行讀取或寫入 作業。在訊息中提到的路 徑嘗試讀取或寫入 Fluid Cache 裝置時,使用者應 用程式應已顯示 I/O 故 障。 限制和移轉 2923 快取記憶體裝置遺失並且 無回應 嚴重 一或多個快取記憶體裝置 遺失並且快取記憶體無回 應。 限制和移轉 5050 溫度感應器故障 嚴重 訊息中提到的溫度感應器 故障。這種情況可能會導 致系統效能問題以及系統 監視功能受損。 限制和移轉 5100 風扇感應器故障 嚴重 訊息中提到的感應器故 障。可能需要有感應器才 能獲得最佳的系統效能。 限制和移轉 5103 風扇感應器故障 警告 訊息中提到的風扇無法正 常運作。風扇可能未正確 安裝或可能故障。 限制 5150 電壓感應器故障 嚴重 訊息中提到的電壓感應器 可能已故障。這種情況可 能會導致系統效能問題以 及系統監
3 相關說明文件和資源 本章提供詳細的說明文件和資源,可協助您使用 Pro Pack 5.0。 主題: • 安全性考量 • 其他您可能需要的文件 安全性考量 Operations 主控台存取權限是由 Operations Manager 內部處理。您可以使用 Operations Manager 主控台 Administration Security (管 理安全性) 功能下的 User Roles (使用者角色) 選項來進行設定。指派給您的角色設定檔決定您可執行的動作和您能管理的物件。如需 有關安全性考量的詳細資訊,請參閱 Technet.microsoft.
4 與 Dell 公司聯絡 註: 如果無法連線網際網路,則可以在購買發票、包裝單、帳單或 Dell 產品目錄中找到聯絡資訊。 Dell 提供多項線上和電話支援與服務選擇。服務的提供因國家/地區和產品而異,某些服務可能在您所在地區並不提供。若因銷售、 技術支援或客戶服務問題要與 Dell 聯絡: 1 移至 Dell.com/support.
5 從 Dell EMC 支援網站存取文件 您可以用下列連結存取所需文件: • Dell EMC 企業系統管理文件 — Dell.com/SoftwareSecurityManuals • Dell EMC OpenManage 文件 — Dell.com/OpenManageManuals • Dell EMC 遠端企業系統管理文件 — Dell.com/esmmanuals • IDRAC 和 Dell EMC Lifecycle Controller 文件 — Dell.com/idracmanuals • Dell EMC OpenManage Connections 企業系統管理文件 — Dell.com/OMConnectionsEnterpriseSystemsManagement • Dell EMC 服務性工具文件 — Dell.com/ServiceabilityTools • 若為用戶端命令套裝系統管理文件 — Dell.com/DellClientCommandSuiteManuals • a 前往 Dell.