Dell Server PRO Management Pack 2.
Anmerkungen und Vorsichtshinweise ANMERKUNG: Eine ANMERKUNG macht auf wichtige Informationen aufmerksam, mit denen Sie den Computer besser einsetzen können. VORSICHTSHINWEIS: Durch VORSICHTSHINWEISE werden Sie auf potenzielle Gefahrenquellen hingewiesen, die Hardwareschäden oder Datenverlust zur Folge haben könnten, wenn die Anweisungen nicht befolgt werden. ____________________ Irrtümer und technische Änderungen vorbehalten. © 2011 Dell Inc. Alle Rechte vorbehalten.
Inhalt 1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . Neuerungen Übersicht . . . . . . . . . . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . . 6 Zugehörige Begriffe . . . . . . . . . . . . . . . . . . . . 7 . . . . . . . . . . . . . . . . . . . 7 . . . . . . . . . . . . . . . . . . . . . . . . 8 Was ist ein PRO Tip? Funktionen . Zum Verständnis der PRO Tip-Verwaltung Unterstützte Betriebssysteme 2 5 . . . . . . . . . . . . . . . . . . . .
Warnhinweise und Wiederherstellungsmaßnahmen 3 . . . . . . . . . . . . 21 . . . . . . . . . . . . . . . . 49 Relevante Dokumentation und Ressourcen 49 Sicherheitsüberlegungen Weitere nützliche Dokumente . Technische Unterstützung . 4 Inhalt . . . . . . . . . . . . . 49 . . . . . . . . . . . . . . .
Einführung Dieses Dokument richtet sich an Systemadministratoren, die das Dell Server PRO Management Pack (Dell PRO Pack) zur Überwachung von DellSystemen und zum Ergreifen von Störungsbeseitigungsmaßnahmen verwenden, wenn ein ineffizientes System festgestellt wird.
Neuerungen Diese Version des PRO Pack unterstützt Folgendes: • SCE 2010 • SCVMM 2008 R2 SP1 • Neue Hardware-Unterstützung • Zusätzliche Warnungen für Dell OpenManage und Network Interface Card (NIC) • Verbesserungen bei den Auflösungen einiger alter Warnhinweise Weitere Informationen zu Warnungen und den dazugehörigen Lösungen finden Sie unter Warnhinweise und Wiederherstellungsmaßnahmen.
Zugehörige Begriffe • Ein verwaltetes System ist ein Dell-System, auf dem der Dell OpenManage Server Administrator (OMSA) ausgeführt wird, der mithilfe von Operations Manager und SCVMM überwacht und verwaltet wird. Es kann lokal oder im Remote-Zugriff mithilfe von unterstützten Hilfsprogrammen verwaltet werden. • Eine Management-Station oder Managing-Station ist ein MicrosoftWindows-basiertes Dell-System, auf dem Operations Manager und SCVMM installiert sind, um virtuelle Arbeitslasten zu verwalten.
Funktionen Dell PRO Pack: 8 • Führt das PRO-Management von Dell PowerEdge-Systemen aus, die Microsoft Hyper-V-Plattformen ausführen, indem der Funktionszustand der physischen und virtuellen Infrastruktur kontinuierlich überwacht wird. • Wird zusammen mit Operations Manager und SCVMM eingesetzt, um Ereignisse wie den Verlust von Netzteilredundanz festzustellen, sowie Temperaturen, die über Schwellenwerte hinausgehen, Fehler bei Systemspeicherakkus, Ausfälle virtueller Festplatten usw.
Zum Verständnis der PRO Tip-Verwaltung In diesem Abschnitt werden ein typisches Setup von Dell PRO Pack sowie die Sequenz der mit der PRO-Tip-Verwaltung verbundenen Ereignisse erläutert. Abbildung 1-1.
Tabelle 1-1 beschreibt die Reihenfolge der Ereignisse, die beim Verwalten von PRO Tip auftreten. Tabelle 1-1. Ereignisreihenfolge mit Beschreibung Reihenfolgenummer Ereignis 1 Die auf dem Host aktivierten Operations-ManagerAgenten ermitteln die Warnungs-, Fehler- oder Ausfallhinweise, die von OMSA erzeugt werden. 2 Warnhinweis wird an Operations Manager gesendet. 3 Die Operations-Manager-Konsole zeigt aktive PROWarnhinweise an.
Unterstützte Betriebssysteme Folgende Betriebssysteme werden von Dell PRO Pack auf dem verwalteten System und der Management-Station unterstützt: Verwaltetes System: Das verwaltete System für PRO Pack ist ein Virtual Machine Manager Server. Weitere Informationen finden Sie unter technet.microsoft.com/ en-us/library/cc764213.aspx. Management-Station: Eine Liste unterstützter Konfigurationen für SCOM, SCE und SCVMM finden Sie unter: • SCOM 2007 R2 - technet.microsoft.com/en-us/library/bb309428.
Einführung
Verwendung von Dell Performance Resource Optimization Pack Überwachung unter Verwendung von SCVMM Sie können den Funktionszustand Ihrer virtualisierten Umgebung vewalten, indem Sie PRO Tips verwenden, die auf der SCVMM-Konsole angezeigt werden. Um das PRO Tip-Fenster einzublenden, klicken Sie auf das Menü PRO Tips auf der Symbolleiste, wie in dargestellt. Abbildung 2-1 Im Menü wird die Anzahl aktiver PRO Tips in Klammern angezeigt. Abbildung 2-1.
Implementierung von Wiederherstellungsmaßnahmen Das PRO Tip-Fenster bietet die Option, die empfohlene Maßnahme entweder zu implementieren oder zu verwerfen. Bei Wahl der Option Implementieren implementiert SCVMM entsprechend der Art des Warnhinweises einen der nachstehend beschriebenen Wiederherstellungs-Tasks.
SCVMM bewertet Hosts mit einem Sternchensystem in einem Bereich von null bis fünf Sternchen. Wenn eine Hardwareanforderung nicht erfüllt wird (z. B. nicht genügend Festplatten- und Speicherkapazität), erhält der Host automatisch null Sternchen, und SCVMM lässt nicht zu, dass ein VM auf diesen Host platziert wird. Die Systemfunktionszustände, die eine Migration von VMs auslösen, sind Warnungen zu Hardwarefehlern auf Virtualisierungs-Hosts, z. B.
Abbildung 2-2. Abgeschlossener Auftrag Die PRO Tip-Implementierung des Verschiebens von VMs kann fehlschlagen, wenn in der Host-Gruppe oder im Host-Cluster keine anderen funktionstüchtigen Hosts verfügbar sind. In solchen Fällen wird der Zustand des entsprechenden PRO Tip im PRO Tip-Fenster als Failed (Fehlerhaft) angezeigt, und die entspre-chende Ursache wird im Bereich Error (Fehler) näher erläutert.
Weitere Informationen finden Sie unter Zurücksetzen von Warnhinweisen mithilfe des Health Explorers. VM-Live-Migration Als verbundener Benutzer können Sie während der Live-Migration eine VM von einem Knoten eines Windows Server 2008 R2-Failover-Clusters ohne Ausfallzeit zu einem anderen Knoten im selben Cluster migrieren.
Abbildung 2-3. Warnungsansicht • State View (Zustandsansicht) – Enthält die ermittelten DellSystemobjekte in Tabellenformat. In der Zustandsansicht werden Objekte mit Namen, Pfad, Speicherfunktionszustand des Dell-Systems usw. angezeigt. Sie können die Zustandsansicht Ihren persönlichen Anforderungen anpassen, indem Sie festlegen, welche Objekte angezeigt werden sollen und wie die Daten angezeigt werden. Abbildung 2-4.
Zurücksetzen von Warnhinweisen mithilfe des Health Explorers Health Explorer ermöglicht es Ihnen, Warnhinweise anzuzeigen und entsprechende Maßnahmen zu ergreifen. Wenn Sie Dismiss (Verwerfen) im PRO Tip-Fenster auswählen, wird der Warnhinweis entfernt. So können Sie diesen Warnhinweis in Health Explorer manuell zurücksetzen: 1 Klicken Sie im Menü Actions (Maßnahmen) auf Health Explorer. 2 Klicken Sie mit der rechten Maustaste auf den Warnhinweis, den Sie schließen möchten.
4 Klicken Sie mit der rechten Maustaste, und wählen Sie Override Recovery (Wiederherstellung außer Kraft setzen) aus. 5 Markieren Sie das Kontrollkästchen Override (Außer Kraft setzen). 6 Ändern Sie den Wert von RecoveryOverrideFlag. ANMERKUNG: Bei Auswahl von Enable (Aktivieren) führt SCOM eine automatische Implementierung für den Monitor der Einheit aus. Da dies VMM-Migration beinhaltet, sind die Werte entsprechend zu überprüfen und einzustellen. 7 Markieren Sie das Kontrollkästchen Enforce (Erzwingen).
Warnhinweise und Wiederherstellungsmaßnahmen Tabelle 2-1 führt die Warnhinweise sowie die entsprechenden empfohlenen Störungsbeseitigungsmaßnahmen auf: Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM 2056 Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme Virtuelle Festplatte Kritisch fehlerhaft Eine (oder mehrere) auf der virtuellen Festplatte enthaltenen physikalischen Festplatte weist Fehler auf 2057 Warnung zur Warnung Herabsetzung einer virtuellen Festplatte.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2101 Temperatur fiel auf Warnung einen Wert unterhalb des minimalen Warnungsschwelle nwerts ab.
Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2201 Ein globaler Hotspare ist fehlerhaft Warnung Der Controller ist nicht in der Lage, Einschränken mit einer Festplatte zu kommunizieren, die als globaler Hotspare zugewiesen wurde.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2207 Der einzige verfügbare Hotspare ist eine SAS-Festplatte.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2246 Die ControllerBatterie ist herabgesetzt. Warnung Die Temperatur der Batterie ist Einschränken hoch.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2272 Patrol Read hat einen nicht korrigierbaren Datenträgerfehler ermittelt Kritisch Der Patrol ReadTask hat einen Einschränken Fehler ermittelt, und Migrieren der nicht behoben werden kann.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM 2292 Die Kommunikation mit dem Gehäuse ist verloren gegangen Kritisch Die Kommunikation zwischen dem Controller und einem Gehäusemanage mentmodul (EMM) ist verloren gegangen.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2306 Tabelle Warnung beschädigter Blöcke ist voll Die ungültige Blocktabelle ist Einschränken die Tabelle, die zur Neuzuordnung beschädigter Festplattenblöcke verwendet wird.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Kritisch Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2310 Eine virtuelle Festplatte ist dauerhaft herabgesetzt Bei einer redundanten Einschränken virtuellen und Migrieren Festplatte ist die Redundanz verloren gegangen.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2318 Es wurden Warnung Probleme mit der Batterie oder mit dem Batterieladegerät ermittelt. Der Funktionszustand der Batterie ist schlecht.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2322 Das Kritisch Gleichstromnetztei l ist ausgeschaltet Die Netzteileinheit ist Einschränken ausgeschaltet.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2327 NVRAM weist Warnung beschädigte Daten auf. Der Controller führt eine Neuinitia-lisierung des NVRAM durch NVRAM weist beschädigte Einschränken Daten auf.
Tabelle 2-1.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 2356 SAS-SMPKritisch Kommunikationsfe hler Der Text für diesen WarnEinschränken hinweis wird von der Firmware erzeugt und kann je nach Situation unterschiedlich sein.
Tabelle 2-1.
Tabelle 2-1. Ursache des Warnhinweises und Wiederherstellungsmaßnahme DellBeschreibung des Schweregrad Ursache des Ereignis-ID Warnhinweises in Warnhinweises SCOM/SCE und PRO Tip in SCVMM Im Dell PRO Tip empfohlene Störungsbeseitig ungsmaßnahme 13,27,29,70 Dell OMNIC Intel Kritisch Treibername: Network Interface Link Down e1express, e1qexpress, ixgbe, e1000 Einschränken Verbindung wurde getrennt.
Verwendung von Dell Performance Resource Optimization Pack
Relevante Dokumentation und Ressourcen Dieses Kapitel stellt Ihnen Einzelheiten zu weiteren Dokumenten und Ressourcen zur Verfügung, die Sie bei der Arbeit mit dem Pro Pack 2.1 unterstützen. Sicherheitsüberlegungen Die Berechtigungen zum Zugriff auf die Betriebskonsole werden bei SCOM/SC intern gehandhabt. Dies kann eingerichtet werden, indem Sie auf der SCOM/SCE-Konsole unter der Funktion Administration→ Security (Sicherheit) die Option User Roles (Benutzerrollen) verwenden.
• Im Dell OpenManage Server Administrator-Meldungs-Referenzhandbuch sind die Meldungen aufgeführt, die im Warnungsprotokoll auf der Startseite des Server Administrators oder auf der Ereignisanzeige des Betriebssystems angezeigt werden. Das Handbuch erklärt Text, Schweregrad und Ursache der einzelnen Service-Warnmeldungen, die Server Administrator ausgibt.