Dell Server PRO Management Pack 2.
Remarques et précautions REMARQUE : une REMARQUE indique des informations importantes qui peuvent vous aider à mieux utiliser votre ordinateur. PRÉCAUTION : une PRÉCAUTION indique un risque d’endommagement du matériel ou de perte de données en cas de non-respect des instructions. ____________________ Les informations que contient ce document sont sujettes à modification sans préavis. © 2011 Dell Inc. Tous droits réservés.
Table des matières 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . 5 Nouveautés . . . . . . . . . . . . . . . . . . . . . . . . 6 Présentation . . . . . . . . . . . . . . . . . . . . . . . . 6 Termes connexes . . . . . . . . . . . . . . . . . . . . . Qu'est-ce que PRO Tip ? . . . . . . . . . . . . . . . . . . Fonctions et fonctionnalités . . . . . . . . . . . . . . . Comprendre la gestion de PRO Tip . . . . . . . . . . . . Systèmes d'exploitation pris en charge 2 . . . .
3 Documentation et ressources associées . . . . . . . . . . . . . . . 43 Remarques concernant la sécurité Autres documents utiles . . . . . . . . . . . . 43 . . . . . . . . . . . . . . . . 43 Obtention d'une assistance technique 4 Table des matières . . . . . . . . .
Introduction Ce document s'adresse aux administrateurs système qui utilisent le progiciel de gestion Dell Server PRO (Dell PRO Pack) pour surveiller des systèmes Dell et effectuer une action corrective lorsqu'un système inefficace est identifié.
Nouveautés Cette version de PRO Pack est dotée des fonctionnalités suivantes : • SCE 2010 • SCVMM 2008 R2 SP1 • Nouveau matériel pris en charge • Alertes supplémentaires de Dell OpenManage et de carte réseau (NIC) • Optimisations des résolutions de certaines anciennes alertes Pour obtenir plus d'informations sur les alertes et leur résolution, voir Alertes et actions de restauration.
Termes connexes • Un système géré est un système Dell exécutant OMSA? (Dell OpenManage Server Administrator), qui est surveillé et géré à l'aide d'Operations Manager et SCVMM. Il peut être géré localement ou à distance à l'aide d'outils pris en charge. • Une station de gestion ou Management Station est un système Dell fonctionnant sous Microsoft Windows, sur lequel Operations Manager et SCVMM sont installés afin de gérer les charges de travail virtuelles.
Fonctions et fonctionnalités Dell PRO Pack : 8 • Exécute la gestion PRO des systèmes Dell PowerEdge tournant sur les plateformes Microsoft Hyper-V par la surveillance continue de l'intégrité de votre infrastructure physique et virtuelle. • Utilise Operations Manager et SCVMM pour détecter des événements comme la perte de redondance du bloc d'alimentation, les températures supérieures aux valeurs de seuil, les erreurs de batterie de stockage sur le système, les défaillances de disques virtuels, etc.
Comprendre la gestion de PRO Tip Cette section présente une configuration habituelle du progiciel Dell PRO et la séquence d'événements concernant la gestion de PRO Tip. Figure 1-1.
Le tableau 1-1décrit la séquence d'événements relative à la gestion de PRO Tip. Tableau 1-1. Séquence d'événements avec description Numéro de séquence Événement 1 Les agents Operations Manager situés sur l'hôte sont activés pour détecter les alertes d'avertissement, erreur ou panne générées par OMSA. 2 L'alerte est envoyée à Operations Manager. 3 La console Operations Manager affiche les alertes PRO actives. 4 Operations Manager fait parvenir l'alerte et l'ID PRO Tip associé à la console SCVMM.
Systèmes d'exploitation pris en charge Les systèmes d'exploitation pris en charge par le progiciel Dell PRO sur le système géré et la station de gestion sont les suivants : Système géré : Le système géré pour le progiciel PRO est un serveur Virtual Machine Manager. Pour plus d'informations, consultez technet.microsoft.com/en-us/library/cc764213.aspx Station de gestion : Pour obtenir la liste des configurations de SCOM, SCE et SCVMM prises en charge, consultez : • SCOM 2007 R2 : technet.microsoft.
Introduction
Utilisation de Dell Performance Resource Optimization Pack Surveillance à l'aide de la console SCVMM Vous pouvez gérer l'intégrité de votre environnement virtualisé à l'aide des PRO Tips (Conseils PRO) affichés sur la console SCVMM. Pour afficher la fenêtre PRO Tip, cliquez sur le menu PRO Tips de la barre d'outils, comme illustré à la figure 2-1. Le menu affiche également le nombre de PRO Tips actifs entre parenthèses. Figure 2-1. Bouton PRO Tip sur la console SCVMM Cliquez sur le menu PRO Tips.
Implémentation des actions de récupération La fenêtre PRO Tip fournit une option permettant d'implémenter ou d'abandonner l'action recommandée. Si vous sélectionnez l'option Implémenter, SCVMM implémente l'une des tâches de récupération décrites ci-dessous, selon la nature de l'alerte. Placement de l'hôte en mode Restreindre Le placement d'un hôte en mode Restreindre empêche toute affectation de charge de travail à l'hôte tant que le problème n'a pas été résolu.
La console SCVMM utilise un classement par étoile, de zéro à cinq, pour évaluer les hôtes. Si une spécification matérielle n'est pas satisfaite (par exemple, insuffisance de la capacité de mémoire et du disque dur), le classement zéro étoile est automatiquement attribué à l'hôte et la console SCVMM ne vous autorise pas à placer une machine virtuelle sur cet hôte.
Figure 2-2. Travail achevé L'implémentation PRO Tip du déplacement des machines virtuelles peut échouer si aucun autre hôte intègre n'est disponible dans le groupe ou le cluster d'hôtes. En pareil cas, la fenêtre PRO Tip affiche l'état du PRO Tip correspondant comme Échec et la raison est élaborée dans la section Erreur. La condition de l'entrée correspondante dans la section Travaux de la console SCVMM s'affiche également comme Échec.
Migration en ligne des machines virtuelles En tant qu'utilisateur connecté, durant la migration en ligne, vous pouvez migrer une machine virtuelle d'un nœud d'un cluster de basculement Windows Server 2008 R2 à un autre nœud du même cluster sans arrêt ou interruption du système. La différence entre une migration rapide et une migration en ligne est que la première entraîne un arrêt alors que la seconde ne crée aucune interruption. REMARQUE : Windows Server 2008 Hyper-V prend en charge la migration rapide.
Les alertes s'affichent à droite de l'écran, comme illustré dans la figure 2-3. Figure 2-3. • Vue d'état : affiche en format tabulaire les objets du système Dell découverts. La vue d'état affiche les objets incluant le nom, le chemin, l'intégrité de stockage du système Dell, etc. Vous pouvez personnaliser la vue d'état en spécifiant les objets que vous voulez afficher et la présentation des données. Figure 2-4.
Utilisation de Health Explorer pour réinitialiser les alertes Health Explorer permet d'afficher les alertes et d'entreprendre l'action qui s'impose. Lorsque vous sélectionnez Abandonner dans la fenêtre PRO Tip, l'alerte disparaît de celle-ci. Toutefois, pour réinitialiser cette alerte manuellement dans Health Explorer, procédez comme suit : 1 Sur le menu Actions, cliquez sur Health Explorer. 2 Effectuez un clic droit sur l'alerte que vous voulez fermer. 3 Sélectionnez Réinitialiser l'intégrité.
REMARQUE : lorsque vous sélectionnez Activer, SCOM effectue une implémentation automatique pour le moniteur de l'unité. Étant donné que cette action implique la migration VMM, examinez et définissez les valeurs de façon appropriée. 7 Cochez la case Imposer. 8 Cliquez sur Appliquer. PRÉCAUTION : l'enregistrement des paramètres dans le pack de gestion par défaut crée une dépendance entre PRO Pack et le pack de gestion.
Tableau 2-1. Cause de l'alerte et action de restauration ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité 1053 Le capteur de température a détecté une valeur d'avertissement Avertissement Un capteur de Restreindre température présent sur la carte de fond de panier, la carte système, l'UC ou le logement du lecteur au sein du système spécifié a dépassé sa valeur de seuil d'avertissement.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 1154 Le capteur de tension a détecté une valeur de défaillance Erreur Un capteur de tension présent dans le système spécifié a dépassé sa valeur de seuil de défaillance.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 1353 Le bloc Restreindre Avertissement La mesure d'un d'alimentation a capteur de bloc détecté un d'alimentation avertissement présent dans le système spécifié a dépassé un seuil d'avertissement pouvant être défini.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) Gravité 1703 Le capteur de batterie a détecté une valeur d'avertissement Avertissement Un capteur de batterie présent dans le système spécifié a détecté qu'une batterie se trouvait dans un état de défaillance prédictive. 2 048 Erreur d'échec Critique de périphérique Il s'agit d'une panne Restreindre d'un composant de et migrer stockage comme un disque physique ou une enceinte.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2057 Avertissement de Avertissement Ce message détérioration de d'alerte est généré Restreindre disque virtuel lorsqu'un disque physique appartenant à un disque virtuel redondant échoue.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2100 La température a Avertissement L'enceinte du dépassé le seuil disque physique Restreindre d'avertissement est trop chaude. maximal Divers facteurs peuvent provoquer une température excessive.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2112 Enceinte arrêtée Critique 2122 Dégradation de Avertissement Panne d'un ou de plusieurs la redondance Restreindre composants de l'enceinte. Par exemple, un ventilateur ou un bloc d'alimentation peut être en panne.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2137 Avertissement de Avertissement Le contrôleur n'est délai d'attente de pas en mesure de Restreindre communication communiquer avec et migrer une enceinte. 2145 Batterie du contrôleur déchargée Avertissement Le niveau de charge de la Restreindre batterie est faible.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2174 La batterie du Avertissement Le contrôleur ne Restreindre contrôleur a été peut pas et migrer retirée communiquer avec la batterie. La batterie peut avoir été retirée ou le point de contact peut être défectueux.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) Gravité 2203 Un disque de secours dédié est défaillant Avertissement Le contrôleur ne peut pas Restreindre communiquer avec un disque affecté en tant que disque de secours dédié. 2206 Le seul disque de secours disponible est un disque SATA. Les disques SATA ne peuvent pas remplacer les disques SAS Avertissement Le seul disque physique Restreindre disponible pour être affecté en tant que disque de secours utilise la technologie SATA.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) Cause de l'alerte Action corrective recommandée par le Dell PRO Tip ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité 2213 Dépassement du nombre maximum de recharges Avertissement Un disque virtuel ou une enceinte a perdu sa redondance de données. Dans le cas d'un disque virtuel, un ou plusieurs disques physiques inclus dans le disque virtuel sont tombés en panne.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2268 Erreur de Critique communication de Storage Management Storage Management a Restreindre perdu la et migrer communication avec un contrôleur.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) Action corrective recommandée par le Dell PRO Tip ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte 2282 Échec de l'interrogation de la condition SMART du disque de secours Critique Le micrologiciel du contrôleur a tenté d'interroger la condition SMART sur le disque de secours mais n'a pas pu achever cette interrogation.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2292 La Critique communication avec l'enceinte a été perdue Le contrôleur a perdu la Restreindre communication et migrer avec un module de gestion de d'enceinte (EMM). Les câbles peuvent être desserrés ou défectueux.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) Action corrective recommandée par le Dell PRO Tip ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte 2301 Erreur matérielle de l'enceinte Critique L'enceinte ou l'un de ses composants Restreindre se trouve dans un et migrer état Échec ou Détérioré.
Tableau 2-1.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM 2318 2319 2320 2321 Gravité Cause de l'alerte Des problèmes Avertissement La batterie ou le avec la batterie chargeur de ou le chargeur batterie ne de batterie ont fonctionne pas été détectés. La correctement. batterie est en mauvais état. Erreur ECC monobit sur le contrôleur DIMM.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2322 Le bloc Critique d'alimentation en CC est éteint Le bloc d'alimentation est Restreindre éteint. Un et migrer utilisateur a pu l'éteindre ou le bloc d'alimentation est défectueux.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité 2328 Avertissement Le contrôleur NVRAM contient des données corrompues.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2342 La vérification Avertissement Les données sur un de la cohérence a disque source et Restreindre détecté des les données et migrer données de redondantes sur un parité non disque de cohérentes. La destination ne sont redondance des pas cohérentes.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip 2356 Erreur de Critique communications SMP SAS Le texte pour cette alerte est généré Restreindre par le micrologiciel et peut varier selon la situation. Le SMP dans ce texte réfère au protocole de gestion de systèmes SAS.
Tableau 2-1. Cause de l'alerte et action de restauration (suite) ID d'événement Description de Dell l'alerte sur SCOM/ SCE et PRO Tip de SCVMM Gravité Cause de l'alerte Action corrective recommandée par le Dell PRO Tip Erreurs de média sur les lecteurs physiques.
Documentation et ressources associées Ce chapitre présente les documents et ressources disponibles pour vous aider à travailler avec Pro Pack 2.1. Remarques concernant la sécurité Les privilèges d'accès à Operations Console sont gérés en interne par l'infrastructure SCOM/SCE. Ceci peut être configuré à l'aide de l'option Rôles de l'utilisateur sous la fonctionnalité Administration→ Sécurité de la console SCOM/SCE.
• Le Guide d'utilisation de l'interface de ligne de commande de Dell OpenManage Server Administrator fournit des informations sur l'interface de ligne de commande de Server Administrator, y compris l'explication des commandes CLI pour l'affichage des états du système, l'accès aux journaux, la création de rapports, la configuration de différents paramètres de composants et la définition de seuils critiques.