Dell™ Server PRO Management Pack 2.0 pour Microsoft® System Center Virtual Machine Manager Guide d'utilisation w w w. d e l l . c o m | s u p p o r t . d e l l .
Remarques et précautions REMARQUE : une REMARQUE indique des informations importantes qui peuvent vous aider à mieux utiliser votre ordinateur. PRÉCAUTION : Une PRÉCAUTION indique un risque de dommage matériel ou de perte de données en cas de non-respect des instructions. ____________________ Les informations contenues dans ce document sont sujettes à modification sans préavis. © 2009 Dell Inc. Tous droits réservés.
Table des matières 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . . . . . . . . 6 . . . . . . . . . . . . . . 7 . . . . 7 . . . . . 8 Nouveautés de cette version Présentation Termes connexes Qu'est-ce qu'un conseil PRO ? Principales caractéristiques des fonctionnalités Compréhension de la gestion des conseils PRO . . . . . . . . 10 . . . . . . . . . . . . . .
Désinstallation de PRO Pack . . . . . . . . . . . . . . 20 . . . . . . . . . . . 20 Remarques concernant la sécurité 3 Utilisation de Dell PRO Pack . . . . . . . . . . 21 . . . . . . 21 . . . 22 . . . . . . 26 Surveillance à l'aide de la console SCVMM Implémentation des actions de récupération Surveillance à l'aide d'alertes spécifiques PRO sur la console SCOM/SCE . . . . . . . Utilisation de Health Explorer pour réinitialiser les alertes . . . . . . . . . . . . . . . . . . . .
1 Introduction Ce document s'adresse aux administrateurs système qui utilisent le pack de gestion Dell™ Server PRO (Dell PRO Pack) pour surveiller des systèmes Dell et effectuer une action corrective lorsqu'un système défectueux est identifié.
Nouveautés de cette version Cette version de PRO Pack est dotée des fonctionnalités suivantes : • SCOM 2007 R2 • SCVMM 2008 R2 • Migration en ligne des machines virtuelles sans mise hors service • Fonction pour remplacer les actions par défaut de récupération du Dell PRO Pack • Alertes Dell OpenManage™ supplémentaires • Changement dans les noms des actions de récupération : les actions « Mode de maintenance » et « Migration des machines virtuelles » de PRO Pack 1.
Qu'est-ce qu'un conseil PRO ? Conseil PRO (Performance and Resource Optimization [Optimisation des performances et des ressources]) est une fonctionnalité permettant la surveillance de l'infrastructure virtualisée et la génération d'alertes lorsque l'opportunité d'optimiser l'utilisation de ces ressources se présente. Une fenêtre Conseil PRO comprend la description de l'événement ayant généré le conseil PRO et la mesure corrective suggérée.
• Restreindre et migrer : dans ce mode, afin d'éviter une perte de service des charges virtuelles, il est recommandé que toutes les machines virtuelles en exécution soient immédiatement migrées du serveur vers un autre serveur intègre. Compréhension de la gestion des conseils PRO Afin de vous aider à comprendre la façon dont Dell PRO Pack fonctionne, cette section explique de manière détaillée une installation type et la séquence des événements impliqués. Figure 1-1.
Le tableau suivant décrit la séquence des événements qui se produisent lors de la génération et de la gestion d'un conseil PRO type. Tableau 1-1. Séquence d'événements avec description Numéro de séquence Événement 1 Les agents Operations Manager installés sur l'hôte détectent les alertes d'avertissement, d'erreur ou de défaillance consignées par Dell OpenManage Server Administrator. 2 L'alerte est envoyée à Operations Manager. 3 Operations Manager affiche des alertes spécifiques PRO actives.
Systèmes d'exploitation pris en charge Pour obtenir la matrice détaillée de prise en charge d'Operations Manager, consultez le fichier « Lisez-moi » de Dell PRO Pack intitulé DellPROMP1.0_Readme.txt. Le fichier « Lisez-moi » se trouve dans le fichier exécutable à extraction automatique intitulé Dell_ PRO Pack_2.0.0_A00.exe. Il est également disponible à la page de documentation Gestion des systèmes sur le site Web du support de Dell à l'adresse support.dell.com/manual.
Le DVD Dell Systems Management Tools and Documentation contient un fichier « Lisez-moi » pour Server Administrator et des fichiers « Lisez-moi » supplémentaires pour d'autres applications de Systems Management Software disponibles sur le DVD. Pour obtenir de la documentation sur les solutions de virtualisation, consultez le site Web du support de Dell à l'adresse support.dell.com/manuals.
Introduction
2 Pour commencer avec Dell PRO Pack Configuration minimale requise Pour implémenter Dell™ PRO Pack, vous devez vous assurer que l'environnement d'exécution minimal suivant existe : • • • Station de gestion : • Microsoft® System Center Operations Management (SCOM) 2007 SP1/R2 ou System Center Essentials (SCE) 2007 installé sur un matériel et un système d'exploitation pris en charge • System Center Virtual Machine Manager (SCVMM) 2008/R2 installé sur un matériel et un système d'exploitation pris en ch
Installation des agents SCOM/SCE et SCVMM Lorsque vous utilisez l'utilitaire d'installation pour surveiller votre infrastructure, les agents SCOM/SCE (Operations Manager) et SCVMM installés sur les hôtes gérés activent le transfert de données entre le système géré et les stations de gestion. Les agents des infrastructures SCVMM et Operations Manager sont installés manuellement ou automatiquement lors du processus de détection sur tous les hôtes Hyper-V.
L'écran Importer les packs de gestion apparaît avec un message d'avertissement dans la section Détails du pack de gestion, comme illustré dans Figure 2-1. Operations Manager affiche cet avertissement générique dans le cadre du processus de sécurité lorsque vous installez manuellement un pack de gestion. Pour plus d'informations sur la façon de modifier les paramètres de sécurité en vue de l'installation manuelle des packs de gestion, consultez la bibliothèque Microsoft TechNet. Figure 2-1.
Configuration des conseils PRO Les systèmes Dell et l'infrastructure virtuelle sont surveillés pour détecter l'arrivée d'alertes critiques uniquement ou d'alertes critiques et d'avertissement. • Une alerte d'avertissement est générée lorsqu'une mesure du composant est supérieure ou inférieure au niveau acceptable. Par exemple, le composant peut encore fonctionner, mais il risque de tomber en panne ou le composant peut fonctionner dans un état défectueux.
3 Sélectionnez l'onglet PRO, puis l'option Activer PRO sur ce groupe d'hôtes. 4 Par défaut, le niveau de surveillance est défini sur Avertissement et Critique, ce qui signifie que l'application affichera les conseils Pro générés pour les alertes d'avertissement et critiques. Pour restreindre les conseils PRO aux alertes critiques uniquement, sélectionnez l'option Critique uniquement. 5 Sélectionnez l'option Implémenter automatiquement les conseils PRO sur ce groupe d'hôtes.
Scénario 1 : la température de la carte de fond de panier dépasse sa valeur de seuil d'avertissement sur un système géré. Tableau 2-1. Vérification de l'action de récupération pour les conditions d'alerte d'avertissement. Vos Actions Réponse du système attendue Générez une alerte d'avertissement de température sur le système géré, de sorte que la température de la carte de fond de panier dépasse sa limite de seuil d'avertissement.
Scénario 2 : la température de la carte de fond de panier dépasse sa valeur de seuil de panne sur un système géré. Tableau 2-2. panne. Vérification de l'action de récupération pour les conditions d'alerte de Vos Actions Réponse du système attendue Générez une alerte de • Dell PRO Pack génère l'alerte correspondante dans température sur le système géré, Operations Manager.
Désinstallation de PRO Pack Vous pouvez désinstaller PRO Pack en le supprimant de la console Operations Manager. Lorsque vous supprimez PRO Pack, l'ensemble des paramètres et des seuils qui lui sont associés sont supprimés de la console Operations Manager. Pour désinstaller PRO Pack : 1 Lancez la console Operations Manager. 2 Sélectionnez Administration→ Packs de gestion. 3 Dans le volet Packs de gestion, effectuez un clic droit sur Pack de gestion Dell Server PRO, puis cliquez sur Supprimer.
Utilisation de Dell PRO Pack 3 Surveillance à l'aide de la console SCVMM Vous pouvez gérer l'intégrité de votre environnement virtualisé à l'aide des conseils PRO affichés sur la console SCVMM. Pour afficher la fenêtre Conseil PRO, cliquez sur le menu Conseils PRO de la barre d'outils qui se trouve sous le menu principal, comme illustré dans Figure 3-1. Le menu affiche également le nombre de conseils PRO actifs entre crochets. Figure 3-1.
Figure 3-2. Fenêtre Conseil PRO Implémentation des actions de récupération La fenêtre Conseil PRO fournit une option permettant d'implémenter ou d'abandonner l'action recommandée. Si vous sélectionnez l'option Implémenter, SCVMM implémente l'une des tâches de récupération décrites ci-dessous, selon la nature de l'alerte. Placement de l'hôte en mode Restreindre Le placement d'un hôte en mode Restreindre empêche toute affectation future de charge de travail à l'hôte tant que le problème n'a pas été résolu.
Sélectionnez l'algorithme Équilibrage de charge si vous voulez que SCVMM répartisse uniformément les machines virtuelles au sein du groupe d'hôtes. Sélectionnez l'algorithme Optimisation des ressources si vous préférez saturer l'hôte entièrement avant de passer à un autre.
Figure 3-3. Travail achevé L'implémentation du conseil PRO du déplacement des machines virtuelles peut échouer si aucun autre hôte intègre n'est disponible dans le groupe ou le cluster d'hôtes. En pareil cas, la fenêtre Conseil PRO affiche l'état du Conseil PRO correspondant comme Échec et la raison est élaborée dans la section Erreur. La condition de l'entrée correspondante dans la section Travaux de la console SCVMM s'affiche également comme Échec.
Migration en ligne des machines virtuelles La migration en ligne vous permet de migrer une machine virtuelle d'un nœud d'un cluster de basculement Windows Server 2008 R2 à un autre nœud du même cluster sans immobilisation du système. En tant qu'utilisateur connecté, vous ne subissez aucune interruption lors de la migration en ligne. La différence entre une migration rapide et une migration en ligne est que la première entraîne un arrêt alors que la seconde ne crée aucune interruption.
Surveillance à l'aide d'alertes spécifiques PRO sur la console SCOM/SCE Vous pouvez surveiller les périphériques physiques de votre réseau à l'aide de la console Operations Manager. La console Operations Manager fournit les vues suivantes : • Vue des alertes : affiche les alertes spécifiques Dell PRO en format tabulaire, incluant des informations sur le niveau de gravité, la source, le nom, l'état de résolution, ainsi que la date et l'heure de création.
• Vue d'état : affiche en format tabulaire les objets du système Dell découverts. La vue d'état affiche les objets incluant le nom, le chemin, l'intégrité de stockage du système Dell, etc. Vous pouvez personnaliser la vue d'état en spécifiant les objets que vous voulez afficher et en personnalisant la présentation des données. Figure 3-6. Vue d'état Pour plus d'informations sur la création d'une vue d'état, consultez le site Web de Microsoft.
Remplacements des actions de récupération PRO Pack 2.0 prend en charge deux actions de récupération. Les valeurs suivantes d'indicateurs déclenchent l'action de récupération respective : • 1 : pour l'action de récupération de migration • 2 : pour le placement du serveur en mode Restreindre Vous pouvez remplacer les actions de récupération par défaut en changeant la valeur par défaut de l'indicateur de l'action de récupération.
10 Générez une alerte et un conseil PRO. 11 Sélectionnez Implémenter le conseil PRO. Ceci permet de vérifier que l'action de récupération remplacée est établie. Figure 3-7.
Tableau 3-1. Cause de l'alerte et action de récupération N° d'événement Dell Description de Gravité l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 1053 Le capteur de température a détecté une valeur d'avertissement Avertissement Un capteur de température présent sur la carte de fond de panier, la carte système, l'UC ou le logement du lecteur au sein du système spécifié a dépassé sa valeur de seuil d'avertissement.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte Action corrective recommandée par le conseil de Dell PRO 1203 Le capteur de Avertissement Un capteur de courant Restreindre courant a détecté présent dans le une valeur système spécifié a d'avertissement. dépassé sa valeur de seuil d'avertissement. 1204 Le capteur de Erreur courant a détecté une valeur de défaillance.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 1403 Avertissement de la condition de l'unité de stockage Avertissement Le taux de correction Restreindre d'une unité de stockage a dépassé une valeur acceptable. 1404 Erreur d'unité de stockage. Erreur 1703 Le capteur de pile a détecté une valeur d'avertissement.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2056 Échec de disque virtuel. Un ou plusieurs disques physiques Restreindre et présents sur le disque migrer virtuel ont échoué. 2057 Avertissement Avertissement Ce message d'alerte de détérioration est généré lorsqu'un de disque virtuel disque physique appartenant à un disque virtuel redondant échoue.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 2100 La température a Avertissement L'enceinte du dépassé le seuil disque physique d'avertissement est trop chaude. maximal Divers facteurs peuvent provoquer une température excessive.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 2122 Dégradation de la redondance Avertissement Panne d'un ou de plusieurs composants Restreindre de l'enceinte. Par exemple, un ventilateur ou un bloc d'alimentation peut être en panne. 2123 Perte de la redondance Avertissement Un disque virtuel ou une enceinte a perdu la redondance des données.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2169 La batterie du contrôleur doit être remplacée Critique La batterie du contrôleur ne se recharge pas. Le nombre de recharges de la batterie peut avoir atteint le maximum. Il se peut également que le chargeur de batterie ne fonctionne pas. 2171 La température de la batterie du contrôleur est supérieure à la normale.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte Action corrective recommandée par le conseil de Dell PRO 2187 Erreur ECC monobit de limite dépassée sur le contrôleur DIMM 2201 Défaillance d'un Avertissement Le contrôleur ne peut disque de secours pas communiquer Restreindre global avec un disque affecté en tant que disque de secours global.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2207 Le seul disque Avertissement Le seul disque de secours physique disponible disponible est un pour être affecté en disque SAS. Les tant que disque de disques SAS ne secours utilise la peuvent pas technologie SAS.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte Action corrective recommandée par le conseil de Dell PRO 2268 Erreur de communication de Storage Management Critique Storage Management a perdu la Restreindre et communication avec migrer un contrôleur.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 2283 Un chemin redondant est coupé Avertissement Le contrôleur a deux connecteurs qui sont connectés à la même enceinte.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 2298 Un capteur de l'enceinte est défectueux 2299 2300 2301 2302 Cause de l'alerte Avertissement L'enceinte a un capteur défectueux. Les capteurs de l'enceinte surveillent les vitesses des ventilateurs, les capteurs de température, etc.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte Action corrective recommandée par le conseil de Dell PRO 2306 La table des blocs Avertissement La table des blocs endommagés est endommagés est la Restreindre saturée table utilisée pour remapper les blocs de disques défectueux. Cette table se remplit lorsque les blocs défectueux de disque sont remappés.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2314 Échec de la Critique séquence d'initialisation de composants SAS au cours du démarrage du système. La gestion et la surveillance SAS ne sont plus possibles. Storage Management n'est pas en mesure de Restreindre et surveiller ni de gérer migrer les périphériques SAS.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2321 Erreur ECC monobit. Le contrôleur DIMM ne fonctionne pas. Aucune autre signalisation ne sera affichée. Critique Le module de mémoire en ligne Restreindre et double (DIMM, migrer sigle de Dual In-line Memory Module) fonctionne mal. La perte ou la corruption des données est éminente.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM 2328 Le contrôleur Avertissement Le contrôleur NVRAM contient NVRAM contient des Restreindre et des données données corrompues. migrer corrompues.
Tableau 3-1. Cause de l'alerte et action de récupération (suite) N° d'événement Dell Gravité Description de l'alerte dans SCOM/ SCE & le conseil PRO de SCVMM Cause de l'alerte 2349 Un bloc de Critique disque défectueux ne peut pas être réaffecté au cours de l'écriture. Une opération d'écriture ne peut pas Restreindre être terminée car le disque contient des blocs défectueux qui n'ont pas pu être réaffectés. Une perte de données peut s'être produite.