System information

3-28
ESCALA T610, PL 400T et PL 600T Guide de l’utilisateur système
Configuration et annulation de la configuration des
processeurs ou de la mémoire
Toutes les défaillances entraînant la panne du système avec un contrôle machine ou un
arrêt de contrôle, même intermittentes, sont signalées comme un appel sortant demandant
une intervention. Afin d’empêcher la récurrence de problèmes intermittents et d’améliorer la
disponibilité du système jusqu’à ce qu’une fenêtre de maintenance soit prévue, les
processeurs et les modules DIMM dotés d’un historique de pannes portent la mention ”bad”
pour qu’ils ne soient pas configurés lors des amorçages suivants.
Un processeur ou un module DIMM portera la mention ”bad” dans les circonstances
suivantes :
• Un processeur ou un module DIMM échoue à l’autotest intégré (BIST) ou à l’autotest à la
mise sous tension (POST) lors de l’amorçage (tel que spécifié par le Service Processor).
• Un processeur ou un module DIMM génère un contrôle machine ou un arrêt de contrôle
en cours de fonctionnement, et la défaillance peut être localisée spécifiquement au
niveau de ce processeur ou module DIMM (tel que spécifié par les diagnostics de
fonctionnement du processeur dans le Service Processor).
• Un processeur ou un module DIMM atteint un seuil de reprises après défaillance
entraînant un appel sortant informatif (tel que spécifié par les diagnostics de
fonctionnement du processeur dans le Service Processor).
Au cours de l’amorçage, le Service Processor ne configurera ni les processeurs, ni les
modules DIMM portant la mention « bad ».
Si un processeur ou un module DIMM est déconfiguré, le processeur ou le module restera
hors ligne lors des amorçages suivants jusqu’à ce qu’il soit remplacé ou que la fonction
Repeat Gard soit désactivée. Cette fonction permet également aux utilisateurs d’annuler
manuellement la configuration d’un processeur ou d’un module DIMM, ou le cas échéant de
la revalider. Pour plus d’informations sur la configuration ou la déconfiguration d’un
processeur, reportez–vous au menu “Processor Configuration/Deconfiguration”, page 3-13.
Pour plus détails sur la configuration ou la déconfiguration d’un module DIMM,
reportez–vous au menu Memory Configuration/Deconfiguration, page 3-14. Tous deux sont
des sous–menus du menu System Information.
Vous pouvez activer ou désactiver la fonction CPU Repeat Gard ou Memory Repeat Gard à
l’aide du menu Processor Configuration/Deconfiguration, qui est un sous–menu du menu
System Information.
Annulation de la configuration de Run–Time CPU (CPU Gard)
Les erreurs réparables de la mémoire cache d’instructions L1, les erreurs corrigeables de la
mémoire cache de données L1 et les erreurs corrigeables de la mémoire cache L2 sont
surveillées par le code des diagnostics d’exécution du processeur (PRD) qui s’exécute dans
le Service Processor. Lorsqu’un seuil d’erreur prédéfini est atteint, un journal d’erreurs avec
gravité de l’avertissement et état du seuil dépassé est retourné à AIX. Dans le même
temps, PRD mentionne l’annulation de configuration de l’UC au prochain amorçage. AIX
tentera de transférer toutes les ressources associées à ce processeur vers un autre
processeur, puis d’arrêter le processeur défectueux.