Dell Server PRO Management Pack 2.
Notas y precauciones NOTA: una NOTA proporciona información importante que le ayudará a utilizar mejor el equipo. PRECAUCIÓN: un mensaje de PRECAUCIÓN indica la posibilidad de daños en el hardware o la pérdida de datos si no se siguen las instrucciones. ____________________ La información contenida en este documento puede modificarse sin previo aviso. © 2011 Dell Inc. Todos los derechos reservados.
Contenido 1 Introducción Novedades . . . . . . . . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . 6 Descripción general . . . . . . . . . . . . . . . . . . . Términos relacionados . . . . . . . . . . . . . . . . . . ¿Qué es un consejo PRO? . . . . . . . . . . . . . . . . . Características y funciones . . . . . . . . . . . . . . . . Descripción de la administración de PRO Tip Sistemas operativos admitidos 2 . . . . . . . . . . . . . . . . . . .
3 Documentación relacionada y recursos 41 Consideraciones de seguridad . . . . . . . . . . . . . Otros documentos que podrían ser útiles . Asistencia técnica . 4 Contenido 41 . . . . . . . 41 . . . . . . . . . . . . . . . . . . .
Introducción Este documento está dirigido a los administradores de sistemas que utilizan Dell Server PRO Management Pack (Dell PRO Pack) para supervisar sistemas Dell y ejecutar acciones correctivas cuando se identifican sistemas que no son eficientes.
Novedades Esta versión de PRO Pack admite lo siguiente: • SCE 2010 • SCVMM 2008 R2 SP1 • Compatibilidad para hardware nuevo • Alertas de Dell OpenManage adicionales y alertas de la tarjeta de interfaz de red (NIC) • Mejoras en la resolución de algunas alertas anteriores Para obtener más información sobre las alertas y sus resoluciones, consulte Acciones de recuperación y alertas.
Términos relacionados • Un sistema administrado es un sistema de Dell que ejecuta Dell OpenManage Server Administrator (OMSA) y que se supervisa y administra utilizando Operations Manager y SCVMM. Puede administrarse de manera local o remota a través de herramientas admitidas. • Una estación de administración o estación administrativa puede ser un sistema Dell basado en Microsoft Windows que cuenta con Operations Manager y SCVMM instalados para administrar las cargas de trabajo virtuales.
Características y funciones Dell PRO Pack: 8 • Realiza la administración PRO de sistemas Dell PowerEdge con plataformas Microsoft Hyper-V. Para ello, supervisa continuamente la condición de la infraestructura física y virtual. • Funciona con Operations Manager y SCVMM para detectar sucesos tales como la pérdida de redundancia de suministro de energía, temperaturas superiores a los valores de umbral, error de batería de almacenamiento de sistema, falla de disco virtual, etc.
Descripción de la administración de PRO Tip Esta sección explica cómo realizar una configuración típica de Dell PRO Pack y la secuencia de eventos implicados en la administración de PRO Tip. Ilustración 1-1.
La Tabla 1-1 describe la secuencia de eventos que se producen en la administración de consejos PRO. Tabla 1-1. Secuencia de sucesos con descripción Número de secuencia Suceso 1 Los agentes de Operations Manager en el host se habilitan para detectar las alertas de aviso, error o falla generadas por OMSA. 2 La alerta se envía a Operations Manager. 3 La consola de Operations Manager muestra las alertas PRO activas.
Sistemas operativos admitidos Los sistemas operativos admitidos de Dell PRO Pack en el sistema administrado y en la estación de administración son los siguientes: Sistema administrado: El sistema administrado para PRO Pack es un servidor Virtual Machine Manager. Para obtener más información, consulte technet.microsoft.com/enus/library/cc764213.aspx Estación de administración: Para obtener la lista de configuraciones admitidas de SCOM, SCE y SCVMM, consulte lo siguiente: • SCOM 2007 R2 - technet.microsoft.
Introducción
Uso de Dell Performance Resource Optimization Pack Supervisión con SCVMM Puede administrar el estado del entorno virtualizado con los PRO Tips que aparecen en la consola SCVMM. Para ver la ventana PRO Tip (Consejo PRO), haga clic en el menú PRO Tips (Consejos PRO) en la barra de herramientas, como se muestra en la Ilustración 2-1. El menú también muestra entre paréntesis el número de PRO Tips activos. Ilustración 2-1. Botón PRO Tip (Consejo PRO) en la consola SCVMM Haga clic en el menú Consejos PRO.
Implementación de acciones de recuperación La ventana PRO Tip (Consejo PRO) proporciona una opción para implementar o descartar la acción recomendada. Si selecciona Implement (Implementar), SCVMM implementa una de las tareas de recuperación que se describen a continuación, según la naturaleza de la alerta. Cómo establecer el host en modo de restricción Al establecer el host en modo Restrict (Restricción) se evita asignar una carga de trabajo al host hasta que se resuelva el problema.
Las condiciones del sistema que activan la migración de máquinas virtuales son las alertas de fallas de hardware en el host de virtualización, por ejemplo, una falla del disco virtual y un error predictivo de la unidad. Dell PRO Pack migra las máquinas virtuales que tengan el estado Funcionando. No migra las máquinas virtuales que tengan tales estados como Detener, Pausar y Guardado. Esto se basa en la clasificación por estrellas de los servidores asociados.
La implementación del PRO Tip de mover máquinas virtuales puede fallar si no hay otros hosts en condición satisfactoria en el grupo de hosts o en el clúster de hosts. En tal caso, la ventana PRO Tip (Consejo PRO) mostrará el estado del PRO Tip correspondiente como Failed (Fallido) y el motivo se describirá en la sección Error. El estado de la anotación correspondiente en la sección Trabajos de la consola SCVMM también se muestra como Error.
Supervisión mediante alertas específicas PRO en SCOM/SCE Puede supervisar los dispositivos físicos en la red por medio de la consola de Operations Manager. La consola de Operations Manager ofrece las siguientes vistas: • Vista de alertas: muestra las alertas específicas de Dell PRO en un formato de tabla con información sobre el nivel de gravedad, el origen, el nombre, el estado de resolución, junto con la fecha y hora de creación.
• Vista de estado: muestra en un formato de tabla los objetos detectados del sistema Dell. La Vista de estado muestra objetos con el nombre, la ruta de acceso, el estado del almacenamiento del sistema Dell, etc. Puede personalizar la vista de estado si define los objetos que desea mostrar y si personaliza la apariencia de los datos. Ilustración 2-4.
Invalidación de acciones de recuperación PRO Pack 2.1 admite dos acciones de recuperación. Los siguientes valores de marca desencadenan la acción de recuperación correspondiente: • 1: para realizar la migración • 2: para colocar el servidor en modo de restricción Puede invalidar la acción de recuperación predeterminada cambiando el valor de marca de recuperación predeterminado.
9 Haga clic en Save Overrides (Guardar invalidaciones). 10 Genere una alerta y PRO Tip. 11 Seleccione Implement PRO Tip (Implementar Consejo PRO). Esto verifica que la acción de recuperación anulada sea satisfactoria. Ilustración 2-5. Invalidación de la acción de recuperación Acciones de recuperación y alertas La Tabla 2-1 muestra las alertas y las acciones correctivas recomendadas correspondientes: Tabla 2-1. Causas de alertas y acciones de recuperación Id.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 1054 El sensor de temperatura detectó un valor de falla Error Un sensor de temperatura de la tarjeta de plano posterior, la placa del sistema, la CPU o el portaunidades en el sistema especificado ha superado el valor de umbral de falla.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad 1305 Redundancia degradada Advertencia La lectura de un Restricción sensor de suministro de energía en el sistema especificado ha superado un umbral de advertencia.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta 1404 Error de dispositivo de memoria Error La velocidad de Restricción y migración correcciónde un dispositivo de memoria ha superado un valor aceptable, un banco de memoria de repuesto se activó o se presentó un error de ECC de bits múltiples.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta 2056 Crítico Han fallado uno o varios discos físicos incluidos en el disco virtual.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM 2101 Gravedad Causa de la alerta La temperatura Advertencia El gabinete del disco físico está disminuyó por demasiado frío.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad 2123 Redundancia perdida Advertencia Un disco virtual o un gabinete Restricción presentan pérdida de y migración redundancia de datos.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2171 La temperatura Advertencia La temperatura de la batería ambiente puede ser del controlador muy elevada. Es posible también supera el nivel que el ventilador normal del sistema falle o esté degradado. Restricción 2174 Se ha quitado la batería del controlador.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad 2201 Falló un repuesto dinámico global Advertencia El controlador no puede comunicarse Restricción con un disco asignado como repuesto dinámico global. Es posible que el disco haya fallado o se haya extraído.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad 2213 Se excedió el máximo de número de recarga Advertencia Un disco virtual o un gabinete presentan Restricción pérdida de redundancia de datos. En el caso de un disco virtual, falló uno o más discos físicos incluidos en el disco virtual. 2246 La batería del Advertencia La temperatura de la controlador batería es elevada.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta 2268 Error de comunicación de Storage Management Crítico Storage Management ha perdido la Restricción comunicación con un y migración controlador. Esto puede suceder si el controlador o el firmware del controlador presenta un problema.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2283 Se interrumpió Advertencia El controlador cuenta una ruta con dos conectores Restricción redundante conectados y migración al mismo gabinete.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2298 El gabinete Advertencia El gabinete tiene un tiene un sensor sensor defectuoso. Los Restricción defectuoso sensores de gabinete supervisan la velocidad del ventilador, las sondas de temperatura, etc.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta 2307 La tabla de bloques defectuosos está completa Crítico La tabla de bloques defectuosos se utiliza Restricción para reasignar bloques defectuosos del disco. 2310 Un disco virtual está degradado de manera permanente Crítico Un disco virtual redundante ha Restricción perdido redundancia.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2318 Se detectaron Advertencia La batería o el cargador problemas con de batería no funciona Restricción la batería o con correctamente. el cargador de batería.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2322 El suministro de energía de CC está apagado Crítico La unidad de suministro de energía Restricción está apagada. y migración Un usuario apagó la unidad de suministro de energía o ésta es defectuosa.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad 2329 Informe de puerto SAS Advertencia El controlador genera el texto de esta alerta, Restricción el cual puede variar y migración según la situación. 2337 La controladora Crítico no puede recuperar datos almacenados en caché de la unidad de respaldo de batería (BBU) El controlador no pudo recuperar datos de la caché.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2349 No fueposible Crítico reasignar un bloque de disco defectuoso durante una operación de escritura No fue posible completar una Restricción operación de escritura debido a que el disco contiene bloques defectuosos que no pudieron reasignarse.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell 2387 Se ha Crítico detectado un error de medio del bloque dañado del disco virtual Los bloques dañados Restricción y migración del disco virtual se deben a la presencia de bloques dañados irrecuperables en uno o más discos físicos de miembros.
Tabla 2-1. Causas de alertas y acciones de recuperación (continuación) Id. de suceso de Descripción Dell de la alerta en SCOM/ SCE y consejo PRO en SCVMM 2, 4 Nombre del controlador: b06bdrv,ebdrv Gravedad Causa de la alerta Acción correctiva recomendada por el PRO Tip de Dell Enlace inactivo Crítico de la interfaz de red Broadcom de Dell OMNIC El enlace de red está inactivo. Restricción Enlace inactivo Crítico de la interfaz de red Broadcom de Dell OMNIC Se ha desconectado el enlace.
Uso de Dell Performance Resource Optimization Pack
Documentación relacionada y recursos En este capítulo se proporciona los detalles de los documentos y recursos para ayudarle a trabajar con Pro Pack 2.1. Consideraciones de seguridad SCOM/SCE maneja internamente los privilegios de acceso de la consola de Operations. Esto se puede configurar por medio de la opción Funciones de usuario en la función Administración → Seguridad de la consola SCOM/SCE.
• En la Dell OpenManage Server Administrator Messages Reference Guide (Guía de referencia de mensajes de Dell OpenManage Server Administrator) se presenta una lista de los mensajes que aparecen en el Registro de alertas de la página de inicio de Server Administrator o en el visor de sucesos del sistema operativo. En esta guía se explica el texto, la gravedad y la causa de cada uno de los mensajes de alerta de servicio que Server Administrator envía.