Windows Server 2008 R2: Solucionar problemas de clústeres de conmutación por error
Cuando el fracaso no es una opción, configuración de clústeres de conmutación por error en Windows Server puede ayudar a asegurar la disponibilidad constante cerca.
John Marlin
Windows Server ha cambiado con los años, con diferentes versiones, diferentes niveles de soporte y diferentes tácticas para solucionar problemas. La actual política de apoyo es que, para que la solución de Windows Server 2008 o Windows Server 2008 R2 Failover Clustering a considerar soluciones oficialmente soportadas por Microsoft al cliente soporte Services (CSS), deben cumplir la siguientes criterios:
- Todos los componentes de hardware y software deben cumplir con los requisitos para recibir un logotipo "Certificado para Windows Server 2008 R2".
- La solución totalmente configurada debe pasar la prueba de validación en la administración de clúster de conmutación por error.
Al asegurar que tiene una versión con apoyo oficial, tiene la mejor oportunidad de todo funcionando. Siempre puede haber problemas con los proveedores de hardware, o Microsoft deba involucrarse ayudar con algunas configuraciones, pero es probable que al menos debe ser bueno para empezar. Aquí es un vistazo a algunos de los problemas más comunes con clústeres de conmutación por error de R2 de Windows Server 2008 y cómo con precisión solucionar esos problemas.
El clúster cambiante
La forma Clusters están calificados ha cambiado significativamente en Windows Server 2008 R2 con la introducción de la Validación de clúster asistente, que se integra en clústeres de conmutación por error. El Asistente de validación de clúster permite ejecutar un conjunto de pruebas centradas en una colección de servidores que se va a utilizar como nodos de un clúster.
Este proceso de validación comprueba el hardware y el software subyacente directa e individualmente. Esto proporcionará una evaluación precisa de cómo una configuración determinada apoyará Failover Clustering. Si lo utiliza en un Cluster en ejecución, puede también hacerle saber si se están cumpliendo las mejores prácticas. Se debe ejecutar al agregar nuevo hardware o controladores al clúster.
Para los amantes de secuencias de comandos, Failover Clustering tiene ahora Windows PowerShell apoyar. Esto es algo que debería iniciar cada vez más familiar, como CLUSTER.EXE ya no se está actualizando. Si no sabes lo que son los cmdlets y su significado, puede ejecutar el comando Get-Help * Cluster *. Esto le dará una lista que describe los comandos, como este:
Sinopsis de nombre
---- --------
Nuevo clúster de crear un nuevo clúster de conmutación por error. Antes de crear un
Cluster, usted debe...
Si no sabe cómo usar el comando, puede utilizar Get-Help nueva-Cluster –Examples para ver ejemplos, como este:
NOMBRE
Nuevo clúster
SINOPSIS
Crear un nuevo clúster de conmutación por error. Antes de crear un clúster, se
debe conectar el hardware (servidores, redes y almacenamiento de información) y ejecutar
las pruebas de validación.
-------------------------- EXAMPLE 1 --------------------------
C:\PS > Nueva-Cluster - nombre cluster1-nodo nodo 1, el nodo 2, node3, node4
Name
----
cluster1
Descripción
-----------
Este comando crea un clúster de cuatro nodos llamado cluster1, utiliza el predeterminado
configuración de direcciones IP.
Al recibir eventos en Windows, siempre es una buena idea comprender realmente lo que esto significa. Algunos no están tan descriptivos como desee. Una lista de todos los eventos se pueden ver, incluyendo descripciones de eventos está disponible online.
Registros de sucesos de los primeros
Si se produce un problema, eventos de clúster es uno de los primeros lugares que debería iniciar búsqueda. Cualquier crítica, Error o advertencias que desprende será en el registro de sucesos. Los mensajes informativos (por ejemplo, un grupo de desconectarse, mover un grupo a otro nodo, etc.) será en el canal de la operativa de clúster. Puede ver estos eventos en el Visor de sucesos y registros de servicios y aplicaciones / Microsoft / Windows / FailoverClustering.
Si no está seguro de cuál era el problema con un recurso o grupo de servicio/aplicación particular, puede ver en la administración de clúster de conmutación por error. Si está resaltado en un grupo determinado, seleccione "Mostrar eventos críticos para esta aplicación." Si está resaltado en un recurso específico, seleccione "Mostrar los eventos críticos de este recurso".
Se abrirá el registro de sucesos de sistema y filtro para el recurso o grupo específico. Le dará todas las instancias que se encuentra en el registro de sucesos para todos los nodos del clúster. Esto podría ser beneficioso, como se le mostrarán todo ello desde una sola ubicación.
Una vez que haya identificado el recurso, puede ir a ver si hay otros factores que contribuyen a los registros de sucesos de sistema. No ser distraído por el síntoma: centrarse en una causa. ¿Por ejemplo, si se produce un error en una dirección IP o nombre de red, hay otros eventos de tipo de red que podrían contribuir a este (TCPIP pila falla, mal funcionamiento de tarjeta de red, etc.)?
Registro de depuración de clúster ha cambiado a sesiones de seguimiento de eventos. No hay no más de clúster.REGISTRO. El sistema ahora escribe extraer, transformar y cargar archivos (ETL) ubicados en la carpeta %WinDir%\System32\winevt\logs. De estos archivos ETL, puede generar un único clúster.Inicie sesión para ver desde las tres. Esto es una "instantánea" en el tiempo, sin embargo. En otras palabras, cuando se genera un Cluster.log, ya no es escribir en el archivo de Cluster.log. Cada vez que genere uno en un nodo, se sobrescribir actual y sustituirlo por uno nuevo.
Puede generar registros con el comando de Windows Powershell Get-único. Esto va a salir a todos los nodos del clúster y crear el archivo para cada nodo en la carpeta %WinDir%\Cluster\Reports. Dependiendo de la cantidad de nodos y el tamaño de los archivos, puede que desee considerar algunos conmutadores adicionales.
Decir que un clúster de nueve nodos y desea obtener todos los registros. Puede utilizar el modificador –Destination todos ellos generados y copiarlos a una ubicación específica. Esto le dará un lugar único para obtenerlos. También etiqueta el nombre del nodo como parte del nombre de archivo (por ejemplo, Get-único –Destination c:\logs creará Node1_Cluster.log, Node2_cluster.log, etc. en la carpeta C:\LOGS).
Otra consideración si se trata de un problema fácilmente reproducible: utilizar el modificador –Timespan (en minutos). Simplemente reproducir el problema en un nodo y ejecutar Get-único –Timespan 5 –Node nodo 1. Esto generará un Cluster.log para sólo Nodo1 y capturar sólo los últimos cinco minutos.
Aquí hay algunos consejos para este nivel de solución de problemas:
- El registro es detallado y complejo. No debe ser el primer lugar para iniciar la búsqueda.
- Asegúrese de que la captura por valor de al menos tres días de datos. De este modo, si tiene un fallo el viernes por la noche, los datos seguirán allí al llegar el lunes. Cada registro es de 100 MB de tamaño. Si necesita aumentar el tamaño, utilice el Windows Powershell comando conjunto único –Size 200 (o especificar cualquier tamaño en megabytes).
- Algunas aplicaciones son "ruidosos" o "chatty" en los registros. Puede que necesite aumentar el tamaño del registro, si es así.
- El registro de depuración del clúster se genera como GMT, por lo que tendrá que convertir los tiempos para hacer coincidir cuando se produjo el evento real hora local.
- Dependiendo de lo que desea ver, utilice –Destination o –Timespan.
El mes que viene, te llevaremos a través de algunos escenarios de solución de problemas comunes.
**John Marlin**es un ingeniero de soporte senior de escalamiento en el grupo de apoyo técnico comercial. Ha sido con Microsoft por más de 19 años, con los últimos 14 años, centrándose en servidores en cluster.