Definición de clústeres de conmutación por error de Windows Server
La mayoría de las organizaciones y empresas, incluida Contoso, se esfuerzan por garantizar la alta disponibilidad de sus cargas de trabajo críticas. Contoso podría considerar el uso de clústeres de conmutación por error de Windows Server. Se trata de una característica de Windows Server que proporciona alta disponibilidad de cargas de trabajo comunes basadas en Windows, incluidos recursos compartidos de archivos, máquinas virtuales (VM), sistemas de administración de bases de datos y servicios de mensajería.
Información general de los clústeres de conmutación por error
Para lograr una alta disponibilidad de cargas de trabajo, cree un clúster de conmutación por error que conste de varios equipos con Windows Server. Si un servidor que forma parte de un clúster de conmutación por error produce un error o deja de estar disponible, otro servidor del mismo clúster de conmutación por error toma el control de los servicios que el nodo con error estaba ofreciendo. Esto se denomina conmutación por error y da como resultado interrupciones mínimas del servicio para los clientes que acceden al servicio.
Los usos más comunes de los clústeres de conmutación por error son:
- Recursos compartidos de archivos de alta disponibilidad o disponibilidad continua que hospedan bases de datos de Microsoft SQL Server y archivos de disco y de configuración de máquinas virtuales de Hyper-V.
- Servicios y aplicaciones de alta disponibilidad que se ejecutan en servidores físicos o en máquinas virtuales invitadas hospedadas en servidores de Hyper-V agrupados.
Componentes de clústeres de conmutación por error
Un clúster de conmutación por error consta de los componentes descritos en la tabla siguiente.
Componente | Descripción |
---|---|
Nodos | Equipos con Windows Server que son miembros de un cluster de failover. Estos equipos tienen instalada la característica Clústeres de conmutación por error de Windows Server y ejecutan cargas de trabajo de alta disponibilidad que se componen de servicios, aplicaciones y recursos. |
Clientes | Equipos que consumen servicios y aplicaciones de alta disponibilidad que se ejecutan en un clúster de conmutación por error. Debe haber varias rutas de acceso de red entre los clientes y el clúster. |
Redes | Habilite la comunicación entre nodos y equipos que consumen cargas de trabajo en clúster. Además, los nodos acceden con frecuencia al almacenamiento compartido. |
Rol agrupado | Rol o servicio de alta disponibilidad que se ejecuta en el nodo del clúster. Los clientes consumen este servicio mediante la conexión al nodo del clúster. Si este servicio deja de estar disponible en un nodo, el clúster de conmutación por error lo conmuta automáticamente a otro nodo. |
Recursos | Elementos físicos o lógicos, como una carpeta compartida, un disco o una dirección IP, que administra el clúster de conmutación por error. Los recursos pueden proporcionar servicio a los clientes o pueden ser partes integrales de aplicaciones de alta disponibilidad. Un recurso solo se puede ejecutar en un nodo en un momento dado. |
Almacenamiento de clústeres | Además de su propio almacenamiento local, donde se instala el sistema operativo Windows Server, cada nodo de clúster tiene acceso al almacenamiento compartido de alta disponibilidad, donde residen los datos y la configuración de la aplicación. Por ejemplo, el almacenamiento en clúster hospeda datos de configuración y discos duros virtuales de máquinas virtuales invitadas de alta disponibilidad. |
Nota:
El almacenamiento compartido no tiene que estar conectado directamente a varios nodos. La tecnología Espacios de almacenamiento directo introducida en Windows Server 2016 permite compartir discos conectados a nodos individuales.
Niveles funcionales de clústeres de conmutación por error
Las funcionalidades de clústeres de conmutación por error de Windows Server dependen del nivel funcional del clúster. En general, querrá asegurarse de que el clúster usa el nivel funcional más alto posible. Sin embargo, la compatibilidad con niveles funcionales inferiores en Windows Server 2016 y Windows Server 2025 permite realizar actualizaciones graduales de clústeres de conmutación por error que ejecutan versiones anteriores del sistema operativo. De este modo, durante una actualización, es posible tener nodos de Windows Server 2016 y Windows Server 2025 en el mismo clúster de conmutación por error, lo que elimina la necesidad de tiempo de inactividad.
Sugerencia
Después de reemplazar todos los nodos que ejecutaban Windows Server 2016 por nodos de Windows Server 2025, puede actualizar el nivel funcional del clúster.
Cuórum de clústeres de conmutación por error
En un clúster de conmutación por error, el término cuórum representa el número de componentes del clúster que deben estar disponibles para que ese clúster permanezca en línea. Estos componentes pueden incluir los nodos de clúster y, opcionalmente, un testigo. El término testigo designa un recurso cuyo rol es establecer y mantener un cuórum. Para este fin, un clúster de conmutación por error puede usar:
- Un recurso compartido de archivos
- Un disco
- Un blob en Azure Storage
El cuórum se determina en función del número de votos asociados a los nodos del clúster y al testigo. El propósito del cuórum es evitar el escenario de "cerebro dividido". En este escenario, como resultado de problemas de conectividad internode, dos conjuntos de nodos de un clúster podrían empezar a funcionar independientemente entre sí, lo que da lugar a daños en el estado del clúster y sus recursos.
El modelo de cuórum define la asignación de votos. Los clústeres de conmutación por error de Windows Server ofrecen administración dinámica de cuórum. Esto ofrece una mayor disponibilidad dentro de un clúster de conmutación por error mediante la supervisión y el ajuste continuos del modelo de quórum en función de los nodos disponibles del clúster.
El cálculo del cuórum de clúster se ajusta cuando cambia el número de nodos. Incluso si un clúster de conmutación por error tiene menos del 50 por ciento del número original de nodos, sigue funcionando y los roles de clúster siguen estando disponibles. Con el cuórum dinámico habilitado, un clúster de conmutación por error puede sobrevivir con un solo nodo en ejecución.
Nota:
El modelo de quórum dinámico está habilitado de forma predeterminada.
Los clústeres de conmutación por error también admiten las siguientes funcionalidades relacionadas con el cuórum:
- Pesos de nodos. Windows Server utiliza el peso del nodo de clúster principalmente en entornos donde los nodos de conmutación por error se encuentran en varias ubicaciones físicas. En estos entornos, es posible que desee que el clúster de conmutación por error siga ejecutándose sin interrupciones en la ubicación principal, incluso si varios nodos de la ubicación secundaria dejan de estar disponibles. Para ello, puede asignar un peso de nodo de 0 a los nodos de clúster de conmutación por error en la ubicación secundaria, lo que elimina de forma eficaz su impacto en el estado del cuórum.
- Testigo dinámico. De forma predeterminada, Windows Server ajusta el voto del testigo dinámicamente en función del número de nodos de votación del clúster de conmutación por error. Si el clúster de conmutación por error tiene un número impar de votos, el testigo de cuórum no tendrá ningún voto. Si el clúster de conmutación por error tiene un número par de votos, el testigo de cuórum tendrá un voto. El voto de testigo de cuórum también se ajusta dinámicamente según el estado del recurso de testigo. Si el recurso de testigo está sin conexión o tiene un error, el testigo no tendrá ningún voto.
- Criterio de prioridad para la división del nodo del 50 %. El clúster de conmutación por error puede ajustar dinámicamente el voto de un nodo para mantener un número impar de votos totales. Para ello, el clúster de conmutación por error ajusta primero el voto de testigo de cuórum aprovechando la funcionalidad de testigo dinámico. Si no hay un testigo de cuórum disponible, el clúster de conmutación por error puede ajustar el voto de un nodo. También hay una propiedad de clúster de conmutación por error que puede usar para determinar qué sitio sobrevive si hay una división del nodo del 50 % y ninguno de los sitios tiene un cuórum.
La funcionalidad de un clúster de conmutación por error depende no solo de un cuórum, sino también de los recursos disponibles para los nodos del clúster y su capacidad para ejecutar cargas de trabajo en clúster que conmutan por error a ese nodo. Por ejemplo, un clúster con cinco nodos seguirá teniendo un cuórum incluso si se produce un error en dos nodos. Sin embargo, el resto de nodos del clúster sigue atendiendo a los clientes solo si tienen recursos suficientes para ejecutar roles de clúster que conmutaron por error a los tres nodos restantes. Estos recursos incluyen almacenamiento, capacidad de procesamiento, ancho de banda de red y memoria. Puede configurar la prioridad de la máquina virtual, el orden de inicio, los hosts preferidos y la antiafinidad para decidir los nodos en los que se puede ejecutar el rol de clúster.
Tipos de testigo de clústeres de conmutación por error
Hay tres tipos de testigo de cuórum disponibles para los clústeres de conmutación por error.
- El testigo de disco emplea un recurso de disco de clúster en el mismo clúster de conmutación por error. Todos los nodos deben tener acceso al disco compartido.
- El testigo de recurso compartido de archivos usa un recurso compartido de archivos externo. Es posible implementar esto mediante una unidad USB conectada a un conmutador de red.
- El testigo en la nube usa un blob de una cuenta de Azure Storage.
Importante
Al seleccionar el tipo de testigo de quórum, debe asegurarse de que el testigo permanezca accesible para la mayoría de los escenarios que afectan la disponibilidad de los nodos del clúster.