Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe el comportamiento que se produce cuando un nodo de un clúster de dos nodos y dos sitios se desconecta de la VLAN del clúster público. En este caso, los recursos de dirección IP y sus grupos de clústeres correspondientes producen un error en ambos nodos.
Síntomas
Considere el caso siguiente:
Tiene un clúster de dos sitios que tiene un nodo en cada sitio. El clúster usa un recurso testigo de recurso compartido de archivos (FSW). Los nodos de clúster están conectados por las siguientes redes:
- Una VLAN privada extendida
- Una VLAN pública no extendida
En este escenario, uno de los nodos se desconecta de la VLAN pública. En la ilustración siguiente se muestra la configuración resultante.
El clúster detecta la interrupción y marca el adaptador de red VLAN público en el nodo 2 como "Error". Por lo tanto, se producirá un error en todos los recursos de dirección IP del clúster en el nodo 2. También se produce un error en los grupos de clústeres asociados a esos recursos. El clúster genera mensajes similares a los siguientes:
000005ec.000011e4::2020/09/19-19:41:51.777 DBG [IM - public-1.0.0] Adición de estados de interfaz para interfaces de solo ruta entre subredes
000005ec.000011e4::2020/09/19-19:41:51.777 DBG [IM - public-1.0.0] Interfaz 1ee3567e-84f7-459a-a39e-a5c44de643fa no tiene rutas de subred cruzada. Marcarlo como erróneo
Dado que los dos sitios no se pueden comunicar entre la VLAN pública, el clúster también marca el adaptador de red VLAN público en el nodo 1 como "Error". Por lo tanto, se producirá un error en todos los recursos de dirección IP del clúster y los grupos de clústeres asociados en el nodo 1.
00001790.000006ac::2020/09/19-19:41:51.780 INFO [IM] Cambio del estado de los adaptadores según el resultado: <clase mscs::InterfaceResult>
00001790.00001678::2020/09/19-19:41:51.780 DBG [IM] EventManager::P rocessInterfaceChanged: Omitir evento para Node1- 1.0.0 que no se debe publicar.
00001790.00001678::2020/09/19-19:41:51.780 DBG [NM] Got interface changed event for adapter Node1 - 1.0.0-range, new state 1
000012dc.00001664::2020/09/19-19:41:51.796 WARN [RES] <Dirección IP del clúster x.x.x.x>: WorkerThread: NetInterface 1ee3567e-84f7-459a-a39e-a5c44de643fa ha producido un error. Recurso con error.
Al final, la conexión perdida a un nodo hace que los grupos de clústeres de ambos nodos estén en estado de error. Tiene que volver a poner los nodos en línea manualmente.
Si los dos nodos de clúster se encontraban en el mismo sitio, una desconexión de red similar provocaría que el adaptador de red VLAN público en el nodo 2 produzca un error de la misma manera. Sin embargo, en ese caso, todos los grupos de clústeres del nodo 2 conmutan por error al nodo 1. No se produciría un error en los recursos de dirección IP del clúster en el nodo 1.
Estado
Este comportamiento es por diseño. Se recomienda usar cuatro nodos en lugar de dos nodos para clústeres de varios sitios. Los clústeres de Azure AzS HCI requieren cuatro nodos.
Solución alternativa
Para evitar este comportamiento, puede cambiar la configuración del clúster mediante cualquiera de los métodos siguientes:
- Agregue al menos un nodo de clúster a cada sitio. En esta configuración, si un nodo de un sitio se desconecta, el nodo restante continúa comunicándose con el otro sitio. Los recursos del clúster en el nodo restante y en los nodos del sitio no afectado permanecen en línea.
- Agregue otro nodo de clúster en un tercer sitio. En esta configuración, si un nodo se desconecta, los dos nodos restantes permanecen en línea y la comunicación entre sitios continúa.
- Cambie la red de clúster privado a una VLAN no extendida. En esta configuración, si un nodo se desconecta, el clúster inicia el algoritmo de arbitraje para determinar la propiedad del recurso y del cuórum.
Si tiene la configuración que se describe en la sección "Síntomas" y tiene que desconectar un nodo de forma controlada (por ejemplo, para una ventana de mantenimiento planeado), prepare el clúster antes de desconectarlo. Sigue uno de estos procedimientos:
- Deshabilite todas las redes excepto la VLAN del clúster público.
- Apague todos los nodos del clúster, excepto uno.
Cuando esté listo para reanudar las operaciones típicas, comience habilitando las redes (o reiniciando los nodos).