Compartir vía


Clústeres de conmutación por error en Windows Server y Azure Local

La agrupación en clústeres de conmutación por error es una estrategia eficaz para garantizar en entornos críticos una alta disponibilidad y que no se interrumpan las operaciones. Implica una configuración de equipos independientes, conocidos como nodos, que funcionan conjuntamente para mejorar la disponibilidad y escalabilidad de las aplicaciones y los servicios, ahora denominados roles en clúster. Estos nodos están interconectados a través del cableado físico y el software.

Si se produce un error en uno o varios nodos, los nodos restantes toman automáticamente la carga de trabajo, un proceso denominado conmutación por error, lo que minimiza las interrupciones. Además, el estado de los roles en clúster se supervisa continuamente. Si se detecta algún problema, los roles se reinician o se migran a otro nodo para mantener una operación sin problemas. Este enfoque proactivo garantiza que los servicios permanezcan disponibles de forma coherente, incluso si se producen errores de hardware o software.

Las redes son un rol fundamental en los clústeres de conmutación por error al habilitar una comunicación confiable y un intercambio de datos eficaz entre nodos de clúster y con clientes externos. Los clústeres suelen emplear redes privadas dedicadas para funciones internas, como señales de latido y administración de clústeres, mientras que las redes públicas independientes controlan el acceso de cliente y los datos de la aplicación. Esta separación de red mejora el rendimiento y la seguridad al aislar el tráfico crítico del clúster frente a interrupciones externas. También aumenta la tolerancia a errores, lo que garantiza que las operaciones internas del clúster permanecen ininterrumpidas y que las conexiones de cliente mantienen alta disponibilidad durante los eventos de conmutación por error.

El estado del clúster se supervisa continuamente a través de señales de latido, lo que ayuda a detectar cualquier problema. Si surge un problema el sistema puede iniciar automáticamente un proceso conmutación para asegurar la continuidad del servicio. Para proteger los datos confidenciales y cumplir los estándares de la organización, los clústeres de conmutación por error incorporan medidas de seguridad sólidas, como el cifrado para proteger los datos tanto en tránsito como en reposo. También usan un control de acceso pormenorizado para administrar los permisos y los derechos de acceso de forma eficaz.

Para más información sobre la agrupación en clústeres de conmutación por error en Azure Local, consulte Descripción del cuórum de clúster y grupo.

Configuración de conmutación por error activa y pasiva

Los clústeres de conmutación por error pueden presentar dos tipos principales de configuraciones: activo-activo y activo-pasivo. Cada configuración tiene sus propias ventajas; la configuración activo-activo se enfoca en el rendimiento y la eficiencia de los recursos, mientras que la activo-pasivo hace hincapié en la simplicidad y la fiabilidad para los escenarios de conmutación por error. La elección depende de necesidades organizativas específicas y de la importancia de las aplicaciones en clúster.

Configuración Operación
Activo En un clúster de conmutación por error activo-activo, todos los nodos se encuentran activos y trabajan juntos simultáneamente para repartir equitativamente la carga de trabajo entre el clúster. Esta configuración distribuye tareas, potencia de procesamiento o servicios entre todos los nodos disponibles, lo que hace un uso eficaz de los recursos. Así es como funciona:

  • Equilibrio de carga: Cada nodo controla una parte de la carga de trabajo total, lo que mejora el rendimiento y garantiza que ningún nodo único se convierte en un cuello de botella. Esta distribución igual puede mejorar la capacidad de respuesta y el rendimiento, ya que varios nodos están atendiendo solicitudes simultáneamente.
  • Uso de recursos: Una configuración activa-activa maximiza el uso de los recursos, ya que todos los nodos están operativos y contribuyen al rendimiento del clúster. Esta configuración es ideal para entornos en los que maximizar los recursos disponibles es fundamental.
  • Tolerancia a errores: Si se produce un error en un nodo, los nodos restantes del clúster pueden seguir controlando la carga de trabajo. La pérdida de un nodo podría reducir temporalmente la capacidad total, pero el sistema permanece operativo sin interrupciones del servicio.
  • Pasivo En un clúster de conmutación por error activo-pasivo, algunos nodos se designan como activos, mientras que otros están en espera, listos para asumir el control si se produce un error en un nodo activo. Así es como funciona:

  • Nodos en espera: Los nodos pasivos se encuentran esencialmente en un estado "en espera", no controlan tareas ni servicios durante las operaciones normales. Estos nodos están preparados para asumir responsabilidades si un nodo activo sufre una falla.
  • Proceso de conmutación por error: Cuando se detecta un error se activa un nodo en espera para que este asuma las responsabilidades del nodo que ha fallado. Esto implica poner en línea rápidamente el nodo pasivo para garantizar la continuidad de los servicios.
  • Asignación de recursos: Es posible que las configuraciones activas-pasivas no usen todos los recursos de hardware disponibles durante las operaciones normales, ya que los nodos en espera permanecen inactivos. Sin embargo, esta configuración puede ser más sencilla de administrar y puede garantizar un rendimiento predecible en determinadas condiciones.
  • Simplicidad y confiabilidad: Una configuración activa-pasiva puede ser ventajosa para las aplicaciones en las que la estabilidad y la previsibilidad son más importantes que maximizar la eficacia operativa. A menudo es más fácil implementar y mantener en comparación con una configuración activa-activa.
  • Funcionalidades de los clústeres de conmutación por error

    La agrupación en clústeres de conmutación por error proporciona un conjunto completo de funcionalidades diseñadas para maximizar la disponibilidad, garantizar la integridad de los datos y simplificar la gestión de cargas de trabajo críticas. Estas características permiten a las organizaciones mantener la continuidad del servicio, administrar de forma eficaz los recursos y recuperarse rápidamente de errores de hardware o software. Algunas funcionalidades que ofrece la agrupación en clústeres de conmutación por error:

    • Nodos de clúster y cuórum:

      Los nodos de clúster colaboran para mantener lo que se conoce como cuórum, que es básicamente el número mínimo de votos de los miembros del clúster necesarios para que el clúster funcione correctamente. Este mecanismo evita escenarios de cerebro dividido, donde las partes divididas de un clúster podrían intentar operar de forma independiente, lo que podría provocar incoherencias. Los modelos de cuórum, como la mayoría de nodos, la mayoría de nodos y discos, la mayoría de nodos y recursos compartidos de archivos, y sin mayoría (solo disco), determinan cómo se asignan y cuentan los votos. Por ejemplo, Node Majority asigna un voto a cada nodo, mientras Node and Disk Majority añade votos adicionales de un disco o de un recurso de archivos compartidos.

    • Configuración de almacenamiento:

      Una característica notable de los clústeres de conmutación por error es el volumen compartido de clúster (CSV), que permite que varios nodos accedan al mismo almacenamiento simultáneamente, lo que permite una administración y coordinación de discos suaves sin pérdida de rendimiento. Los archivos CSV son una parte integral de las configuraciones de almacenamiento en clusters de conmutación por error. Los CSV facilitan el acceso eficaz al disco, lo que permite a los nodos controlar las tareas de almacenamiento de forma colaborativa.

    • Supervisión y administración proactivas:

      Los clústeres de conmutación por error emplean señales de latido como medio de supervisar el estado de los nodos y sus funciones. Estas señales ayudan a detectar problemas como errores de nodo o interrupciones del servicio. Cuando se detectan estos problemas, el sistema puede iniciar automáticamente procedimientos de conmutación por error, lo que garantiza la continuidad y minimiza el tiempo de inactividad.

    • Seguridad y cumplimiento:

      La seguridad es un aspecto fundamental de los clústeres de conmutación por error, incorporando características como cifrado y control de acceso para proteger los datos y las operaciones del clúster. Los clústeres ayudan a las organizaciones a cumplir los requisitos de cumplimiento de las aplicaciones críticas al garantizar el control de datos seguro y el rendimiento confiable del sistema. Esto hace que sean adecuados para entornos que requieren estricta protección de datos y cumplimiento normativo.

    • Casos de uso:

      Los clústeres de conmutación por error presentan varias aplicaciones prácticas, como la recuperación ante desastres, el equilibrio de carga y el procesamiento de alto rendimiento. Admite aplicaciones críticas al proporcionar alta disponibilidad, lo que permite a las empresas mantener operaciones incluso en condiciones adversas. Por ejemplo, en escenarios de recuperación ante desastres, los clústeres pueden restaurar rápidamente los servicios mediante la transferencia de operaciones a nodos no afectados.

      • La agrupación en clústeres de conmutación por error garantiza una alta disponibilidad o una disponibilidad continua para aplicaciones y servicios críticos (roles en clúster) que se ejecutan en servidores físicos o máquinas virtuales. Si se produce un error, estos roles se pueden mover o reiniciar rápidamente en otro nodo, lo que minimiza el tiempo de inactividad y mantiene un rendimiento y redundancia coherentes.

      • Las aplicaciones como Microsoft SQL Server y las máquinas virtuales Hyper-V se benefician de los clústeres de conmutación por error, ya que solo sufren interrupciones mínimas del servicio, incluso cuando ocurren fallos hardware o software.

    Recursos de clústeres de conmutación por error

    Esta detallada tabla de recursos está diseñada para ayudarle a comprender, planificar, implementar y administrar de una forma eficaz la agrupación en clústeres de conmutación por error.

    Descripción Planificación Implementación
    Novedades de los clústeres de conmutación por error Planeamiento de los requisitos de hardware de los clústeres de conmutación por error y opciones de almacenamiento Creación de clústeres de conmutación por error
    Scale-Out servidor de archivos para los datos de la aplicación Uso de volúmenes compartidos de clúster (CSV) Implementación de un servidor de archivos de dos nodos
    Cuórum de clúster y grupo Uso de clústeres de máquinas virtuales invitadas con Espacios de almacenamiento directo Preconfigurar objetos de equipo de clúster en Active Directory Domain Services
    Reconocimiento de dominio de error Configuración de cuentas de clúster en Active Directory
    SMB multicanal simplificada y redes de clústeres de varias NIC Recuperación de un clúster de conmutación por error sin cuórum
    Equilibrio de carga de máquinas virtuales Implementación de un testigo de cuórum
    Conjuntos de clústeres Actualizaciones graduales del sistema operativo del clúster
    Afinidad de clúster Actualizar un clúster de conmutación por error en el mismo hardware
    Implementación de un clúster desasociado de Active Directory
    Administrar Herramientas y configuración Recursos de la comunidad
    Actualización compatible con clústeres Cmdlets de Windows PowerShell de clúster de conmutación por error Foro de clústeres de conmutación por error
    Servicio sanitario Cmdlets de PowerShell de actualización compatible con clústeres Blog de clústeres de conmutación por error
    Migración de dominio de clúster
    Solución de problemas mediante informes de errores de Windows