Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La alta disponibilidad (HA) es esencial para mantener la continuidad empresarial en los paisajes de SAP. El Marco de Automatización de Pruebas SAP proporciona un enfoque estructurado y automatizado para validar la configuración de alta disponibilidad y la resiliencia de SAP HANA (escalado vertical) y los Servicios Centrales de SAP. Ejecuta comprobaciones de validación de configuración y organiza simulaciones de errores controladas para garantizar que los mecanismos de recuperación y conmutación por error cumplan los procedimientos recomendados de SAP en Azure.
El marco de trabajo usa Ansible para coordinar la ejecución de pruebas, recopilar telemetría, capturar registros y generar informes detallados de resultados. Las pruebas abarcan escenarios como la migración de recursos, bloqueos de procesos, errores de nodo, eventos de barrera y particiones de red, lo que permite a los equipos evaluar la preparación antes de pasar a funcionar o durante las operaciones del ciclo de vida.
Nota:
Los casos de prueba descritos a continuación con un valor especificado en la columna "Comentarios" solo se aplican cuando se cumplen los criterios correspondientes. Si el campo está vacío, la entrada se considera aplicable a todos los patrones de configuración admitidos.
Alta disponibilidad de escalado vertical de SAP HANA
Valida el mecanismo de conmutación por error de la base de datos de SAP HANA en una configuración de ampliación vertical, garantizando que la base de datos pueda recuperarse de fallos de nodo sin pérdida de datos ni inactividad significativa. Los siguientes casos de prueba están disponibles para validar la alta disponibilidad de SAP HANA:
| Caso de prueba | Description | Observaciones |
|---|---|---|
| Validación de configuración de alta disponibilidad (en línea) | Comprueba la configuración de alta disponibilidad, incluida la configuración de Corosync, los recursos de Pacemaker, los dispositivos SBD y la configuración de replicación del sistema de HANA. | |
| Equilibrador de carga de Azure | La prueba de configuración de Azure LB valida la configuración de Azure Load Balancer, incluida la configuración del sondeo de estado, la configuración del grupo de back-end, las reglas de equilibrio de carga y la configuración de IP de front-end. | |
| Migración de recursos | La prueba de migración de recursos valida los escenarios de conmutación por error planeados mediante la ejecución del movimiento controlado de recursos entre nodos de HANA. Realiza una migración correcta de los recursos de HANA principales al nodo secundario, comprueba los cambios de rol adecuados, garantiza que el clúster mantiene la estabilidad a lo largo de la transición y valida la sincronización de datos completa después de la migración. | |
| Detener HANA en el primario | La detención de HANA en la prueba principal simula el comportamiento del clúster cuando la base de datos de HANA se detiene manualmente. El agente de recursos de SAP HANA supervisa la base de datos, detecta cuándo se detiene y promueve el nodo secundario para convertirse en principal. | |
| Bloquear red de comunicaciones | La prueba de Red de Bloqueo valida el comportamiento del clúster durante escenarios de partición de red mediante la implementación de reglas de iptables para bloquear la comunicación entre los nodos primarios y secundarios de HANA. Comprueba los mecanismos de prevención de cerebro dividido, valida la ejecución correcta de la conmutación por error cuando los nodos se aíslan y garantiza la estabilidad del clúster y la coherencia de los datos después de restaurar la conectividad de red. | |
| Bloqueo del servidor de índice principal | La prueba de fallo del servidor de índices principal valida el comportamiento de alta disponibilidad terminando forzadamente el proceso del servidor de índices de HANA en el nodo principal. Este escenario de prueba simula un error crítico del servicio, lo que desencadena la conmutación automática al nodo secundario. La prueba comprueba la ejecución correcta de la conmutación por error, garantiza la coherencia de los datos y valida la restauración del servicio después de la recuperación. | El servidor de índices está habilitado |
| Eliminación del nodo principal | La prueba de eliminación de nodo principal valida el comportamiento del clúster mediante la finalización forzada de todos los procesos de HANA en el nodo principal mediante la señal SIGKILL. Este procedimiento simula un fallo de servicio abrupto, que desencadena el failover automático al nodo secundario. La prueba comprueba la promoción adecuada de la base de datos secundaria a la principal, garantiza la coherencia de los datos y valida la recuperación completa del clúster. | |
| Bloqueo de máquina virtual del nodo principal | La prueba de fallo de máquina virtual del nodo primario simula un fallo inmediato del sistema en el nodo primario de HANA ejecutando el comando "echo b" para desencadenar un reinicio abrupto sin un apagado adecuado. Esto prueba la capacidad del clúster para controlar errores inesperados del nodo principal, valida la ejecución correcta de la conmutación por error y comprueba la coherencia de los datos después de la recuperación. | |
| Bloqueo del servidor de índices secundario | La prueba de fallo del servidor de índices secundario simula la falla del proceso del servidor de índices HANA en el nodo secundario. Valida que el nodo principal sigue funcionando normalmente mientras se comprueba la capacidad del clúster para controlar los errores secundarios, se prueban los mecanismos de recuperación automática y se garantiza que la replicación del sistema se reanuda correctamente después de la restauración del servicio. | El servidor de índices está habilitado |
| Eliminación del nodo secundario | La prueba de eliminación de nodo secundario examina la resistencia del clúster mediante la terminación forzada de los procesos de HANA en el nodo secundario mediante la señal kill -9. La prueba valida que el nodo principal mantiene una operación normal mientras el nodo secundario se somete a la recuperación, lo que garantiza la estabilidad del clúster y la sincronización de datos adecuada una vez completado el proceso de recuperación. | |
| Bloqueo de máquina virtual del nodo secundario | La prueba de bloqueo de la máquina virtual del nodo secundario simula un bloqueo del sistema no controlado en el nodo HANA secundario ejecutando el comando "echo b", lo que desencadena un reinicio inmediato sin procedimientos de apagado adecuados. La prueba valida que el nodo principal mantiene la operación, comprueba la estabilidad del clúster y garantiza que la replicación del sistema se reanude correctamente después de que se recupere el nodo secundario. | |
| Congelación del sistema de archivos | La prueba Filesystem Freeze valida el comportamiento del clúster cuando el sistema de archivos del nodo principal deja de responder. Simula un problema de almacenamiento congelando el sistema de archivos en el nodo principal que ejecuta la base de datos de HANA, lo que desencadena la conmutación por error automática en el nodo secundario. La prueba comprueba la reacción adecuada del clúster, la migración de recursos y la coherencia de los datos después de la recuperación. | Compartición de archivos configurada con Azure NetApp Files |
| * Vallado de SBD | Valida el mecanismo de aislamiento de clúster mediante la eliminación del proceso SBD inquisitor en el nodo principal. Comprueba la detección adecuada de barreras, el aislamiento de nodos y la conmutación por error automatizada para garantizar la integridad del clúster durante los errores de hardware o comunicación. | Barrera configurada con el mecanismo stonith de SBD |
Alta disponibilidad de SAP Central Services
Valida el mecanismo de conmutación por error de SAP Central Services, lo que garantiza que el sistema pueda recuperarse de errores de nodo sin afectar a la disponibilidad de los servicios críticos. Los siguientes casos de prueba están disponibles para validar la alta disponibilidad de SAP Central Services:
| Caso de prueba | Description | Observaciones |
|---|---|---|
| Validación de configuración de alta disponibilidad (en línea) | La prueba de validación de parámetros de alta disponibilidad valida la configuración de alta disponibilidad, incluida la configuración de Corosync, los recursos de Pacemaker, la configuración del dispositivo SBD y la configuración de replicación del sistema SCS. | |
| Equilibrador de carga de Azure | La prueba de configuración de Azure LB valida la configuración de Azure Load Balancer, incluida la configuración del sondeo de estado, la configuración del grupo de back-end, las reglas de equilibrio de carga y la configuración de IP de front-end. | |
| Validación de la configuración del control de SAP | La prueba de validación de configuración de SAPControl ejecuta varios comandos de sapcontrol para validar la configuración de SCS. Ejecuta comandos como HAGetFailoverConfig, HACheckFailoverConfig y HACheckConfig, capturando sus salidas y estados para garantizar la configuración y la funcionalidad adecuadas. | Carga de trabajo de SAP en el sistema operativo SLES |
| Migración de recursos | La prueba de migración de recursos valida los escenarios de conmutación por error planeados mediante el control del movimiento de recursos entre nodos SCS, lo que garantiza los cambios de rol adecuados. | |
| Bloqueo de nodo de ASCS | La prueba de fallo del nodo de ASCS simula el comportamiento del clúster cuando el nodo de ASCS falla. Simula un error de nodo ASCS finalizando el proceso de forma forzada y, a continuación, comprueba la conmutación automática por error en el nodo ERS, supervisa el estado de replicación del sistema y confirma la recuperación del servicio. | |
| Bloquear la comunicación de red | La prueba de red bloqueada valida el comportamiento del clúster durante escenarios de partición de red mediante el uso de reglas iptables para bloquear la comunicación entre nodos ASCS y ERS. Comprueba los mecanismos de prevención de cerebro dividido, valida la ejecución correcta de la conmutación por error cuando los nodos se aíslan y garantiza la estabilidad del clúster después de restaurar la conectividad de red. | |
| Finalizar proceso del servidor de mensajes | La prueba de eliminación de procesos del servidor de mensajes simula un error del proceso del servidor de mensajes en el nodo ASCS al terminarlo con fuerza mediante la señal kill -9. Comprueba la reacción correcta del clúster, la conmutación automática por error al nodo ERS y garantiza la continuidad del servicio después del error del proceso. | |
| Terminación del proceso del servidor de puesta en cola | La prueba de terminación del proceso del servidor de cola simula una falla del proceso del servidor de cola en el nodo ASCS al terminarlo forzadamente usando la señal kill -9. Valida el comportamiento adecuado del clúster y la ejecución automática de la conmutación por fallos. | |
| Terminación del proceso del servidor de replicación | La prueba de eliminación del proceso del servidor de replicación en cola simula un error del proceso del servidor de replicación en el nodo ERS al forzar su terminación utilizando la señal kill -9. Esta prueba controla las arquitecturas ENSA1 y ENSA2. Valida el reinicio automático del proceso. | |
| Eliminación del proceso de sapstartsrv para ASCS | La prueba sapstartsrv Process Kill simula una falla del Servicio de Inicio de SAP para la instancia de ASCS al terminarlo de manera forzada usando la señal kill -9. Verifica la reacción adecuada del clúster, la conmutación automática por error al nodo ERS y comprueba la restauración del servicio después del error del proceso. | Carga de trabajo de SAP en el sistema operativo SLES |
| Reinicio manual de la instancia de ASCS | La prueba reinicio manual valida el comportamiento del clúster cuando la instancia de ASCS se detiene manualmente mediante sapcontrol. Comprueba la reacción adecuada del clúster a un apagado controlado de la instancia, garantiza la conmutación por error automática al nodo ERS y confirma la continuidad del servicio durante la operación. | |
| Prueba de HAFailoverToNode | La prueba HAFailoverToNode valida la funcionalidad de alta disponibilidad integrada de SAP mediante el comando sapcontrol para desencadenar una conmutación por error controlada. Ejecuta "HAFailoverToNode" como usuario administrador de SAP, que inicia una migración limpia de la instancia de ASCS a otro nodo. | Carga de trabajo de SAP en el sistema operativo SLES |
Validación de configuración de alta disponibilidad (sin conexión)
La validación sin conexión es un modo del marco de automatización de pruebas de SAP que valida las configuraciones de clústeres de alta disponibilidad de SAP HANA y SAP Central Services sin establecer una conexión SSH activa al clúster de producción. En su lugar, analiza los archivos XML de base de información de clúster capturados (CIB) exportados desde cada nodo de clúster. Este enfoque permite la evaluación repetible y no intrusiva de la configuración de alta disponibilidad, ideal para las auditorías de cumplimiento, las revisiones previas a los cambios y el análisis aislado. Para obtener más información sobre cómo ejecutar la validación sin conexión, consulte Validación sin conexión de la configuración de alta disponibilidad.
Nota:
La validación sin conexión no ejecuta ninguna prueba funcional.
Pasos siguientes
- Para ejecutar las pruebas de alta disponibilidad, consulte Introducción a las pruebas de alta disponibilidad.
- Para ejecutar la validación de configuración de alta disponibilidad sin conexión, consulte Introducción a las pruebas de alta disponibilidad sin conexión.
- Para comprender la arquitectura de SAP Testing Automation Framework, consulte Revisión de la arquitectura del marco de trabajo.
- Para ver la matriz de compatibilidad de SAP Testing Automation Framework, consulte Descripción de las plataformas admitidas.