Procedimiento de conmutación por error de recuperación ante desastres
Importante
Este artículo no sustituye a la documentación de administración de SAP HANA ni a las notas de SAP. Se espera que el lector tenga un conocimiento sólido de la administración y operaciones de SAP HANA, sobre todo en lo relativo a la copia de seguridad, restauración, alta disponibilidad y recuperación ante desastres (DR). En este artículo se muestran capturas de pantalla de SAP HANA Studio. El contenido, la estructura y la naturaleza de las pantallas de las herramientas de administración de SAP y de las herramientas en sí pueden cambiar de una versión a otra de SAP HANA.
En este artículo, se describirán los pasos de conmutación por error a un sitio de recuperación ante desastres para SAP HANA en Azure (instancias grandes) (también conocido como Infraestructura BareMetal).
Escenarios y opciones de conmutación por error
Hay dos casos que se deben tener en cuenta al conmutar por error al sitio de DR:
- Necesita que la base de datos de SAP HANA vuelva al estado más reciente de los datos. En este caso, hay un script de autoservicio que puede usar para realizar la conmutación por error sin necesidad de ponerse en contacto con Microsoft. Para la conmutación por recuperación, sí que debe colaborar con Microsoft.
- Quiere realizar la restauración en una instantánea de almacenamiento que no sea la última instantánea replicada. En ese caso, tendrá que colaborar con Microsoft.
Nota:
Los pasos siguientes se deben realizar en HANA (instancias grandes), en el sitio de recuperación ante desastres.
Para restaurar a las instantáneas de almacenamiento replicado más recientes, siga los pasos descritos en "Perform full DR failover - azure_hana_dr_failover" (Conmutación por error completa de recuperación ante desastres: azure_hana_dr_failover) en Microsoft snapshot tools for SAP HANA on Azure (Herramientas de instantáneas de Microsoft para SAP HANA en Azure).
Si quiere conmutar por error varias instancias de SAP HANA, ejecute el comando azure_hana_dr_failover varias veces. Cuando se le solicite, escriba el SID de SAP HANA que desea conmutar por error y restaurar.
También puede probar la conmutación por error de recuperación ante desastres sin que afecte a la relación de replicación real. Para realizar una conmutación por error de prueba, siga los pasos descritos en "Perform a test DR failover - azure_hana_test_dr_failover" (Realizar una prueba de conmutación por error de recuperación ante desastres: azure_hana_test_dr_failover) en Herramientas de instantáneas de Microsoft para SAP HANA en Azure.
Importante
No ejecute transacciones de producción en la instancia que ha creado en el sitio de recuperación ante desastres a través del proceso de prueba de una conmutación por error. El comando azure_hana_test_dr_failover crea un conjunto de volúmenes que no tienen relación con el sitio primario. Como consecuencia, no se puede realizar una sincronización al sitio principal.
Si quiere probar varias instancias de SAP HANA, ejecute el script varias veces. Cuando se le solicite, escriba en el SID de SAP HANA de la instancia cuya conmutación por error quiere probar.
Establecimiento de volúmenes de recuperación ante desastres en una instantánea anterior
Imagine que tiene que realizar la conmutación por error al sitio de recuperación ante desastres para recuperar datos eliminados hace unas horas y necesita que los volúmenes de recuperación ante desastres se establezcan en una instantánea anterior. Se aplicará el procedimiento siguiente:
Apague la instancia de HANA que no es de producción en HANA (instancias grandes) de recuperación ante desastres que ejecute. Una instancia de producción de HANA inactiva está preinstalada.
Asegúrese de que no hay ningún proceso de SAP HANA en ejecución. Use el siguiente comando para esta comprobación:
/usr/sap/hostctrl/exe/sapcontrol –nr <HANA instance number> - function GetProcessList
.El resultado debería mostrar el proceso hdbdaemon en estado detenido y ningún otro proceso de HANA en ejecución o iniciado.
Determine en qué nombre de instantánea o identificador de copia de seguridad de SAP HANA desea que se restaure el tenga el sitio de recuperación ante desastres. En casos reales de recuperación ante desastres, esta instantánea suele ser la instantánea más reciente. Si necesita recuperar datos perdidos, elija una instantánea anterior.
Póngase en contacto con el soporte técnico de Azure a través de una solicitud de soporte técnico de alta prioridad. Solicite la restauración de esa instantánea con el nombre y la fecha de la instantánea. También puede identificarla mediante el identificador de copia de seguridad de HANA en el sitio de recuperación ante desastres. El valor predeterminado es que las operaciones solo restauran el volumen /hana/data. Si también desea tener los volúmenes /hana/logbackups, debe indicarlo específicamente. No restaure el volumen /hana/shared. En su lugar, elija archivos específicos, como global.ini del directorio .snapshot y sus subdirectorios después de volver a montar el volumen /hana/shared para PRD.
Las operaciones de Microsoft realizarán estos pasos:
a. Se detiene la replicación de instantáneas desde el volumen de producción a los volúmenes de recuperación ante desastres. Es posible que esto ya haya ocurrido si el motivo del desastre es una interrupción en el sitio de producción.
b. Se restaura el nombre de la instantánea de almacenamiento o la instantánea con el identificador de copia de seguridad que ha elegido en los volúmenes de recuperación ante desastres.
Después de la restauración, los volúmenes de recuperación ante desastres están disponibles para montarlos en HANA (instancias grandes) en la región de recuperación ante desastres.
- Monte los volúmenes de recuperación ante desastres en la unidad de HANA (instancias grandes) en el sitio de recuperación ante desastres.
- Inicie la instancia de producción de SAP HANA inactiva.
- Imagine que ha elegido copiar los registros de copia de seguridad del registro de transacciones para reducir el tiempo del objetivo de punto de recuperación (RPO). Después, combine las copias de seguridad del registro de transacciones en el directorio /hana/logbackups de recuperación ante desastres recién montado. No sobrescriba copias de seguridad existentes. Copie las copias de seguridad más recientes que no se han replicado con la última replicación de una instantánea de almacenamiento.
- También puede restaurar archivos individuales de las instantáneas que no se han replicado en el volumen /hana/shared/PRD en la región de Azure de recuperación ante desastres.
Recuperación de la instancia de producción de SAP HANA
En los pasos siguientes se muestra cómo recuperar la instancia de producción de SAP HANA desde la instantánea de almacenamiento restaurada y las copias de seguridad del registro de transacciones disponibles.
Cambie la ubicación de copia de seguridad a /hana/logbackups con SAP HANA Studio.
SAP HANA examina las ubicaciones del archivo de copia de seguridad y sugiere la copia de seguridad del registro de transacciones más reciente para restaurar. El examen puede tardar unos minutos hasta que aparezca una pantalla similar a la siguiente:
Ajuste algunas de las configuraciones predeterminadas:
- Desactive la casilla Use Delta Backups (Usar copias de seguridad diferenciales).
- Seleccione Initialize Log Area (Inicializar el área de registro).
Seleccione Finalizar.
Debería aparecer una ventana de progreso, como la que se muestra aquí. Recuerde que el ejemplo trata de una restauración de recuperación ante desastres de una configuración de SAP HANA de escalado horizontal de tres nodos.
Si la restauración deja de responder en la pantalla Finish (Finalizar) y no se muestra la pantalla de progreso, confirme que todas las instancias de SAP HANA de los nodos de trabajo se están ejecutando. Si es necesario, inicie manualmente las instancias de SAP HANA.
Conmutación por recuperación desde un sitio de recuperación ante desastres a uno de producción
Puede realizar la conmutación desde un sitio de recuperación ante desastres a un sitio de producción. Ahora se verá un escenario en el que la conmutación por error en el sitio de recuperación ante desastres se debe a problemas en la región de Azure de producción, no a la necesidad de recuperar datos perdidos.
La carga de trabajo de producción de SAP lleva un tiempo ejecutándose en el sitio de recuperación ante desastres. Una vez que se resuelven los problemas en el sitio de producción, es posible que el usuario quiera realizar la conmutación por recuperación con el sitio de producción. Como no se pueden perder datos, el paso de regreso al sitio de producción implica varios pasos y una cooperación estrecha con SAP HANA en el equipo de operaciones de Azure. Es tarea del usuario desencadenar el equipo de operaciones para iniciar la sincronización de vuelta al sitio de producción una vez que se hayan resuelto los problemas.
Siga estos pasos:
- El equipo de operaciones de SAP HANA en Azure obtiene el desencadenador para sincronizar los volúmenes de almacenamiento de producción desde los volúmenes de almacenamiento de recuperación ante desastres, que ahora representan el estado de producción. En este estado, HANA (instancias grandes) en el sitio de producción está apagada.
- SAP HANA en el equipo de operaciones de Azure supervisa la replicación y garantiza que se actualice antes de informar al usuario.
- El usuario apaga las aplicaciones que usan la instancia de HANA de producción en el sitio de recuperación ante desastres. Después, realiza una copia de seguridad del registro de transacciones de HANA. Luego, detiene la instancia de HANA que se ejecuta en HANA (instancias grandes) en el sitio de recuperación ante desastres.
- Ahora, el equipo de operaciones vuelve a sincronizar manualmente los volúmenes de disco.
- El equipo de operaciones de SAP HANA en Azure inicia de nuevo HANA (instancias grandes) en el sitio de producción. Se la entregan a usted. Se asegura de que la instancia de SAP HANA esté apagada al iniciar HANA (instancias grandes).
- Sigue los mismos pasos de restauración de la base de datos que ha seguido antes al realizar la conmutación por error al sitio de recuperación ante desastres.
Supervisión de la replicación de recuperación ante desastres
Para supervisar el estado del progreso de la replicación de almacenamiento, ejecute el script azure_hana_replication_status
. Para que funcione como cabría esperar, este comando se debe ejecutar desde una unidad que ejecute en la ubicación de recuperación ante desastres. El comando funciona independientemente de que la replicación esté activa o no. El comando se puede ejecutar para cada instancia grande de HANA del inquilino en la ubicación de recuperación ante desastres. No se puede usar para obtener detalles sobre el volumen de arranque.
Para más información sobre el comando y su salida, consulte "Get DR replication status - azure_hana_replication_status" (Obtener el estado de replicación de DR: azure_hana_replication_status) en Microsoft snapshot tools for SAP HANA on Azure (herramientas de instantáneas de Microsoft para SAP HANA en Azure).
Pasos siguientes
Obtenga información sobre la supervisión de SAP HANA (instancias grandes) en Azure.