Ejecución de una simulación de recuperación ante desastres

6 minutos

En este unidad, obtendrá información sobre las simulaciones de recuperación ante desastres de Site Recovery: qué se debe tener en cuenta y cómo ejecutar pruebas para comprobar que la configuración sea correcta.

Puede usar las simulaciones de recuperación ante desastres (DR) para probar la capacidad de la organización de recuperarse de una interrupción sin que afecte al servicio de producción.

En el ejercicio anterior ha acabado de configurar Azure Site Recovery y ahora tiene que probar la replicación de la infraestructura. Pruebe la configuración mediante la ejecución de una simulación de recuperación ante desastres. Azure Site Recovery permite ejecutar estas simulaciones de forma segura sin que afecten al entorno de producción. También ejecutará varias pruebas de control de calidad en la configuración para asegurarse de que la solución de recuperación ante desastres funciona.

¿Qué es una simulación de recuperación ante desastres?

Una simulación de recuperación ante desastres (DR) es una manera de comprobar si la solución se ha configurado correctamente. La simulación debería garantizarle tanto a usted como a su empresa que los datos y servicios estarán disponibles incluso aunque se produzcan desastres. Normalmente, las organizaciones establecen un objetivo de tiempo de recuperación (RTO) que indica cuánto se tarda en recuperar la infraestructura. La empresa también debe definir un objetivo de punto de recuperación (RPO), que determina la cantidad de pérdida de datos que es aceptable como una función temporal. Por ejemplo, si el RPO de la empresa es de un día, tendrá que crear una copia de seguridad de todos los datos cada día. Además, tendrá que asegurarse de que se tarda menos de un día en restaurar dicha copia de seguridad.

A screenshot that shows the breakdown of failover tests that have been run.

Para garantizar que ejecute las pruebas de recuperación ante desastres, Site Recovery le indicará que las lleve a cabo en el panel de Site Recovery.

¿Por qué debería ejecutar una simulación de recuperación ante desastres?

Las simulaciones de recuperación ante desastres son fundamentales para garantizar que la solución implementada cumple los requisitos de continuidad empresarial y recuperación ante desastres (BCDR), y para asegurarse de que la replicación funciona correctamente. La simulación de recuperación ante desastres, combinada con el RTO y el RPO, debe probarse minuciosamente para asegurarse de que la replicación, la conmutación por error y la recuperación se produzcan en el plazo requerido.

Por ejemplo, imagine que el RTO es de una hora y el RPO de seis. Si se realiza una copia de seguridad de los sistemas cada hora, esto se traduce en una hora de pérdida de datos más una hora adicional para recuperar los sistemas.

Imagine que el tiempo de recuperación real es de cinco horas. Los sistemas están a punto de superar las seis horas sin actualizarse, lo que supondría el incumplimiento del RPO de BCDR. Si prueba el tiempo real que se tarda en recuperarse de los errores, podrá asegurarse de que los sistemas siguen los planes de BCDR.

Conmutación por error de prueba de máquinas individuales

Las pruebas de conmutación por error permiten simular desastres y ver sus efectos. Se puede iniciar una prueba de conmutación por error desde el panel de Site Recovery o, directamente, desde el menú de recuperación ante desastres de una máquina virtual específica. Empezará por seleccionar un punto de recuperación. Puede elegir entre el último procesado, el punto coherente con la aplicación más reciente o un punto de recuperación personalizado.

Creación de una prueba de conmutación por error

Cree una red virtual aislada para que la infraestructura de producción no se vea afectada. Para ello, siga estos pasos:

Abra la máquina virtual de destino patient-records. Una manera fácil de encontrarla consiste en filtrar todos los recursos para mostrar solo Tipo == Máquina virtual. Seleccione patient-records en la lista de resultados.
En el menú de recursos, desplácese hasta Operaciones y seleccione Recuperación ante desastres.
Aparece el nuevo panel Elementos replicados. Seleccione Actualizar hasta que vea Protegido en el campo de estado. Después, en la barra de menús superior, seleccione Conmutación por error de prueba.
Una vez que la validación se realice correctamente, seleccione la red virtual en la lista desplegable Red virtual de Azure y, a continuación, seleccione el botón Probar conmutación por error. Esta opción ejecuta una conmutación por error de prueba de la máquina virtual y permite realizar un seguimiento de su progreso a través de la página trabajos de Site Recovery seleccionando el icono Notificaciones, así como el vínculo Iniciar la tarea para realizar la conmutación por error de prueba de la máquina virtual.
Una vez que haya finalizado, la máquina virtual conmutada por error aparecerá en el portal en Máquinas virtuales, en la región de recuperación. Después, puede comprobar que la máquina virtual se está ejecutando, que el tamaño y la conexión son correctos y que refleja la máquina virtual de origen, pero en otra región de Azure.
Después de comprobar que todo funcione según lo previsto, seleccione Limpiar conmutación por error de prueba para eliminar la máquina virtual replicada en el panel Recuperación ante desastres. En este momento, se recomienda agregar notas sobre el resultado de la prueba. Active la casilla situada junto a Se completó la prueba para eliminar la máquina virtual de conmutación por error de prueba y, a continuación, seleccione Aceptar.

Conmutación por error flexible de varias máquinas

Site Recovery ofrece flexibilidad para ejecutar un escenario de prueba de recuperación ante desastres completo para todas las máquinas virtuales. Es posible crear planes de recuperación que incluyan una o varias máquinas virtuales. Las conmutaciones por error se pueden ejecutar tantas veces como se quiera y permiten una directiva flexible para probar diferentes combinaciones de infraestructura.

Al igual que en el caso de las pruebas de máquinas virtuales individuales, está disponible el mismo método de limpieza de pruebas para todo lo que se incluye en el plan de recuperación.

Diferencia entre una conmutación por error de simulación y de producción

La ejecución de una conmutación por error de producción en Site Recovery es similar a la de una simulación de prueba. Hay algunas excepciones; la primera es que se selecciona Conmutación por error, en lugar de Conmutación por error de prueba. Puede optar por apagar la máquina virtual de origen antes de iniciar la conmutación por error para que no se pierdan datos durante el cambio. Site Recovery no limpia el entorno de origen una vez que se ha completado la conmutación por error.

Cuando se haya completado la conmutación por error, compruebe que la máquina virtual funciona según lo previsto. Site Recovery permite cambiar el punto de recuperación en esta fase. Si está seguro de que la conmutación por error funciona, confírmela. Site Recovery elimina todos los puntos de recuperación de la máquina virtual de origen y completa la conmutación por error. Una vez que la infraestructura y los datos replicados se encuentran en la región secundaria, debe tener en cuenta que la nueva máquina virtual de dicha región también necesita protección.

Comprobación de conocimientos

Continuar