Continuidad empresarial y recuperación ante desastres

Las cargas de trabajo de aplicaciones empresariales y de organización tienen requisitos de objetivo de tiempo de recuperación (RTO) y de objetivo de punto de recuperación (RPO). El diseño eficaz de continuidad empresarial y recuperación ante desastres (BCDR) proporciona funcionalidades de nivel de plataforma que cumplen estos requisitos. Para diseñar las funcionalidades de BCDR, capture los requisitos de recuperación ante desastres (DR) de la plataforma.

Consideraciones de diseño

Tenga en cuenta los siguientes factores al diseñar BCDR para las cargas de trabajo de aplicaciones:

  • Requisitos de disponibilidad de datos y aplicaciones:

    • Requisitos de RTO y RPO para cada carga de trabajo.
    • Compatibilidad con patrones de disponibilidad activo-activo y activo-pasivo.
  • BCDR como servicio para servicios de plataforma como servicio (PaaS):

    • Compatibilidad con las características de recuperación ante desastres nativa y alta disponibilidad (HA).
    • Funcionalidades de replicación geográfica y recuperación ante desastres para los servicios PaaS.
  • Compatibilidad con implementaciones de varias regiones para la conmutación por error, con proximidad de componentes para el rendimiento.

  • Las operaciones de las aplicaciones con una funcionalidad reducida o un rendimiento degradado durante una interrupción.

  • Idoneidad de la carga de trabajo para Availability Zones o conjuntos de disponibilidad:

    • Uso compartido de datos y dependencias entre zonas.
    • El efecto de Availability Zones en comparación con los conjuntos de disponibilidad en los dominios de actualización.
    • El porcentaje de cargas de trabajo que pueden estar en mantenimiento simultáneamente.
    • Compatibilidad de Availability Zones con SKU de máquinas virtuales específicas. Por ejemplo, el almacenamiento en disco Ultra de Azure requiere el uso de Availability Zones.
  • Copias de seguridad coherentes para aplicaciones y datos:

    • Instantáneas de máquina virtual.
    • Almacenes de Recovery Services de Azure Backup.
    • Los límites de la suscripción restringen el número de almacenes de Recovery Services y el tamaño de cada almacén.
  • Conectividad de red si se produce una conmutación por error:

    • Planeamiento de la capacidad de ancho de banda para Azure ExpressRoute.
    • Enrutamiento del tráfico durante una interrupción regional, de zona o de red.
  • Conmutaciones por error planeadas y no planeadas:

    • Los requisitos de coherencia de las direcciones IP y la posible necesidad de mantener direcciones IP después de la conmutación por error y la conmutación por recuperación.
    • Mantenimiento de capacidades de DevOps de ingeniería.
    • Recuperación ante desastres de Azure Key Vault para las claves de aplicaciones, certificados y secretos.
  • Residencia de datos:

    • Conozca la orientación nacional/regional para la residencia de datos que especifica si los datos deben mantenerse dentro de las fronteras nacionales o regionales. Esta orientación afecta al diseño de la replicación entre regiones.
    • Las regiones de Azure que residen dentro de la misma geografía que su conjunto habilitado pueden ayudar con la replicación entre regiones para cumplir los requisitos de residencia de datos, como los requisitos fiscales y de cumplimiento de la ley. Para obtener más información, consulte Replicación entre regiones de Azure.

Recomendaciones de diseño

Las siguientes prácticas de diseño admiten BCDR para cargas de trabajo de aplicaciones:

  • Emplee Azure Site Recovery en escenarios de recuperación ante desastres de Azure a Azure Virtual Machines.

    Site Recovery usa la replicación en tiempo real y la automatización de la recuperación para replicar cargas de trabajo entre regiones. Las funcionalidades integradas de la plataforma para cargas de trabajo de máquina virtual cumplen los requisitos bajos de RPO y RTO. Puede usar Site Recovery para ejecutar simulacros de recuperación sin que afecte a las cargas de trabajo de producción. También puede usar Azure Policy para habilitar la replicación y auditar la protección de máquinas virtuales.

  • Use funcionalidades nativas de recuperación ante desastres de PaaS.

    Las características integradas de PaaS simplifican el diseño y la automatización de la implementación para la replicación y la conmutación por error en las arquitecturas de cargas de trabajo. Las organizaciones que definen estándares de servicio también pueden auditar y aplicar la configuración del servicio mediante Azure Policy.

  • Use las funcionalidades de la copia de seguridad nativa de Azure.

    Las características de copia de seguridad nativas de Azure Backup y PaaS eliminan la necesidad de tener infraestructura y software de copia de seguridad de terceros. Al igual que con otras características nativas, puede establecer, auditar y aplicar configuraciones de copia de seguridad con Azure Policy para garantizar el cumplimiento de los requisitos de la organización.

  • Use varias regiones y ubicaciones de emparejamiento para la conectividad de ExpressRoute.

    Una arquitectura de red híbrida redundante puede ayudarle a garantizar una conectividad entre entornos locales ininterrumpida en caso de que una interrupción de servicio afecte a una región de Azure o a una ubicación del proveedor de emparejamiento.

  • Evite el uso de intervalos de direcciones IP superpuestos en redes de producción y de recuperación ante desastres.

    Las redes de producción y de recuperación ante desastres que tienen direcciones IP superpuestas requieren un proceso de conmutación por error que puede complicar y retrasar la conmutación por error de la aplicación. Cuando sea posible, planee una arquitectura de red de BCDR que proporcione una conectividad simultánea a todos los sitios.