Editar

Share via


Recuperación ante desastres en la plataforma de datos de Azure: detalles del escenario

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Azure Event Hubs

Topología del servicio de datos

A nivel alto, la topología del servicio de datos de la plataforma de datos de Contoso se puede ilustrar de la manera siguiente: Diagrama de alto nivel de la topología de servicio de datos de Contoso. Este diagrama lógico resume las funciones clave del ecosistema de datos de Contoso en una vista simplificada y de alto nivel. Esta visión abstracta incluye las secciones que abarcan las implementaciones de escenarios, en línea con la selección de la estrategia de recuperación ante desastres y la segregación de responsabilidades en un proceso de recuperación de servicios.

Impacto de la recuperación ante desastres frente a la actividad del cliente

En las secciones siguientes se presenta un desglose de la actividad de Contoso necesaria en los eventos de recuperación ante desastres de impactos variables.

Área: Componentes fundamentales

  • Microsoft Entra ID, incluidos los derechos de rol

    • Selección de SKU de Contoso: Premium P1
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Grupos de administración

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Suscripciones

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Azure Key Vault

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Azure Monitor

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Microsoft Defender for Cloud

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Cost Management

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • DNS de Azure

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Network Watcher

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Almacén de Recovery Services

    • Selección de SKU de Contoso: Valor predeterminado (GRS)
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
    • Notas
      • La restauración entre regiones permitirá realizar simulacros de recuperación ante desastres y que el cliente conmute por error a la región secundaria
  • Redes virtuales, incluidas subredes, UDR y grupos de seguridad de red

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar las redes virtuales de la plataforma base y de datos con sus UDR y grupos de seguridad de red asociados en la región secundaria.
    • Notas
      • Traffic Manager se puede usar para enrutar geográficamente el tráfico entre regiones que contienen estructuras de red virtual de réplica. Si tienen el mismo espacio de direcciones, no se pueden conectar a la red local, ya que provocaría problemas de enrutamiento. En caso de desastre y pérdida de una red virtual en una región, puede conectar la otra red virtual en la región disponible, con el espacio de direcciones correspondiente a su red local.
  • Grupos de recursos

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar los grupos de recursos de la plataforma base y de datos en la región secundaria.
    • Notas
      • Esta actividad se mitigaría mediante la implementación de la estrategia de "reserva semiactiva", con la topología de red y grupo de recursos disponible en la región secundaria.
  • Azure Firewall

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar las instancias de Azure Firewalls base en la región secundaria.
    • Notas
      • Azure Firewall se puede crear con Availability Zones para aumentar la disponibilidad.
      • Una estrategia de "reserva semiactiva" mitigaría esta actividad.
  • Azure DDoS

    • Selección de SKU de Contoso: Protección de red
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que crear un plan de protección contra DDoS para las redes virtuales de base dentro de la región secundaria
  • Circuito ExpressRoute

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
    • Notas
      • El circuito físico seguirá siendo responsabilidad de Microsoft y del asociado de conectividad para recuperar.
  • VPN Gateway

    • Selección de SKU de Contoso: VpnGw1
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar las instancias de VPN Gateway base en la región secundaria.
    • Notas
      • Se pueden crear instancias de VPN Gateway con Availability Zones para aumentar la disponibilidad.
      • Una estrategia de "reserva semiactiva" mitigaría esta actividad.
  • Equilibrador de carga

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar los equilibradores de carga base en la región secundaria.
    • Notas
  • Azure DevOps

Área: Componentes de la plataforma de datos

  • Cuenta de almacenamiento: Azure Data Lake Gen2

    • Selección de SKU de Contoso: LRS
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar las cuentas de almacenamiento de la plataforma de datos y rehidratarlas con datos de la región secundaria.
    • Notas
      • Las cuentas de almacenamiento tienen una amplia variedad de opciones de redundancia de datos entre la redundancia de la región primaria y la redundancia de la región secundaria.
      • Para la redundancia de la región secundaria, los datos se replican en la región secundaria de forma asincrónica. Un error que afecte a la región primaria podría provocar la pérdida de datos si no se puede recuperar dicha región. Azure Storage tiene normalmente un RPO inferior a 15 minutos.
      • En el caso de una interrupción regional, las cuentas de almacenamiento con redundancia geográfica estarían disponibles en la región secundaria como LRS. Sería necesario aplicar una configuración adicional para aumentar estos componentes en la región secundaria para que tenga redundancia geográfica.
  • Canalizaciones de Azure Synapse

    • Selección de SKU de Contoso: Gen2 optimizado para proceso
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que implementar y restaurar la plataforma de datos de Azure Synapse Analytics en la región secundaria y volver a implementar las canalizaciones.
    • Notas
  • Azure Event Hubs

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar la instancia de Event Hubs en la región secundaria.
    • Notas
      • Cuando se utiliza Microsoft Azure Portal, la redundancia de zonas a través de la compatibilidad con las zonas de disponibilidad se habilita automáticamente, esto se puede deshabilitar mediante la CLI de Azure o los comandos de PowerShell
      • Esta resistencia se puede ampliar para cubrir una interrupción completa de la región con la recuperación ante desastres geográfica.
  • Instancias de Azure IoT Hub

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar IoT Hub en la región secundaria.
    • Notas
  • Azure Stream Analytics

    • Selección de SKU de Contoso: Estándar
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar IoT Hub en la región secundaria.
    • Notas
      • Una característica clave de Stream Analytics es su capacidad de recuperarse de un error de nodo
  • Servicios de Azure AI (previamente Cognitive Services)

    • Selección de SKU de Contoso: Pago por uso
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: N/A
  • Azure Machine Learning

    • Selección de SKU de Contoso: De uso general, instancias de la serie D
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar Machine Learning en la región secundaria.
    • Notas
  • Grupos de Data Explorer de Azure Synapse

    • Selección de SKU de Contoso: optimizado para proceso, pequeño (4 núcleos)
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar los grupos de Data Explorer de Azure Synapse y las canalizaciones en la región secundaria.
  • Grupos de Spark de Azure Synapse

    • Selección de SKU de Contoso: Gen2 optimizado para proceso
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que volver a implementar los grupos de Spark de Azure Synapse y las canalizaciones en la región secundaria.
    • Notas
      • Si se usa un metastore de Hive externo, también se necesitará una estrategia de recuperación.
        • Azure Site Recovery se puede usar con los metastores de SQL Server.
        • Un metastore de MySQL usaría la característica de restauración geográfica o las réplicas de lectura entre regiones.
  • Grupos de SQL sin servidor y dedicados de Azure Synapse

    • Selección de SKU de Contoso: Gen2 optimizado para proceso
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso tendría que implementar y restaurar la plataforma de datos de Azure Synapse Analytics en la región secundaria.
    • Notas
  • Power BI

  • Azure Cosmos DB

    • Selección de SKU de Contoso: Escritura en una sola región con copia de seguridad periódica
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de la zona de disponibilidad: N/A
      • Error regional de Azure: Contoso debe supervisar que haya suficientes RU aprovisionadas en las regiones restantes para admitir actividades de lectura y escritura.
    • Notas
      • Las cuentas de una sola región pueden perder disponibilidad después de una interrupción regional. Para garantizar una alta disponibilidad de la instancia de Cosmos DB, configúrela con una sola región de escritura y al menos una segunda región (lectura) y permita la conmutación por error administrada por el servicio.
      • Para evitar la pérdida de disponibilidad de escritura, se recomienda que las cargas de trabajo de producción estén configuradas con la opción "habilitar la conmutación por error administrada por el servicio", lo que permite la conmutación automática por error a las regiones disponibles
  • Azure AI Search (anteriormente Cognitive Search)

    • Selección de SKU de Contoso: Estándar S1
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar la Búsqueda de AI en la región secundaria.
    • Notas
  • Azure Data Share

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que volver a implementar Data Share en la región secundaria.
    • Notas
  • Purview

    • Selección de SKU de Contoso: N/A
    • Impacto de la recuperación ante desastres
      • Error del centro de datos de Azure: N/A
      • Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
      • Error regional de Azure: Contoso tendría que implementar una instancia de Purview en la región secundaria.
    • Notas
      • Esta actividad se mitigaría mediante la implementación de la estrategia de "reserva semiactiva", con una segunda instancia de Azure Purview disponible en la región secundaria.
      • Un enfoque de "reserva semiactiva" tiene las siguientes consideraciones principales:
        • Las cuentas de Azure Purview principal y secundaria no se pueden configurar con las mismas cuentas de Azure Data Factory, Azure Data Share y Synapse Analytics, si procede. Como resultado, el linaje de datos de Azure Data Factory y Azure Data Share no se puede ver en las cuentas de Azure Purview secundarias.
        • Los entornos de ejecución de integración son específicos de una cuenta de Azure Purview. Por tanto, si se deben ejecutar exámenes en cuentas de Azure Purview principales y secundarias en paralelo, se deben mantener varios entornos de ejecución de integración autohospedados.

Nota

Esta sección está pensada como guía general. Se debe consultar la documentación del proveedor sobre la recuperación de desastres, la redundancia y las copias de seguridad para conocer el enfoque correcto que se debe aplicar a un nuevo componente o servicio que se esté considerando.

"Error del centro de datos de Azure" trata la situación en la que la región afectada no tiene ofertas de Availability Zones.

Si se han producido versiones o configuraciones nuevas o actualizadas en el momento del evento de desastre, deben comprobarse e implementarse de nuevo (si es necesario) como parte del trabajo para la puesta al día de la plataforma.

Pasos siguientes

Ahora que ha conocido los detalles del escenario, puede aprender sobre las recomendaciones relacionadas con este escenario.