Topología del servicio de datos
A nivel alto, la topología del servicio de datos de la plataforma de datos de Contoso se puede ilustrar de la manera siguiente: Este diagrama lógico resume las funciones clave del ecosistema de datos de Contoso en una vista simplificada y de alto nivel. Esta visión abstracta incluye las secciones que abarcan las implementaciones de escenarios, en línea con la selección de la estrategia de recuperación ante desastres y la segregación de responsabilidades en un proceso de recuperación de servicios.
Impacto de la recuperación ante desastres frente a la actividad del cliente
En las secciones siguientes se presenta un desglose de la actividad de Contoso necesaria en los eventos de recuperación ante desastres de impactos variables.
Área: Componentes fundamentales
Microsoft Entra ID, incluidos los derechos de rol
- Selección de SKU de Contoso: Premium P1
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Grupos de administración
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Suscripciones
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Azure Key Vault
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Azure Monitor
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Microsoft Defender for Cloud
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Cost Management
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
DNS de Azure
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Network Watcher
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Almacén de Recovery Services
- Selección de SKU de Contoso: Valor predeterminado (GRS)
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
- Notas
- La restauración entre regiones permitirá realizar simulacros de recuperación ante desastres y que el cliente conmute por error a la región secundaria
Redes virtuales, incluidas subredes, UDR y grupos de seguridad de red
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar las redes virtuales de la plataforma base y de datos con sus UDR y grupos de seguridad de red asociados en la región secundaria.
- Notas
- Traffic Manager se puede usar para enrutar geográficamente el tráfico entre regiones que contienen estructuras de red virtual de réplica. Si tienen el mismo espacio de direcciones, no se pueden conectar a la red local, ya que provocaría problemas de enrutamiento. En caso de desastre y pérdida de una red virtual en una región, puede conectar la otra red virtual en la región disponible, con el espacio de direcciones correspondiente a su red local.
Grupos de recursos
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar los grupos de recursos de la plataforma base y de datos en la región secundaria.
- Notas
- Esta actividad se mitigaría mediante la implementación de la estrategia de "reserva semiactiva", con la topología de red y grupo de recursos disponible en la región secundaria.
Azure Firewall
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar las instancias de Azure Firewalls base en la región secundaria.
- Notas
- Azure Firewall se puede crear con Availability Zones para aumentar la disponibilidad.
- Una estrategia de "reserva semiactiva" mitigaría esta actividad.
Azure DDoS
- Selección de SKU de Contoso: Protección de red
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que crear un plan de protección contra DDoS para las redes virtuales de base dentro de la región secundaria
Circuito ExpressRoute
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
- Notas
- El circuito físico seguirá siendo responsabilidad de Microsoft y del asociado de conectividad para recuperar.
VPN Gateway
- Selección de SKU de Contoso: VpnGw1
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar las instancias de VPN Gateway base en la región secundaria.
- Notas
- Se pueden crear instancias de VPN Gateway con Availability Zones para aumentar la disponibilidad.
- Una estrategia de "reserva semiactiva" mitigaría esta actividad.
Equilibrador de carga
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar los equilibradores de carga base en la región secundaria.
- Notas
- Dependiendo de la región primaria, se podría usar un diseño con redundancia de zona o entre regiones para aumentar esta posición.
Azure DevOps
- Selección de SKU de Contoso: DevOps Services
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
- Notas
- DevOps Services se basa en la red troncal de Azure y usa Azure Blob Storage con replicación geográfica para garantizar la resistencia.
Área: Componentes de la plataforma de datos
Cuenta de almacenamiento: Azure Data Lake Gen2
- Selección de SKU de Contoso: LRS
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar las cuentas de almacenamiento de la plataforma de datos y rehidratarlas con datos de la región secundaria.
- Notas
- Las cuentas de almacenamiento tienen una amplia variedad de opciones de redundancia de datos entre la redundancia de la región primaria y la redundancia de la región secundaria.
- Para la redundancia de la región secundaria, los datos se replican en la región secundaria de forma asincrónica. Un error que afecte a la región primaria podría provocar la pérdida de datos si no se puede recuperar dicha región. Azure Storage tiene normalmente un RPO inferior a 15 minutos.
- En el caso de una interrupción regional, las cuentas de almacenamiento con redundancia geográfica estarían disponibles en la región secundaria como LRS. Sería necesario aplicar una configuración adicional para aumentar estos componentes en la región secundaria para que tenga redundancia geográfica.
Canalizaciones de Azure Synapse
- Selección de SKU de Contoso: Gen2 optimizado para proceso
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que implementar y restaurar la plataforma de datos de Azure Synapse Analytics en la región secundaria y volver a implementar las canalizaciones.
- Notas
- Los puntos de restauración automática se eliminan después de siete días.
- Los puntos de restauración definidos por el usuario están disponibles. Actualmente, hay un límite máximo de 42 puntos de restauración definidos por el usuario que se eliminan automáticamente después de siete días.
- Synapse también puede realizar una restauración de base de datos en la región local o remota y, luego, pausar inmediatamente la instancia. Este proceso solo incurrirá en costos de almacenamiento y tendrá cero costos de proceso. Esta solución ofrece una manera de mantener una copia de base de datos "activa" a intervalos específicos.
Azure Event Hubs
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar la instancia de Event Hubs en la región secundaria.
- Notas
- Cuando se utiliza Microsoft Azure Portal, la redundancia de zonas a través de la compatibilidad con las zonas de disponibilidad se habilita automáticamente, esto se puede deshabilitar mediante la CLI de Azure o los comandos de PowerShell
- Esta resistencia se puede ampliar para cubrir una interrupción completa de la región con la recuperación ante desastres geográfica.
Instancias de Azure IoT Hub
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar IoT Hub en la región secundaria.
- Notas
- IoT Hub proporciona alta disponibilidad dentro de la región y usará automáticamente una zona de disponibilidad si se crea en un conjunto predefinido de regiones de Azure.
Azure Stream Analytics
- Selección de SKU de Contoso: Estándar
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar IoT Hub en la región secundaria.
- Notas
- Una característica clave de Stream Analytics es su capacidad de recuperarse de un error de nodo
Servicios de Azure AI (previamente Cognitive Services)
- Selección de SKU de Contoso: Pago por uso
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
Azure Machine Learning
- Selección de SKU de Contoso: De uso general, instancias de la serie D
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar Machine Learning en la región secundaria.
- Notas
- Mientras Microsoft administra la infraestructura de Machine Learning, el cliente administra los recursos asociados. Solo Key Vault tiene alta disponibilidad de forma predeterminada.
- En función de la importancia crítica del servicio admitida, Microsoft recomienda una implementación de varias regiones.
Grupos de Data Explorer de Azure Synapse
- Selección de SKU de Contoso: optimizado para proceso, pequeño (4 núcleos)
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar los grupos de Data Explorer de Azure Synapse y las canalizaciones en la región secundaria.
Grupos de Spark de Azure Synapse
- Selección de SKU de Contoso: Gen2 optimizado para proceso
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que volver a implementar los grupos de Spark de Azure Synapse y las canalizaciones en la región secundaria.
- Notas
- Si se usa un metastore de Hive externo, también se necesitará una estrategia de recuperación.
- Azure Site Recovery se puede usar con los metastores de SQL Server.
- Un metastore de MySQL usaría la característica de restauración geográfica o las réplicas de lectura entre regiones.
- Si se usa un metastore de Hive externo, también se necesitará una estrategia de recuperación.
Grupos de SQL sin servidor y dedicados de Azure Synapse
- Selección de SKU de Contoso: Gen2 optimizado para proceso
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso tendría que implementar y restaurar la plataforma de datos de Azure Synapse Analytics en la región secundaria.
- Notas
- Los puntos de restauración automática se eliminan después de siete días.
- Los puntos de restauración definidos por el usuario están disponibles. Actualmente, hay un límite máximo de 42 puntos de restauración definidos por el usuario que se eliminan automáticamente después de siete días.
- Synapse también puede realizar una restauración de base de datos en la región local o remota y, luego, pausar inmediatamente la instancia. Este proceso solo incurrirá en costos de almacenamiento y tendrá cero costos de proceso. Esta solución ofrece una manera de mantener una copia de base de datos "activa" a intervalos específicos.
Power BI
- Selección de SKU de Contoso: Power BI Pro
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: N/A
- Notas
- El cliente no tendrá que hacer nada si el equipo de Power BI decide o declara la interrupción.
- Una instancia de servicio Power BI conmutada por error solo admite operaciones de lectura. Los informes que usan Direct Query o Live Connect no funcionarán durante una conmutación por error.
- El cliente no tendrá que hacer nada si el equipo de Power BI decide o declara la interrupción.
Azure Cosmos DB
- Selección de SKU de Contoso: Escritura en una sola región con copia de seguridad periódica
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de la zona de disponibilidad: N/A
- Error regional de Azure: Contoso debe supervisar que haya suficientes RU aprovisionadas en las regiones restantes para admitir actividades de lectura y escritura.
- Notas
- Las cuentas de una sola región pueden perder disponibilidad después de una interrupción regional. Para garantizar una alta disponibilidad de la instancia de Cosmos DB, configúrela con una sola región de escritura y al menos una segunda región (lectura) y permita la conmutación por error administrada por el servicio.
- Para evitar la pérdida de disponibilidad de escritura, se recomienda que las cargas de trabajo de producción estén configuradas con la opción "habilitar la conmutación por error administrada por el servicio", lo que permite la conmutación automática por error a las regiones disponibles
Azure AI Search (anteriormente Cognitive Search)
- Selección de SKU de Contoso: Estándar S1
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar la Búsqueda de AI en la región secundaria.
- Notas
- No hay ningún mecanismo integrado para la recuperación ante desastres.
- La implementación de varias réplicas de la Búsqueda de AI entre zonas de disponibilidad solucionará el riesgo de interrupción del centro de datos.
Azure Data Share
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que volver a implementar Data Share en la región secundaria.
- Notas
- Azure Data Share no es compatible actualmente con Availability Zones.
- La elevación de Data Share a una implementación de alta disponibilidad solucionará cada uno de estos riesgos de interrupción.
Purview
- Selección de SKU de Contoso: N/A
- Impacto de la recuperación ante desastres
- Error del centro de datos de Azure: N/A
- Error de zona de disponibilidad: Contoso tendría que validar la disponibilidad y volver a realizar la implementación si es necesario.
- Error regional de Azure: Contoso tendría que implementar una instancia de Purview en la región secundaria.
- Notas
- Esta actividad se mitigaría mediante la implementación de la estrategia de "reserva semiactiva", con una segunda instancia de Azure Purview disponible en la región secundaria.
- Un enfoque de "reserva semiactiva" tiene las siguientes consideraciones principales:
- Las cuentas de Azure Purview principal y secundaria no se pueden configurar con las mismas cuentas de Azure Data Factory, Azure Data Share y Synapse Analytics, si procede. Como resultado, el linaje de datos de Azure Data Factory y Azure Data Share no se puede ver en las cuentas de Azure Purview secundarias.
- Los entornos de ejecución de integración son específicos de una cuenta de Azure Purview. Por tanto, si se deben ejecutar exámenes en cuentas de Azure Purview principales y secundarias en paralelo, se deben mantener varios entornos de ejecución de integración autohospedados.
Nota
Esta sección está pensada como guía general. Se debe consultar la documentación del proveedor sobre la recuperación de desastres, la redundancia y las copias de seguridad para conocer el enfoque correcto que se debe aplicar a un nuevo componente o servicio que se esté considerando.
"Error del centro de datos de Azure" trata la situación en la que la región afectada no tiene ofertas de Availability Zones.
Si se han producido versiones o configuraciones nuevas o actualizadas en el momento del evento de desastre, deben comprobarse e implementarse de nuevo (si es necesario) como parte del trabajo para la puesta al día de la plataforma.
Pasos siguientes
Ahora que ha conocido los detalles del escenario, puede aprender sobre las recomendaciones relacionadas con este escenario.
Recursos relacionados
- Recuperación ante desastres para la plataforma de datos de Azure: información general
- Recuperación ante desastres para una plataforma de datos de Azure: arquitectura
- Recuperación ante desastres en una plataforma de datos de Azure: implementación de este escenario
- Recuperación ante desastres para la plataforma de datos de Azure: resumen