Modifier

Partager via


Reprise d’activité pour Azure Data Platform - Détails du scénario

Azure Synapse Analytics
Azure Machine Learning
Azure Cosmos DB
Azure Data Lake
Hubs d'événements Azure

Topologie du service de données

La topologie des services de données de la plate-forme de données de Contoso peut être illustrée comme suit : Diagramme de la topologie de service de données Contoso. Ce diagramme logique abstrait les fonctions clés de l'écosystème de données de Contoso en une vue simplifiée de haut niveau. Cette vue abstraite soutient les sections traitant des déploiements de scénarios, en fonction de la sélection de la stratégie de reprise après sinistre (DR) et de la répartition des responsabilités dans le processus de reprise des services.

Impact de reprise d’activité par rapport à l’activité client

Les sections suivantes présentent une répartition de l’activité Contoso nécessaire pour des événements de reprise d’activité ayant des impacts variables.

Domaine : Composants fondamentaux

  • Microsoft Entra ID, notamment les droits d’utilisation

    • Sélection de la référence SKU Contoso : Premium P1
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Groupes d’administration

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Abonnements

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Azure Key Vault

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Azure Monitor

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Microsoft Defender pour le cloud

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Cost Management

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • DNS Azure

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Network Watcher

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Coffre Recovery Services

    • Sélection de l'UGS Contoso : Par défaut (stockage géoredondant (GRS))
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
    • Notes
  • Réseaux virtuels, y compris les sous-réseaux, les routes définies par l'utilisateur (UDR) & les groupes de sécurité réseau (NSG)

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso doit redéployer les réseaux virtuels de base et de plateforme de données avec leurs groupes de sécurité réseau et routes définies par l’utilisateur attachés dans la région secondaire
    • Notes
      • Traffic Manager peut être utilisé pour géorouter le trafic entre les régions qui contiennent des structures de réseau virtuel réplica. Si elles ont le même espace d’adressage, elles ne peuvent pas être connectées au réseau local, car cela entraînerait des problèmes de routage. En cas de sinistre et de perte d’un réseau virtuel dans une région, vous pouvez connecter à votre réseau local l’autre réseau virtuel dans la région disponible avec l’espace d’adressage correspondant.
  • Groupes de ressources

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso doit redéployer les groupes de ressources de base et de plateforme de données dans la région secondaire
    • Notes
      • Cette activité serait atténuée par la mise en œuvre de la stratégie « Warm Spare », en ayant le réseau et la topologie du groupe de ressources disponibles dans la région secondaire
  • Pare-feu Azure

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer les Pare-feu Azure de base dans la région secondaire
    • Notes
      • Le Pare-feu Azure peut être créé avec des zones de disponibilité afin de bénéficier d’une disponibilité accrue
      • Une stratégie « Warm Spare » permettrait d'atténuer cette activité.
  • Service de protection DDoS Azure

    • Sélection de la référence SKU Contoso : Protection réseau
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra créer un plan de protection DDoS pour les VNET de la Fondation dans la région secondaire.
  • ExpressRoute – Circuit

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
    • Notes
      • La récupération du circuit physique demeurerait la responsabilité de Microsoft et du partenaire de connectivité
  • Passerelle VPN

    • Sélection de la référence SKU Contoso : VpnGw1
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer les passerelles VPN de base dans la région secondaire
    • Notes
      • Les passerelles VPN peuvent être créées avec des zones de disponibilité afin de bénéficier d’une disponibilité accrue
      • Une stratégie « Warm Spare » permettrait d'atténuer cette activité.
  • Équilibreur de charge

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer les équilibreurs de charge de base dans la région secondaire
    • Notes
  • Azure DevOps

Domaine : Composants de la plateforme de données

  • Compte de stockage : Azure Data Lake Gen2

    • Sélection de l'UGS Contoso : Stockage localement redondant (LRS)
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer les comptes de stockage de la plateforme de données et les réhydrater avec des données dans la région secondaire
    • Notes
      • Les comptes de stockage offrent un large éventail d’options de redondance des données, de la redondance de la région primaire à la redondance de la région secondaire
      • Pour la région secondaire, les données de redondance sont répliquées dans la région secondaire de manière asynchrone. Une défaillance touchant la région primaire peut entraîner une perte de données si cette région ne peut pas être récupérée. Azure Storage vise généralement un objectif de point de récupération (RPO) inférieur à 15 minutes.
      • En cas de panne régionale, les comptes de stockage géoredondants sont disponibles dans la région secondaire en tant que LRS. Une configuration supplémentaire devra être appliquée pour élever ces composants dans la région secondaire afin qu’ils soient géoredondants
  • Azure Synapse - Pipelines

    • Sélection de la référence SKU Contoso : Gen2 optimisé pour le calcul
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra déployer et restaurer Azure Synapse Analytics de la plateforme de données dans la région secondaire, et redéployer les pipelines
    • Notes
      • Les points de restauration automatique sont supprimés après sept jours
      • Des points de restauration définis par l’utilisateur sont disponibles. Actuellement, il existe un plafond de 42 points de restauration définis par l’utilisateur, qui sont automatiquement supprimés après sept jours
      • Synapse peut également effectuer une restauration de base de données dans la région locale ou distante, puis SUSPENDRE immédiatement l’instance. Ce processus entraîne uniquement des coûts de stockage, et aucun coût de calcul. Ce plan permet de conserver une copie « active » de la base de données à des intervalles spécifiques.
  • Azure Event Hubs

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra redéployer l’instance Event Hubs dans la région secondaire
    • Notes
      • Lorsque vous utilisez le Portail Azure, la redondance de zone via la prise en charge des zones de disponibilité est automatiquement activée, elle peut être désactivée à l’aide de l’interface de ligne de commande Azure ou des commandes PowerShell
      • Cette résilience peut être étendue de façon à couvrir une panne de région complète avec la géo-reprise d’activité après sinistre
  • Hubs Azure IoT

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra redéployer le hub IoT dans la région secondaire
    • Notes
  • Azure Stream Analytics

    • Sélection de la référence SKU Contoso : Standard
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra redéployer le hub IoT dans la région secondaire
    • Notes
      • Une fonctionnalité clé de Stream Analytics est sa capacité à récupérer après une défaillance de nœud
  • Azure AI Services (anciennement Cognitive Services)

    • Sélection de la référence SKU Contoso : Paiement à l’utilisation
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : N/A
  • Azure Machine Learning

    • Sélection de la référence SKU Contoso : instances de la série D, Usage général
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : Contoso doit valider la disponibilité et redéployer si nécessaire.
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer le Machine Learning dans la région secondaire
    • Notes
  • Azure Synapse – Pools Data Explorer

    • Sélection de la référence SKU Contoso : Faible (4 cœurs) optimisé pour le calcul
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra redéployer les pools et pipelines Azure Synapse – Data Explorer dans la région secondaire
  • Azure Synapse – Pools Spark

    • Sélection de la référence SKU Contoso : Gen2 optimisé pour le calcul
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra redéployer les pools et pipelines Azure Synapse – Spark dans la région secondaire
    • Notes
      • Si un metastore Hive externe est utilisé, une stratégie de récupération sera également nécessaire.
        • Azure Site Recovery peut être utilisé pour un metastore SQL Server
        • Un metastore MySQL utilise la fonctionnalité de géorestauration ou des réplicas en lecture interrégions
  • Azure Synapse – Pools SQL serverless et dédiés

    • Sélection de la référence SKU Contoso : Gen2 optimisé pour le calcul
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devra déployer et restaurer Azure Synapse Analytics de la plateforme de données dans la région secondaire
    • Notes
      • Les points de restauration automatique sont supprimés après sept jours
      • Des points de restauration définis par l’utilisateur sont disponibles. Actuellement, il existe un plafond de 42 points de restauration définis par l’utilisateur, qui sont automatiquement supprimés après sept jours
      • Synapse peut également effectuer une restauration de base de données dans la région locale ou distante, puis SUSPENDRE immédiatement l’instance. Cela entraîne uniquement des coûts de stockage, et aucun coût de calcul. Cette solution permet de conserver une copie « vivante » de la base de données à des intervalles spécifiques.
  • Power BI

  • Azure Cosmos DB

    • Sélection de la référence SKU Contoso : écriture dans une région unique avec sauvegarde périodique
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : N/A
      • Défaillance régionale Azure : Contoso devrait surveiller, en s'assurant qu'il y a suffisamment d'unités de requête provisionnées (UR) dans les régions restantes pour prendre en charge les activités de lecture et d'écriture.
    • Notes
      • Les comptes dans une seule région peuvent perdre leur disponibilité suite à une panne régionale. Pour garantir la haute disponibilité de votre instance Azure Cosmos DB, configurez-la avec une seule région d'écriture et au moins une deuxième région (de lecture), et activez le basculement géré par le service
      • Pour éviter la perte de disponibilité de l’écriture, il a conseillé que les charges de travail de production soient configurées avec « activer le basculement géré par le service », ce qui permet le basculement automatique vers les régions disponibles
  • Azure AI Recherche (anciennement Recherche cognitive)

    • Sélection de la référence SKU Contoso : Standard S1
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : Contoso doit valider la disponibilité et redéployer si nécessaire.
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance d’une région Azure : Contoso devra redéployer la recherche par IA dans la région secondaire
    • Notes
  • Azure Data Share

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : Contoso doit valider la disponibilité et redéployer si nécessaire.
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra redéployer le partage de données dans la région secondaire
    • Notes
      • Azure Data Share n’est actuellement pas pris en charge par les zones de disponibilité
      • L’élévation de Data Share à un déploiement à haute disponibilité permettra de compenser chacun de ces risques de panne
  • Purview

    • Sélection de la référence SKU Contoso : N/A
    • Impact de la reprise d’activité
      • Défaillance du centre de données Azure : N/A
      • Défaillance de zone de disponibilité : Contoso devra valider la disponibilité et redéployer si nécessaire
      • Défaillance régionale Azure : Contoso devra déployer une instance de Microsoft Purview dans la région secondaire.
    • Notes
      • Cette activité serait atténuée par la mise en œuvre de la stratégie « Warm Spare », qui consiste à disposer d'une deuxième instance d'Azure Microsoft Purview dans la région secondaire.
      • L'approche « Warm Spare » comporte les éléments clés suivants :
        • Les comptes Azure Microsoft Purview primaire et secondaire ne peuvent pas être configurés sur les mêmes comptes Azure data factory, Azure Data Share et Azure Synapse Analytics, le cas échéant. Par conséquent, le lignage d'Azure Data Factory et d'Azure Data Share ne peut pas être vu dans les comptes Azure Microsoft Purview secondaires
        • Les durées d'exécution de l'intégration sont spécifiques à un compte Azure Microsoft Purview. Par conséquent, si les analyses doivent être exécutées en parallèle dans les comptes Azure Microsoft Purview primaire et secondaire, plusieurs runtimes d'intégration auto-hébergés doivent être maintenus.

Remarque

Cette section a pour but de fournir des conseils d’ordre général. La documentation du fournisseur sur la reprise après sinistre, la redondance et la sauvegarde doit être consultée pour connaître l'approche correcte à adopter pour un nouveau composant/service envisagé.

« Azure Datacenter Failure » couvre la situation où la région affectée n'a pas de zones de disponibilité offertes.

Si une configuration ou des mises en production nouvelles ou mises à jour ont eu lieu au moment de l’événement de sinistre, cela doit être vérifié et redéployé (si nécessaire) dans le cadre du travail de mise à jour de la plateforme à la date actuelle.

Étapes suivantes

Maintenant que vous avez découvert les détails du scénario, vous pouvez en apprendre davantage sur les recommandations liées à ce scénario