Architecture pour la récupération d’urgence d’Azure vers Azure

Cet article décrit l’architecture, les composants et les processus qui sont utilisés pour la reprise d’activité de machines virtuelles Azure à l’aide du service Azure Site Recovery. Avec la configuration de la reprise d’activité, les machines virtuelles Azure sont répliquées continuellement vers une autre région cible. Si une panne se produit, vous pouvez basculer les machines virtuelles vers la région secondaire et y accéder à partir de cette région. Si tout s’exécute à nouveau normalement, vous pouvez effectuer une restauration automatique et continuer à travailler dans l’emplacement principal.

Composants architecturaux

Les composants impliqués dans la reprise d’activité des machines virtuelles Azure sont répertoriés dans le tableau suivant.

Composant Configuration requise
Machines virtuelles dans la région source Une ou plusieurs machines virtuelles Azure dans une région source prise en charge.

Les machines virtuelles peuvent exécuter tout type de système d’exploitation pris en charge.
Stockage de machines virtuelles sources Les machines virtuelles Azure peuvent être gérées ou avoir des disques non managés répartis entre les comptes de stockage.

En savoir plus sur le stockage Azure pris en charge
Réseaux machines virtuelles sources Les machines virtuelles peuvent se trouver dans un ou plusieurs sous-réseaux d’un réseau virtuel de la région source. En savoir plus sur les exigences réseau
Compte de stockage de cache Vous avez besoin d’un compte de stockage de cache dans le réseau source. Lors de la réplication, les modifications apportées aux machines virtuelles sont stockées dans le cache avant d’être envoyées vers le stockage cible.

L’utilisation d’un cache garantit un impact minimal sur les applications de production qui sont exécutées sur une machine virtuelle.

En savoir plus sur les exigences de stockage de cache
Ressources cibles Les ressources cibles sont utilisées pendant la réplication et lors d’un basculement. Site Recovery peut configurer une ressource cible par défaut. Vous pouvez également en créer ou en personnaliser une.

Dans la région cible, vérifiez que vous pouvez créer des machines virtuelles, et que votre abonnement dispose de suffisamment de ressources pour prendre en charge les machines virtuelles qui sont nécessaires dans la région cible.

Schéma illustrant la réplication source et cible.

Ressources cibles

Lorsque vous activez la réplication pour une machine virtuelle, Site Recovery vous donne la possibilité de créer automatiquement des ressources cibles.

Ressource cible Paramètre par défaut
Abonnement cible Identique à celui de l’abonnement source.
Groupe de ressources cible Groupe de ressources auquel appartiennent les machines virtuelles après le basculement.

Il peut se trouver dans n’importe quelle région Azure, à l’exception de la région source.

Site Recovery crée un groupe de ressources dans la région cible avec un suffixe « asr ».
Réseau virtuel cible Réseau virtuel dans lequel les machines virtuelles répliquées sont situées après le basculement. Un mappage réseau est créé entre les réseaux virtuels source et cible, et inversement.

Site Recovery crée un réseau virtuel et un sous-réseau avec le suffixe « asr ».
Compte de stockage cible Si la machine virtuelle n’utilise pas de disque managé, il s’agit du compte de stockage dans lequel les données sont répliquées.

Site Recovery crée un compte de stockage dans la région cible qui reflète le compte de stockage source.
Disques managés de réplica Si la machine virtuelle utilise un disque managé, il s’agit du disque managé vers lequel les données sont répliquées.

Site Recovery crée des disques managés de réplica dans la région de stockage pour mettre en miroir la source.
Groupes à haute disponibilité cibles Groupes à haute disponibilité dans lesquels se trouvent les machines virtuelles répliquées après le basculement.

Site Recovery crée un groupe à haute disponibilité dans la région cible avec le suffixe « asr » pour les machines virtuelles qui se trouvent dans un groupe à haute disponibilité de l’emplacement source. Si un groupe à haute disponibilité existe déjà, celui-ci est utilisé et aucun nouveau groupe n’est créé.
Zones de disponibilité cibles Si la région cible prend en charge les zones de disponibilité, Site Recovery affecte le même nombre de zones que celui utilisé dans la région source.

Gestion des ressources cibles

Vous pouvez gérer les ressources cibles de la façon suivante :

  • Vous pouvez modifier les paramètres de la cible lorsque vous activez la réplication. Notez que la référence SKU par défaut pour la machine virtuelle de la région cible est la même que la référence SKU de la machine virtuelle source (ou la meilleure référence SKU suivante par rapport à la référence SKU de la machine virtuelle source). La liste déroulante affiche uniquement les références SKU pertinentes de la même famille que la machine virtuelle source (Gen 1 ou Gen 2).
  • Vous pouvez modifier les paramètres de la cible lorsque la réplication est active. Comme pour d’autres ressources comme le groupe de ressources cible, le nom cible, etc., la référence de machine virtuelle de la région cible peut également être mise à jour une fois la réplication en cours. Le type de disponibilité (instance unique, groupe ou zone) ne peut cependant pas être mis à jour. Pour modifier ce paramètre, vous devez désactiver la réplication, modifier le paramètre, puis la réactiver.

Stratégie de réplication

Par défaut, lorsque vous activez la réplication de machines virtuelles Azure, Site Recovery crée une stratégie de réplication avec les paramètres par défaut récapitulés dans le tableau.

Paramètre de stratégie Détails Par défaut
Conservation des points de récupération Spécifie la durée pendant laquelle Site Recovery conserve les points de récupération. Un jour
Fréquence des instantanés de cohérence des applications Fréquence à laquelle Site Recovery prend des instantanés de cohérence des applications. Zéro heure (désactivé)

Gestion des stratégies de réplication

Vous pouvez gérer et modifier les paramètres des stratégies de réplication par défaut de la façon suivante :

  • Vous pouvez modifier les paramètres lorsque vous activez la réplication.
  • Vous pouvez créer une stratégie de réplication à tout moment, puis l’appliquer lorsque vous activez la réplication.

Notes

Une période de rétention élevée du point de récupération peut avoir une incidence sur le coût du stockage, car d’autres points de récupération peuvent avoir à être enregistrés.

Cohérence multimachine virtuelle

Si vous souhaitez que plusieurs machines virtuelles soient répliquées en même temps et que celles-ci partagent les mêmes points de récupération de cohérence des applications et de cohérence en cas d’incident au moment du basculement, vous pouvez les rassembler dans un groupe de réplication. La cohérence multimachine virtuelle impacte les performances des charges de travail, et doit uniquement être utilisée pour les machines virtuelles qui exécutent des charges de travail nécessitant la cohérence de toutes les machines.

Captures instantanées et points de récupération

Les points de récupération sont créés à partir de captures instantanées des disques des machines virtuelles qui sont prises à un moment précis dans le temps. Lorsque vous basculez une machine virtuelle, vous utilisez un point de récupération pour restaurer la machine virtuelle à l’emplacement cible.

Lorsque nous effectuons un basculement, nous souhaitons garantir que la machine virtuelle démarre sans perte ni altération des données, et que les données soient cohérentes à la fois sur le système d’exploitation et dans les applications qui s’exécutent sur la machine virtuelle. Cela dépend du type des captures instantanées qui sont prises.

Site Recovery prend des captures instantanées de la façon suivante :

  1. Par défaut, Site Recovery prend des instantanés de cohérence en cas d’incident à partir des données ainsi que des instantanés de cohérence des applications si vous spécifiez une fréquence pour ces instantanés.
  2. Les points de récupération sont créés à partir de captures instantanées et sont stockés conformément aux paramètres de conservation de la stratégie de réplication.

Cohérence

Le tableau suivant explique les différents types de cohérence.

Cohérence en cas d’incident

Description Détails Recommandation
Un instantané de cohérence en cas d’incident capture les données qui se trouvaient sur le disque lorsque l’instantané a été pris. Il n’ajoute aucune donnée en mémoire.

Il contient l’équivalent des données qui étaient présentes sur le disque lorsque la machine virtuelle a planté ou lorsque le cordon d’alimentation a été retiré du serveur au moment où l’instantané a été pris.

La cohérence en cas d’incident ne garantit pas la cohérence des données sur le système d’exploitation ou dans les applications présentes sur la machine virtuelle.
Par défaut, Site Recovery crée des points de récupération de cohérence en cas d’incident toutes les cinq minutes. Ce paramètre ne peut pas être modifié.

Aujourd’hui, la plupart des applications peuvent récupérer correctement à partir de points de cohérence en cas d’incident.

Les points de récupération cohérents avec les incidents sont suffisants pour la réplication des systèmes d’exploitation et des applications telles que les serveurs DHCP et les serveurs d’impression.

Cohérence des applications

Description Détails Recommandation
Les points de récupération de cohérence des applications sont créés à partir d’instantanés de cohérence des applications.

Un instantané de cohérence des applications contient toutes les informations d’un instantané de cohérence en cas d’incident ainsi que toutes les données en mémoire et les transactions en cours.
Les instantanés de cohérence des applications utilisent le service de cliché instantané de volume (VSS) :

1) Azure Site Recovery utilise la méthode Sauvegarde de copie uniquement (VSS_BT_COPY), qui ne change pas l’heure et le numéro de séquence de sauvegarde du journal des transactions de Microsoft SQL

2) Quand une capture instantanée démarre, VSS effectue une opération de copie sur écriture (COW) sur le volume.

3) Avant d’effectuer l’opération de copie pour écriture, le service VSS informe chaque application de l’ordinateur qu’il a besoin de vider ses données résidant en mémoire sur le disque.

4) VSS permet ensuite à l’application de sauvegarde ou de récupération d’urgence (ici, Site Recovery) de lire les données d’instantanés et de poursuivre.
Les instantanés de cohérence des applications sont réalisés selon la fréquence que vous avez spécifiée. Cette fréquence doit toujours être inférieure à celle que vous définissez pour conserver les points de récupération. Par exemple, si vous conservez les points de récupération à l’aide du paramètre par défaut (24 heures), vous devez définir une fréquence inférieure à 24 heures.

Ces instantanés sont plus complexes et plus longs à réaliser que les instantanés de cohérence en cas d’incident.

Ils affectent les performances des applications qui s’exécutent sur les machines virtuelles où est activée la réplication.

Processus de réplication

Lorsque vous activez la réplication pour une machine virtuelle Azure, il se produit les événements suivants :

  1. L’extension du service Mobilité de Site Recovery est automatiquement installée sur la machine virtuelle.
  2. L’extension inscrit la machine virtuelle auprès de Site Recovery.
  3. Une réplication continue commence pour la machine virtuelle. Les écritures sur disque sont transférées immédiatement vers le compte de stockage de cache à l’emplacement source.
  4. Site Recovery traite les données dans le cache, puis les envoie au compte de stockage cible ou aux disques managés de réplica.
  5. Une fois les données traitées, des points de récupération de cohérence en cas d’incident sont générés toutes les cinq minutes. Les points de récupération de cohérence des applications sont générés en fonction du paramètre spécifié dans la stratégie de réplication.

Schéma illustrant le processus de réplication, étape 2.

Processus de réplication

Connectivité requise

Les machines virtuelles Azure que vous répliquez ont besoin d’une connectivité sortante. Site Recovery n’a jamais besoin de connectivité entrante à la machine virtuelle.

Connectivité sortante (URL)

Si un accès sortant aux machines virtuelles est contrôlé à l’aide d’URL, vous devez autoriser ces URL.

Nom Commercial Secteur public Description
Stockage *.blob.core.windows.net *.blob.core.usgovcloudapi.net Permet d’écrire les données dans le compte de stockage de cache dans la région source à partir de la machine virtuelle.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Fournit l’autorisation et l’authentification aux URL du service Site Recovery.
Réplication *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us Permet à la machine virtuelle de communiquer avec le service Site Recovery.
Service Bus *.servicebus.windows.net *.servicebus.usgovcloudapi.net Permet à la machine virtuelle d’écrire des données de surveillance et de diagnostic Site Recovery.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net Autorise l’accès à la réplication pour les machines virtuelles compatibles avec ADE via le portail
Azure Automation *.automation.ext.azure.com *.azure-automation.us Autorise l’activation de la mise à niveau automatique de l’agent de mobilité pour un élément répliqué par le portail

Connectivité sortante pour les plages d’adresses IP

Pour contrôler la connectivité sortante des machines virtuelles à l’aide d’adresses IP, vous devez autoriser ces adresses. Notez que les détails des exigences de connectivité réseau sont disponibles dans le livre blanc de la mise en réseau.

Règles de la région source

Règle Détails Balise du service
Autoriser le trafic HTTPS sortant : port 443 Autorise toutes les plages qui correspondent aux comptes de stockage de la région source Storage.<region-name>
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages qui correspondent à Microsoft Entra ID AzureActiveDirectory
Autoriser le trafic HTTPS sortant : port 443 Autorise les plages qui correspondent à Event Hub dans la région cible. EventHub.<nom-région>
Autoriser le trafic HTTPS sortant : port 443 Autorise les plages qui correspondent à Azure Site Recovery. AzureSiteRecovery
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages correspondant à Azure Key Vault (cela est nécessaire uniquement pour l’activation de la réplication des machines virtuelles compatibles avec ADE via le portail) AzureKeyVault
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages correspondant à Azure Automation Controller (cela est nécessaire uniquement pour l’activation de la mise à niveau automatique de l’agent de mobilité pour un élément répliqué via le portail) GuestAndHybridManagement

Règles de la région cible

Règle Détails Balise du service
Autoriser le trafic HTTPS sortant : port 443 Autorise toutes les plages qui correspondent aux comptes de stockage de la région cible Storage.<region-name>
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages qui correspondent à Microsoft Entra ID AzureActiveDirectory
Autoriser le trafic HTTPS sortant : port 443 Autorise les plages qui correspondent à Event Hub dans la région source. EventHub.<nom-région>
Autoriser le trafic HTTPS sortant : port 443 Autorise les plages qui correspondent à Azure Site Recovery. AzureSiteRecovery
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages correspondant à Azure Key Vault (cela est nécessaire uniquement pour l’activation de la réplication des machines virtuelles compatibles avec ADE via le portail) AzureKeyVault
Autoriser le trafic HTTPS sortant : port 443 Autoriser les plages correspondant à Azure Automation Controller (cela est nécessaire uniquement pour l’activation de la mise à niveau automatique de l’agent de mobilité pour un élément répliqué via le portail) GuestAndHybridManagement

Contrôler l’accès avec les règles de groupe de sécurité réseau

Si vous contrôlez la connectivité des machines virtuelles en filtrant le trafic entrant et sortant des réseaux/sous-réseaux Azure à l’aide de règles de groupe de sécurité réseau, notez les exigences suivantes :

  • Les règles de groupe de sécurité réseau de la région Azure source doivent autoriser l’accès sortant pour le trafic de réplication.
  • Nous vous recommandons de créer des règles dans un environnement de test avant de les utiliser en production.
  • Utilisez des étiquettes de service au lieu d’autoriser les adresses IP individuelles.
    • Les étiquettes de service correspondent à un groupe de préfixes d’adresses IP permettant de simplifier la création de règles de sécurité.
    • Microsoft met automatiquement à jour les étiquettes de service.

Apprenez-en plus sur la connectivité sortante pour Site Recovery et sur le contrôle de la connectivité à l’aide de groupes de sécurité réseau.

Connectivité pour la cohérence multimachine virtuelle

Si vous activez la cohérence multimachine virtuelle, les machines du groupe de réplication communiquent entre elles sur le port 20004.

  • Vérifiez qu’aucun dispositif de pare-feu ne bloque la communication interne entre les machines virtuelles sur le port 20004.
  • Si vous voulez que les machines virtuelles Linux fassent partie d’un groupe de réplication, vérifiez que le trafic sortant sur le port 20004 est ouvert manuellement conformément aux instructions de la version Linux spécifique.

Processus de basculement

Quand vous démarrez un basculement, les machines virtuelles sont créées dans le groupe de ressources cible, le réseau virtuel cible, le sous-réseau cible et dans le groupe à haute disponibilité cible. Lors d’un basculement, vous pouvez utiliser n’importe quel point de récupération.

Schéma illustrant le processus de basculement avec les environnements source et cible.

Étapes suivantes