Résoudre les erreurs rencontrées lors de la réplication de machines virtuelles Azure vers Azure

Attention

Cet article fait référence à CentOS, une distribution Linux proche de l’état EOL (End Of Life). Faites le point sur votre utilisation et organisez-vous en conséquence. Pour plus d’informations, consultez les Conseils sur la fin de vie CentOS.

Cet article explique comment résoudre les erreurs courantes rencontrées dans Azure Site Recovery pendant la réplication et la récupération de machines virtuelles Azure d’une région vers une autre. Pour plus d’informations sur les configurations prises en charge, consultez la matrice de prise en charge pour la réplication des machines virtuelles Azure.

Problèmes liés aux quotas de ressources Azure (code d’erreur 150097)

Vérifiez que votre abonnement est activé pour créer des machines virtuelles Azure dans la région cible que vous prévoyez d’utiliser comme région de reprise d’activité après sinistre. Vérifiez que votre abonnement dispose d’un quota suffisant pour créer des machines virtuelles des tailles nécessaires. Par défaut, Site Recovery choisit une taille de machine virtuelle cible identique à celle de la machine virtuelle source. Si la taille correspondante n’est pas disponible, Site Recovery choisit automatiquement la taille disponible la plus proche.

S’il n’existe pas de taille qui prend en charge la configuration de la machine virtuelle source, le message d’erreur suivant s’affiche :

Replication couldn't be enabled for the virtual machine <VmName>.

Causes possibles

  • Votre ID d’abonnement n’est pas activé pour créer des machines virtuelles dans l’emplacement de la région cible.
  • Votre ID d’abonnement n’est pas activé ou ne dispose pas d’un quota suffisant pour créer des tailles de machine virtuelle spécifiques dans l’emplacement de la région cible.
  • Aucune taille de machine virtuelle cible appropriée correspondant au nombre de cartes réseau de la machine virtuelle source (2) n’a été trouvée pour l’ID d’abonnement dans l’emplacement de la région cible.

Résoudre le problème

Contactez le support de facturation Azure pour activer votre abonnement et créer des machines virtuelles des tailles nécessaires dans l’emplacement cible. Retentez alors l’opération ayant échouée.

Si l’emplacement cible a une contrainte de capacité, désactivez la réplication sur cet emplacement. Activez ensuite la réplication sur un autre emplacement où votre abonnement dispose d’un quota suffisant pour créer des machines virtuelles des tailles nécessaires.

Certificats racines approuvés (code d’erreur 151066)

Si tous les certificats racines approuvés les plus récents ne sont pas présents sur la machine virtuelle, votre travail Site Recovery « Activer la réplication » peut échouer. L’authentification et l’autorisation des appels du service Site Recovery à partir de la machine virtuelle échouent sans ces certificats.

Si le travail « Activer la réplication » échoue, le message suivant s’affiche :

Site Recovery configuration failed.

Cause probable

Les certificats racines approuvés nécessaires pour l’autorisation et l’authentification ne sont pas présents sur la machine virtuelle.

Résoudre le problème

Windows

Pour une machine virtuelle exécutant le système d’exploitation Windows, installez toutes les mises à jour de Windows les plus récentes afin que tous les certificats racines approuvés soient présents sur la machine virtuelle. Suivez le processus classique de gestion des mises à jour Windows ou de gestion des mises à jour de certificats en vigueur dans votre organisation pour obtenir les certificats racines les plus récents et la liste de révocation de certificats mise à jour sur les machines virtuelles.

  • Si vous êtes dans un environnement déconnecté, suivez le processus de mise à jour de Windows standard en vigueur dans votre organisation pour obtenir les certificats.
  • Si les certificats nécessaires ne sont pas présents sur la machine virtuelle, les appels au service Site Recovery échouent pour des raisons de sécurité.

Pour vérifier que le problème est résolu, accédez à login.microsoftonline.com à partir d’un navigateur sur votre machine virtuelle.

Pour plus d’informations, consultez Configurer des racines de confiance et des certificats non autorisés.

Linux

Suivez les instructions fournies par le distributeur de votre version du système d’exploitation Linux pour obtenir les certificats racines approuvés les plus récents et la dernière liste de révocation de certificats sur la machine virtuelle.

Étant donné que SuSE Linux utilise des liens symboliques pour tenir à jour une liste de certificats, vous devez effectuer les étapes suivantes :

  1. Connectez-vous en tant qu’utilisateur racine. Le symbole dièse (#) est l’invite de commandes par défaut.

  2. Exécutez cette commande pour changer de répertoire :

    cd /etc/ssl/certs

  3. Vérifiez si le certificat d’autorité de certification racine Symantec est présent :

    ls VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem

    • Si le certificat d’autorité de certification racine Symantec est introuvable, exécutez la commande suivante pour télécharger le fichier. Vérifiez la présence d’éventuelles erreurs et suivez les actions recommandées concernant les défaillances réseau.

      wget https://docs.broadcom.com/docs-and-downloads/content/dam/symantec/docs/other-resources/verisign-class-3-public-primary-certification-authority-g5-en.pem -O VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem

  4. Vérifiez si le certificat d’autorité de certification racine Baltimore est présent :

    ls Baltimore_CyberTrust_Root.pem

    • Si le certificat d’autorité de certification racine Baltimore est introuvable, exécutez cette commande pour télécharger le certificat :

      wget https://www.digicert.com/CACerts/BaltimoreCyberTrustRoot.crt.pem -O Baltimore_CyberTrust_Root.pem

  5. Vérifiez si le certificat DigiCert_Global_Root_CA est présent :

    ls DigiCert_Global_Root_CA.pem

    • Si le certificat DigiCert_Global_Root_CA est introuvable, exécutez les commandes suivantes pour télécharger le certificat :

      wget http://www.digicert.com/CACerts/DigiCertGlobalRootCA.crt
      
      openssl x509 -in DigiCertGlobalRootCA.crt -inform der -outform pem -out DigiCert_Global_Root_CA.pem
      
  6. Exécutez le script de rehachage (rehash) afin de mettre à jour les hachages d’objets pour les certificats qui viennent d’être téléchargés :

    c_rehash

  7. Exécutez les commandes suivantes afin de vérifier si des hachages d’objets sous forme de liens symboliques ont été créés pour les certificats :

    ls -l | grep Baltimore
    
    lrwxrwxrwx 1 root root   29 Jan  8 09:48 3ad48a91.0 -> Baltimore_CyberTrust_Root.pem
    
    -rw-r--r-- 1 root root 1303 Jun  5  2014 Baltimore_CyberTrust_Root.pem
    
    ls -l | grep VeriSign_Class_3_Public_Primary_Certification_Authority_G5
    
    -rw-r--r-- 1 root root 1774 Jun  5  2014 VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem
    
    lrwxrwxrwx 1 root root   62 Jan  8 09:48 facacbc6.0 -> VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem
    
    ls -l | grep DigiCert_Global_Root
    
    lrwxrwxrwx 1 root root   27 Jan  8 09:48 399e7759.0 -> DigiCert_Global_Root_CA.pem
    
    -rw-r--r-- 1 root root 1380 Jun  5  2014 DigiCert_Global_Root_CA.pem
    
  8. Créez une copie du fichier VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem et donnez-lui le nom b204d74a.0 :

    cp VeriSign_Class_3_Public_Primary_Certification_Authority_G5.pem b204d74a.0

  9. Créez une copie du fichier Baltimore_CyberTrust_Root.pem et donnez-lui le nom 653b494a.0 :

    cp Baltimore_CyberTrust_Root.pem 653b494a.0

  10. Créez une copie du fichier DigiCert_Global_Root_CA.pem et donnez-lui le nom 3513523f.0 :

    cp DigiCert_Global_Root_CA.pem 3513523f.0

  11. Vérifiez que les fichiers sont présents :

    ls -l 653b494a.0 b204d74a.0 3513523f.0
    
    -rw-r--r-- 1 root root 1774 Jan  8 09:52 3513523f.0
    
    -rw-r--r-- 1 root root 1303 Jan  8 09:52 653b494a.0
    
    -rw-r--r-- 1 root root 1774 Jan  8 09:52 b204d74a.0
    

URL ou plages d'adresses IP sortantes (code d'erreur 151037 ou 151072)

Pour que la réplication Site Recovery fonctionne, une connectivité sortante vers des URL spécifiques est nécessaire à partir de la machine virtuelle. Si votre machine virtuelle se trouve derrière un pare-feu ou utilise des règles de groupe de sécurité réseau pour contrôler la connectivité sortante, vous pouvez rencontrer l’un des problèmes ci-après. Même si nous continuons de prendre en charge l’accès sortant via des URL, l’utilisation d’une liste verte de plages d’adresses IP n’est plus prise en charge.

Causes possibles

  • Il est impossible d’établir une connexion aux points de terminaison Site Recovery en raison d’un échec de la résolution DNS.
  • Ce problème survient le plus souvent pendant la reprotection, quand vous avez procédé au basculement de la machine virtuelle mais que le serveur DNS n’est pas accessible à partir de la région de reprise d’activité après sinistre.

Résoudre le problème

Si vous utilisez DNS personnalisé, assurez-vous que le serveur DNS est accessible à partir de la région de récupération d’urgence.

Pour vérifier si la machine virtuelle utilise un paramètre DNS personnalisé :

  1. Ouvrez Machines virtuelles et sélectionnez la machine virtuelle.
  2. Accédez aux Paramètres de la machine virtuelle et sélectionnez Réseau.
  3. Dans Réseau/sous-réseau virtuel, sélectionnez le lien pour ouvrir la page des ressources du réseau virtuel.
  4. Accédez à Paramètres et sélectionnez Serveurs DNS.

Essayez d’accéder au serveur DNS à partir de la machine virtuelle. Si le serveur DNS n’est pas accessible, rendez-le accessible en faisant basculer le serveur DNS ou en créant la ligne de site entre le réseau de récupération d’urgence et le DNS.

Notes

Si vous utilisez des points de terminaison privés, vérifiez que les machines virtuelles peuvent résoudre les enregistrements DNS privés.

com-error.

Problème2 : Échec de la configuration de Site Recovery (151196)

Cause probable

Impossible d'établir une connexion avec les points de terminaison IP4 d'identité et d'authentification Microsoft 365.

Résoudre le problème

Azure Site Recovery exigeait l'accès aux plages d'adresses IP Microsoft 365 pour l'authentification. Si vous utilisez un proxy de règles/pare-feu de groupe de sécurité réseau Azure pour contrôler la connectivité réseau sortante sur la machine virtuelle, assurez-vous d’utiliser une règle de groupe de sécurité réseau basée sur les balises de service Microsoft Entra pour autoriser l’accès à Microsoft Entra ID. Nous ne prenons plus en charge les règles de groupe de sécurité réseau basées sur les adresses IP.

Problème 3 : Échec de la configuration de Site Recovery (151197)

Cause probable

Il est impossible d’établir une connexion aux points de terminaison de service Azure Site Recovery.

Résoudre le problème

Si vous utilisez un proxy de règles/pare-feu de groupe de sécurité réseau Azure pour contrôler la connectivité réseau sortante sur la machine virtuelle, assurez-vous d’utiliser les balises de service. Nous ne prenons plus en charge l’utilisation d’une liste verte d’adresses IP via les groupes de sécurité réseau pour Azure Site Recovery.

Problème 4 : La réplication échoue lorsque le trafic réseau utilise un serveur proxy local (151072)

Cause probable

Les paramètres de proxy personnalisés sont incorrects, et l’agent Mobility Service n’a pas détecté automatiquement les paramètres de proxy d’Internet Explorer (IE).

Résoudre le problème

  1. L’agent du service Mobilité détecte les paramètres de proxy à partir d’Internet Explorer sur Windows et à l’emplacement /etc/environment sur Linux.

  2. Si vous préférez définir un proxy uniquement pour le service Mobility, vous pouvez fournir les détails du proxy dans le fichier ProxyInfo.conf situé aux emplacements suivants :

    • Linux : /usr/local/InMage/config/
    • Windows : C:\ProgramData\Microsoft Azure Site Recovery\Config
  3. Le fichier ProxyInfo.conf doit inclure les paramètres de proxy au format INI suivant.

    [proxy]
    Address=http://1.2.3.4
    Port=567
    

Notes

L’agent du service Mobility ne prend en charge que les proxys non authentifiés.

Informations complémentaires

Pour spécifier les URL nécessaires ou les plages d’adresses IP nécessaires, suivez les instructions mentionnées dans Mise en réseau dans la réplication Azure vers Azure.

Disque introuvable sur la machine virtuelle (code d'erreur 150039)

Un nouveau disque attaché à la machine virtuelle doit être initialisé. Si le disque est introuvable, le message suivant s’affiche :

Azure data disk <DiskName> <DiskURI> with logical unit number <LUN> <LUNValue> was not mapped to a corresponding disk being reported from within the VM that has the same LUN value.

Causes possibles

  • Un nouveau disque de données a été attaché à la machine virtuelle, mais n’a pas été initialisé.
  • Le disque de données à l’intérieur de la machine virtuelle ne signale pas correctement la valeur de numéro d’unité logique (LUN) à laquelle le disque a été attaché à la machine virtuelle.

Résoudre le problème

Vérifiez que les disques de données sont initialisés, puis retentez l’opération.

Si le problème persiste, contactez le support technique.

Plusieurs disques disponibles pour la protection (code d'erreur 153039)

Causes possibles

  • Un ou plusieurs disques ont récemment été ajoutés à la machine virtuelle après la protection.
  • Un ou plusieurs disques ont été initialisés après la protection de la machine virtuelle.

Résoudre le problème

Pour rétablir l’intégrité de l’état de réplication à la machine virtuelle, vous pouvez choisir de protéger les disques ou d’ignorer l’avertissement.

Pour protéger les disques

  1. Accédez à Éléments répliqués>Nom de la machine virtuelle>Disques.

  2. Sélectionnez le disque non protégé, puis sélectionnez Activer la réplication :

    Activez la réplication sur des disques de machine virtuelle.

Pour ignorer l’avertissement

  1. Accédez à Éléments répliqués>Nom de la machine virtuelle.

  2. Sélectionnez l’avertissement dans la section Vue d’ensemble, puis sélectionnez OK.

    Ignorez l’avertissement relatif au nouveau disque.

Suppression de la machine virtuelle du coffre terminée avec des informations (code d'erreur 150225)

Quand il protège la machine virtuelle, Site Recovery crée des liens sur la machine virtuelle source. Quand vous supprimez la protection ou que vous désactivez la réplication, Site Recovery supprime ces liens dans le cadre du travail de nettoyage. Si la machine virtuelle dispose d’un verrou de ressource, le travail de nettoyage est terminé avec les informations. Ces informations indiquent que la machine virtuelle a été supprimée du coffre Recovery Services, mais que certains des liens obsolètes n’ont pas pu être nettoyés sur la machine source.

Vous pouvez ignorer cet avertissement si vous n’envisagez pas de protéger à nouveau cette machine virtuelle. Cependant, si vous devez protéger cette machine virtuelle plus tard, suivez les étapes mentionnées dans cette section pour nettoyer les liens.

Avertissement

Si vous ne faites pas le nettoyage :

  • Quand vous activerez la réplication au moyen du coffre Recovery Services, la machine virtuelle ne sera pas listée.
  • Si vous essayez de protéger la machine virtuelle en utilisant Machine virtuelle>Paramètres>Reprise d’activité, l’opération échouera avec le message Impossible d’activer la réplication en raison de liens de ressource périmés existants sur la machine virtuelle.

Résoudre le problème

Notes

Site Recovery ne supprime pas la machine virtuelle source ou n’a aucun impact sur elle pendant que vous exécutez ces étapes.

  1. Supprimez le verrou de la machine virtuelle ou du groupe de ressources. Par exemple, dans l’image suivante, le verrou de ressource sur la machine virtuelle nommée MoveDemo doit être supprimé :

    Supprimez un verrou d’une machine virtuelle.

  2. Téléchargez le script pour retirer une configuration Site Recovery obsolète.

  3. Exécutez le script, Cleanup-stale-asr-config-Azure-VM.ps1. Indiquez l’ID d’abonnement, le groupe de ressources de la machine virtuelle et le nom de la machine virtuelle en tant que paramètres.

  4. Si vous êtes invité à fournir des informations d’identification Azure, indiquez-les. Vérifiez ensuite que le script s’exécute sans échec.

Réplication non activée sur la machine virtuelle avec ressources périmées (code d'erreur 150226)

Causes possibles

La configuration de la machine virtuelle est obsolète par rapport à la protection Site Recovery précédente.

Une configuration obsolète peut se produire sur une machine virtuelle Azure si vous avez activé la réplication pour la machine virtuelle Azure en utilisant Site Recovery, puis que :

  • Vous avez désactivé la réplication, mais la machine virtuelle source comportait un verrou de ressource.
  • Vous avez supprimé le coffre Site Recovery sans désactiver explicitement la réplication sur la machine virtuelle.
  • Vous avez supprimé le groupe de ressources contenant le coffre Site Recovery sans désactiver explicitement la réplication sur la machine virtuelle.

Résoudre le problème

Notes

Site Recovery ne supprime pas la machine virtuelle source ou n’a aucun impact sur elle pendant que vous exécutez ces étapes.

  1. Supprimez le verrou de la machine virtuelle ou du groupe de ressources. Par exemple, dans l’image suivante, le verrou de ressource sur la machine virtuelle nommée MoveDemo doit être supprimé :

    Supprimez un verrou d’une machine virtuelle.

  2. Téléchargez le script pour retirer une configuration Site Recovery obsolète.

  3. Exécutez le script, Cleanup-stale-asr-config-Azure-VM.ps1. Indiquez l’ID d’abonnement, le groupe de ressources de la machine virtuelle et le nom de la machine virtuelle en tant que paramètres.

  4. Si vous êtes invité à fournir des informations d’identification Azure, indiquez-les. Vérifiez ensuite que le script s’exécute sans échec.

Impossible de sélectionner la machine virtuelle ou le groupe de ressources dans le travail d'activation de la réplication

Problème 1 : Le groupe de ressources et la machine virtuelle source se trouvent à des emplacements différents

Site Recovery exige actuellement que le groupe de ressources et les machines virtuelles de la région source se trouvent dans le même emplacement. Si ce n’est pas le cas, vous ne pourrez pas trouver la machine virtuelle ou le groupe de ressources quand vous essaierez d’appliquer la protection.

Comme solution de contournement, vous pouvez activer la réplication à partir de la machine virtuelle plutôt qu’à partir du coffre Recovery Services. Accédez à Machine virtuelle source>Propriétés>Reprise d’activité, puis activez la réplication.

Problème2 : Le groupe de ressources ne fait pas partie de l’abonnement sélectionné

Il se peut que vous ne puissiez pas trouver le groupe de ressources au moment de la protection s’il ne fait pas partie de l’abonnement sélectionné. Vérifiez que le groupe de ressources appartient à l’abonnement que vous utilisez.

Problème 3 : Configuration obsolète

Il est possible que la machine virtuelle que vous voulez activer pour la réplication ne s’affiche pas si une configuration Site Recovery obsolète existe sur la machine virtuelle Azure. Cette condition peut se produire si vous avez activé la réplication pour la machine virtuelle Azure en utilisant Site Recovery, puis que :

  • Vous avez supprimé le coffre Site Recovery sans désactiver explicitement la réplication sur la machine virtuelle.
  • Vous avez supprimé le groupe de ressources contenant le coffre Site Recovery sans désactiver explicitement la réplication sur la machine virtuelle.
  • Vous avez désactivé la réplication, mais la machine virtuelle source comportait un verrou de ressource.

Résoudre le problème

Notes

Veillez à mettre à jour le module AzureRM.Resources avant d’utiliser le script mentionné dans cette section. Site Recovery ne supprime pas la machine virtuelle source ou n’a aucun impact sur elle pendant que vous exécutez ces étapes.

  1. Supprimez le verrou, le cas échéant, de la machine virtuelle ou du groupe de ressources. Par exemple, dans l’image suivante, le verrou de ressource sur la machine virtuelle nommée MoveDemo doit être supprimé :

    Supprimez un verrou d’une machine virtuelle.

  2. Téléchargez le script pour retirer une configuration Site Recovery obsolète.

  3. Exécutez le script, Cleanup-stale-asr-config-Azure-VM.ps1. Indiquez l’ID d’abonnement, le groupe de ressources de la machine virtuelle et le nom de la machine virtuelle en tant que paramètres.

  4. Si vous êtes invité à fournir des informations d’identification Azure, indiquez-les. Vérifiez ensuite que le script s’exécute sans échec.

Impossible de sélectionner une machine virtuelle pour la protection

Cause probable

La machine virtuelle a une extension installée dans un état d’échec ou sans réponse

Résoudre le problème

Accédez à Machines virtuelles>Paramètres>Extensions, puis recherchez les éventuelles extensions en état d’échec. Désinstallez toute extension en état d’échec, puis réessayez de protéger la machine virtuelle.

L'état d'approvisionnement de la machine virtuelle n'est pas valide (code d'erreur 150019)

Pour activer la réplication sur la machine virtuelle, son état de provisionnement doit être Réussi. Pour vérifier l’état du provisionnement, effectuez les étapes suivantes :

  1. Dans le portail Azure, sélectionnez l’Explorateur de ressources sous Tous les services.
  2. Développez la liste Abonnements et sélectionnez votre abonnement.
  3. Développez la liste Groupes de ressources et sélectionnez le groupe de ressources de la machine virtuelle.
  4. Développez la liste Ressources, puis sélectionnez votre machine virtuelle.
  5. Vérifiez le champ provisioningState dans la vue Instance sur le côté droit.

Résoudre le problème

  • Si provisioningState a la valeur Échec, contactez le support avec les détails pour résoudre les problèmes.
  • Si provisioningState a la valeur Mise à jour, une autre extension est peut-être en cours de déploiement. Vérifiez si des opérations sont en cours sur la machine virtuelle, attendez qu’elles se terminent, puis réessayez la tâche Site Recovery pour activer la réplication ayant échoué.

Impossible de sélectionner la machine virtuelle cible

Problème 1 : La machine virtuelle est jointe à un réseau qui est déjà mappé à un réseau cible

Lors de la configuration de la récupération d'urgence, si la machine virtuelle source fait partie d'un réseau virtuel et qu'une autre machine virtuelle du même réseau virtuel est déjà mappée à un réseau dans le groupe de ressources cible, la zone de liste déroulante de sélection du réseau est indisponible (grisée) par défaut.

Liste de sélection du réseau non disponible.

Problème2 : Vous avez précédemment protégé la machine virtuelle, puis désactivé la réplication

La désactivation de la réplication d’une machine virtuelle ne supprime pas le mappage réseau. Le mappage doit être supprimé du coffre Recovery Services dans lequel la machine virtuelle a été protégée. Sélectionnez le coffre Recovery Services et accédez à Gérer>Infrastructure Site Recovery>Pour les machines virtuelles Azure>Mappage réseau.

Supprimez un mappage réseau.

Le réseau cible qui a été défini lors de la configuration de la récupération d'urgence peut être modifié après la configuration initiale, une fois la machine virtuelle protégée. Pour modifier le mappage réseau, sélectionnez le nom du réseau :

Modifiez un mappage réseau.

COM+ ou VSS (code d'erreur 151025)

Lorsque l'erreur COM+ ou VSS (Volume Shadow Copy Service) se produit, le message suivant s'affiche :

Site Recovery extension failed to install.

Causes possibles

  • Le service Application système COM+ est désactivé.
  • Le service Cliché instantané de volume est désactivé.

Résoudre le problème

Définissez les services Application système COM+ et Cliché instantané de volume en mode de démarrage manuel ou automatique.

  1. Ouvrez la console Services dans Windows.

  2. Vérifiez que les services Application système COM+ et Cliché instantané de volume ne sont pas définis sur Désactivé pour leur Type de démarrage.

    Vérifiez le type de démarrage des services Application système COM+ et Cliché instantané de volume.

Taille de disque managé non prise en charge (code d’erreur 150172)

Quand cette erreur se produit, le message suivant s’affiche :

Protection couldn't be enabled for the virtual machine as it has <DiskName> with size <DiskSize> that is lesser than the minimum supported size 1024 MB.

Cause probable

La taille du disque est inférieure à la taille de 1 024 Mo prise en charge.

Résoudre le problème

Vérifiez que la taille de disque est dans la plage des tailles prises en charge, puis retentez l’opération.

Protection non activée lorsque GRUB utilise le nom de l'appareil (code d'erreur 151126)

Causes possibles

Les fichiers de configuration GRUB Linux ( /boot/grub/menu.lst, /boot/grub/grub.cfg, /boot/grub2/grub.cfg ou /etc/default/grub) peuvent spécifier le nom réel des appareils au lieu des valeurs UUID pour les paramètres root et resume. Site Recovery exige les UUID car les noms d’appareils peuvent changer. Au redémarrage, une machine virtuelle peut ne pas trouver le même nom lors du basculement, ce qui entraîne des problèmes.

Les exemples suivants sont des lignes de fichiers GRUB où les noms d’appareils apparaissent à la place des UUID nécessaires :

  • Fichier /boot/grub2/grub.cfg:

    linux /boot/vmlinuz-3.12.49-11-default root=/dev/sda2 ${extra_cmdline} resume=/dev/sda1 splash=silent quiet showopts

  • Fichier : /boot/grub/menu.lst

    kernel /boot/vmlinuz-3.0.101-63-default root=/dev/sda2 resume=/dev/sda1 splash=silent crashkernel=256M-:128M showopts vga=0x314

Résoudre le problème

Remplacez chaque nom de l’appareil par l’UUID correspondant :

  1. Recherchez l'UUID de l'appareil en exécutant la commande blkid <device name>. Par exemple :

    blkid /dev/sda1
    /dev/sda1: UUID="6f614b44-433b-431b-9ca1-4dd2f6f74f6b" TYPE="swap"
    blkid /dev/sda2
    /dev/sda2: UUID="62927e85-f7ba-40bc-9993-cc1feeb191e4" TYPE="ext3"
    
  2. Remplacez le nom de l’appareil par son UUID dans les formats root=UUID=<UUID> et resume=UUID=<UUID> . Par exemple, après le remplacement, la ligne de /boot/grub/menu.lst ressemble à celle-ci :

    kernel /boot/vmlinuz-3.0.101-63-default root=UUID=62927e85-f7ba-40bc-9993-cc1feeb191e4 resume=UUID=6f614b44-433b-431b-9ca1-4dd2f6f74f6b splash=silent crashkernel=256M-:128M showopts vga=0x314

  3. Réessayez la protection.

La protection a échoué parce que l'appareil GRUB n'existe pas (code d'erreur 151124)

Cause probable

Les fichiers de configuration GRUB ( /boot/grub/menu.lst, /boot/grub/grub.cfg, /boot/grub2/grub.cfg ou /etc/default/grub) peuvent contenir les paramètres rd.lvm.lv ou rd_LVM_LV. Ces paramètres identifient les appareils LVM (Logical Volume Manager) qui doivent être découverts au démarrage. Si ces appareils LVM n’existent pas, le système protégé proprement dit ne démarrera pas et sera bloqué lors du processus de démarrage. Le même problème sera également observé avec la machine virtuelle de basculement. Voici quelques exemples :

  • Fichier : /boot/grub2/grub.cfg sur RHEL7 :

    linux16 /vmlinuz-3.10.0-957.el7.x86_64 root=/dev/mapper/rhel_mup--rhel7u6-root ro crashkernel=128M\@64M rd.lvm.lv=rootvg/root rd.lvm.lv=rootvg/swap rhgb quiet LANG=en_US.UTF-8

  • Fichier : /etc/default/grub sur RHEL7 :

    GRUB_CMDLINE_LINUX="crashkernel=auto rd.lvm.lv=rootvg/root rd.lvm.lv=rootvg/swap rhgb quiet

  • Fichier : /boot/grub/menu.lst sur RHEL6 :

    kernel /vmlinuz-2.6.32-754.el6.x86_64 ro root=UUID=36dd8b45-e90d-40d6-81ac-ad0d0725d69e rd_NO_LUKS LANG=en_US.UTF-8 rd_NO_MD SYSFONT=latarcyrheb-sun16 crashkernel=auto rd_LVM_LV=rootvg/lv_root KEYBOARDTYPE=pc KEYTABLE=us rd_LVM_LV=rootvg/lv_swap rd_NO_DM rhgb quiet

Dans chaque exemple, GRUB doit détecter deux appareils LVM avec les noms root et swap à partir du groupe de volumes rootvg.

Résoudre le problème

Si l’appareil LVM n’existe pas, créez-le ou supprimez les paramètres correspondants des fichiers de configuration GRUB. Ensuite, réessayez d’activer la protection.

La mise à jour du service Mobility s'est terminée avec des avertissements (code d'erreur 151083)

Mobility Service de Site Recovery comprend de nombreux composants, notamment le pilote de filtre. Le pilote de filtre n’est chargé dans la mémoire système que pendant le redémarrage du système. Chaque fois qu’une mise à jour de Mobility Service comprend des changements de pilote de filtre, l’ordinateur est mis à jour, mais un avertissement s’affiche pour vous avertir que certains correctifs nécessitent un redémarrage. Cet avertissement s’affiche car les correctifs du pilote de filtre ne peuvent prendre effet que lorsque le nouveau pilote de filtre est chargé, ce qui se produit uniquement lors d’un redémarrage.

Notes

Il s’agit simplement d’un avertissement. La réplication existante continue à fonctionner même après la nouvelle mise à jour de l’agent. Vous pouvez choisir d’effectuer un redémarrage chaque fois que vous souhaitez profiter du nouveau pilote de filtre, mais en l’absence de redémarrage, l’ancien pilote de filtre continue de fonctionner.

Hormis le pilote de filtre, les autres améliorations et correctifs de Mobility Service prennent effet sans nécessiter un redémarrage.

Protection non activée si le disque managé de réplica existe

Cette erreur se produit lorsque le disque managé de réplica existe déjà, sans les balises attendues, dans le groupe de ressources cible.

Cause probable

Ce problème peut se produire si la machine virtuelle a été précédemment protégée et qu’au moment de la désactivation de la réplication, le disque de réplica n’avait pas été retiré.

Résoudre le problème

Supprimez le disque de réplica identifié dans le message d’erreur, puis retentez la tâche de protection qui a échoué.

L’activation de la protection a échoué, car le programme d’installation ne parvient pas à trouver le disque racine (code d’erreur 151137)

Cette erreur se produit pour les machines Linux dont le disque du système d’exploitation est chiffré à l’aide d’Azure Disk Encryption (ADE). Il s’agit d’un problème valide uniquement dans la version 9.35 de l’agent.

Causes possibles

Le programme d’installation ne parvient pas à trouver le disque racine qui héberge le système de fichiers racine.

Résoudre le problème

Pour corriger ce problème, effectuez les étapes suivantes.

  1. Recherchez les bits de l’agent sous le répertoire /var/lib/waagent sur les machines RHEL et CentOS à l’aide de la commande ci-dessous :

    # find /var/lib/ -name Micro\*.gz

    Sortie attendue :

    /var/lib/waagent/Microsoft.Azure.RecoveryServices.SiteRecovery.LinuxRHEL7-1.0.0.9139/UnifiedAgent/Microsoft-ASR_UA_9.35.0.0_RHEL7-64_GA_30Jun2020_release.tar.gz

  2. Créez un répertoire, et remplacez le répertoire actuel par ce nouveau répertoire.

  3. Extrayez le fichier de l’agent trouvé à la première étape à l’aide de la commande ci-dessous :

    tar -xf <Tar Ball File>

  4. Ouvrez le fichier prereq_check_installer.json et supprimez les lignes suivantes. Enregistrez ensuite le fichier.

       {
          "CheckName": "SystemDiskAvailable",
          "CheckType": "MobilityService"
       },
    
  5. Appelez le programme d’installation à l’aide de la commande suivante :

    ./install -d /usr/local/ASR -r MS -q -v Azure

  6. Si le programme d’installation s’exécute correctement, relancez la tâche d’activation de la réplication.

Gérer les changements d’heure sur les serveurs répliqués et résoudre les problèmes associés

Cette erreur se produit lorsque l’heure de la machine source est avancée, puis retourne rapidement à l’heure réelle. Vous ne remarquerez peut-être pas le changement car l’heure est corrigée très rapidement.

Correction : Pour résoudre ce problème, attendez que l’heure système croise l’heure future décalée. Une autre option consiste à désactiver et à réactiver la réplication, ce qui n’est possible que pour la réplication vers l’avant (données répliquées d’une région primaire vers une région secondaire) et pas pour la réplication inversée (données répliquées d’une région secondaire vers une région primaire).

Étapes suivantes

Répliquer des machines virtuelles Azure dans une autre région Azure.