Effectuer un exercice de reprise d’activité
- 6 minutes
Dans cette unité, vous découvrez les exercices d’urgence Site Recovery : ce que vous devez prendre en compte et comment exécuter un test pour vérifier que la configuration est correcte.
Vous pouvez utiliser des exercices de reprise d’activité pour tester la capacité de votre organisation à récupérer à la suite d’une panne, sans impact sur les services de production.
Dans l’exercice précédent, vous avez terminé la configuration d’Azure Site Recovery. Vous devez maintenant tester la réplication de votre infrastructure en exécutant une extraction de récupération d’urgence. Azure Site Recovery vous permet d’exécuter ces exercices en toute sécurité afin qu’il n’affecte pas votre environnement de production. Vous devez également exécuter des tests d’assurance qualité sur la configuration pour vous assurer que votre solution de récupération d’urgence fonctionne.
Qu’est-ce qu’un exercice de reprise d’activité ?
Un exercice de récupération d’urgence est un moyen de vérifier si vous avez correctement configuré votre solution. L’exercice devrait vous donner la certitude que vos données et services sont disponibles même en cas de sinistre. En règle générale, les organisations définissent un objectif de temps de récupération (RTO), qui indique le temps nécessaire pour récupérer l’infrastructure. Votre entreprise doit également définir un objectif de point de récupération (RPO, Recovery Point Objective), qui définit la quantité de données perdues acceptable en fonction du temps. Par exemple, si le RPO de votre entreprise est un jour, vous devez créer une sauvegarde de toutes vos données chaque jour. Vous devez également vous assurer qu’il faut moins d’un jour pour restaurer cette sauvegarde.
Pour vérifier que nous exécutons nos tests de récupération d’urgence, Site Recovery nous invite activement à les exécuter dans le tableau de bord Site Recovery.
Pourquoi devez-vous effectuer un exercice de reprise d’activité ?
Un exercice de reprise d’activité est essentiel pour garantir que la solution implémentée répond aux exigences de continuité d’activité et de reprise d’activité (BCDR) ainsi que pour vérifier que la réplication fonctionne correctement. Votre extraction de récupération d’urgence, combinée au RTO et au RPO, doit être testée minutieusement pour vous assurer que la réplication, le basculement et la récupération se produisent dans la période requise.
Par exemple, supposons que votre RTO est d’une heure et que le RPO est de six heures. Si vos systèmes sont sauvegardés toutes les heures, c’est une heure de perte de données, plus l’heure supplémentaire pour récupérer vos systèmes.
Imaginons que votre délai de récupération réel soit de cinq heures. Vos systèmes sont maintenant proches d’être obsolètes de plus de six heures, ce qui signifie que vous êtes en violation de l’objectif de RPO BCDR. Le test de la durée réelle de la récupération après des défaillances peut vous assurer que les systèmes respectent les plans de continuité de l’activité et reprise d’activité.
Test de basculement de machines individuelles
Un test de basculement vous permet de simuler un incident et de voir ses effets. Vous pouvez démarrer un test de basculement à partir du tableau de bord Site Recovery ou directement à partir du menu récupération d’urgence sur une machine virtuelle spécifique. Vous commencez par choisir un point de récupération. Vous pouvez choisir l’un des derniers points traités, le dernier point de cohérence des applications ou un point de récupération personnalisé.
Créer un test de basculement
Créez un réseau virtuel isolé pour que votre infrastructure de production ne soit pas affectée. Pour ce faire, procédez comme suit :
Ouvrez la machine virtuelle cible nommée patients-records. Un moyen simple de trouver cette machine virtuelle consiste à filtrer toutes les ressources pour afficher uniquement le type == machine virtuelle. Sélectionnez patient-records dans la liste des résultats.
Dans le menu des ressources, faites défiler jusqu’à Opérations, puis sélectionnez Reprise d’activité.
Un nouveau volet Éléments répliqués s’affiche. Sélectionnez Actualiser jusqu’à ce que l’option Protégé apparaisse dans le champ d’état. Puis, dans la barre de menus supérieure, sélectionnez Tester le basculement.
Une fois la validation réussie, sélectionnez votre réseau virtuel dans la liste déroulante Réseau virtuel Azure, puis sélectionnez le bouton Test de basculement. Cette option exécute un test de basculement de la machine virtuelle et vous permet de suivre sa progression dans la page des travaux Site Recovery en sélectionnant l’icône Notifications et le lien Démarrage de la tâche pour effectuer le test de basculement de la machine virtuelle.
Une fois l’opération terminée, la machine virtuelle basculée apparaît dans le portail sous Machines virtuelles, dans la région de récupération. Vous pouvez ensuite vérifier que la machine virtuelle est en cours d’exécution, qu’elle est dimensionnée et connectée correctement, et qu’elle met en miroir la machine virtuelle source, mais dans une autre région Azure.
Après avoir validé que tout fonctionnait comme prévu, vous pouvez supprimer la machine virtuelle répliquée en sélectionnant Nettoyage de test de basculement dans le volet Récupération d’urgence . À ce stade, nous vous recommandons d’ajouter des notes sur le résultat du test. Cochez la case en regard de Le test est terminé pour supprimer la machine virtuelle de test de basculement, puis sélectionnez OK.
Basculement flexible de plusieurs ordinateurs
Site Recovery vous donne la possibilité d’exécuter un scénario de test de récupération d’urgence complet pour toutes vos machines virtuelles. Vous pouvez créer des plans de récupération qui incluent une ou plusieurs des machines virtuelles. Les basculements sont exécutables autant de fois que nécessaire et offrent une stratégie flexible pour tester différentes combinaisons d’infrastructure.
Tout comme pour les tests des machines virtuelles individuelles, le même nettoyage de test est disponible pour tout ce qui est inclus dans le plan de récupération.
Différence entre un exercice et un basculement de production
L’exécution d’un basculement de production dans Site Recovery est semblable à celle d’un exercice de test. Il existe quelques différences, la première étant la sélection de Basculement au lieu de Test de basculement. Vous pouvez choisir d’arrêter la machine virtuelle source avant de commencer le basculement afin qu’aucune donnée ne soit perdue pendant le basculement. Site Recovery ne nettoie pas l’environnement source une fois le basculement terminé.
Quand le basculement est terminé, vérifiez que la machine virtuelle fonctionne comme prévu. Site Recovery vous permet de changer le point de récupération à ce stade. Si vous êtes satisfait du fonctionnement du basculement, vous pourrez valider le basculement. Site Recovery supprime tous les points de récupération de la machine virtuelle source et termine le basculement. Avec l’infrastructure et les données répliquées dans la région secondaire, vous devez garder à l’esprit que la nouvelle machine virtuelle dans la région secondaire a également besoin d’une protection.