Sauvegarde et récupération d’urgence de disques managés Azure

2024-10-15

S’applique à : ✔️ Machines virtuelles Linux ✔️ Machines virtuelles Windows ✔️ Ensembles à échelle flexible

Cet article explique comment planifier la sauvegarde et la récupération d’urgence de disques managés Azure. Il introduit la redondance intégrée Azure et certains types d’échecs courants. Après cela, il couvre les scénarios de sauvegarde et de récupération d’urgence classiques. Enfin, il compare chaque option de sauvegarde et de récupération d’urgence pour les disques managés Azure.

Options de redondance intégrées Azure

Les disques managés Azure disposent de deux options de redondance intégrées pour protéger vos données contre les défaillances :

Le stockage localement redondant (LRS) réplique vos données trois fois au sein d’un même centre de données dans une région particulière. LRS protège vos données contre les défaillances de racks de serveur et de lecteurs.
Le stockage redondant interzone (ZRS) fournit une réplication synchrone des données entre les zones d’une région, ce qui permet aux disques de tolérer les défaillances zonales qui peuvent se produire en raison de catastrophes naturelles ou de problèmes matériels.

Toutefois, les sinistres majeurs (tels que les tremblements de terre, les incendies ou les ouragans) peuvent entraîner des pannes ou une inaccessibilité des serveurs de stockage à grande échelle, impactant parfois l’ensemble d’un centre de données ou d’une zone (impact sur les disques LRS) ou une région entière (impact sur les disques ZRS). En plus des défaillances de plateforme, des problèmes liés à une application ou à des données peuvent également se produire (par exemple, des suppressions accidentelles et des attaques par ransomware). Lorsque cela se produit, vous pouvez restaurer l’application et les données à une version antérieure contenant le dernier état correct connu. Le retour à un bon état nécessite des sauvegardes régulières.

Pour protéger vos charges de travail IaaS contre les pannes, planifiez la redondance et créez des sauvegardes régulières. Pour protéger les charges de travail IaaS contre les sinistres régionaux, créez des sauvegardes dans un emplacement géographique différent de celui de votre site principal. Cela garantit que vos sauvegardes ne sont pas affectées par les mêmes événements que ceux qui ont affecté vos autres ressources. Pour plus d’informations, consultez Récupération d’urgence pour les applications Azure.

Scénarios de sauvegarde et de récupération d’urgence

Examinons quelques exemples de scénarios de charge de travail d’application et les éléments à prendre en compte lors de la planification de la sauvegarde et de la récupération d’urgence.

Scénario 1 : solutions de base de données majeures

Dans ce scénario, vous disposez d’un serveur de base de données de production (tel que SQL Server et Oracle) qui prend en charge la haute disponibilité. Les utilisateurs et les applications de production critiques dépendent de cette base de données. Le plan de reprise après sinistre pour ce système doit comprendre les exigences suivantes :

Les données doivent être protégées et récupérables.
Le serveur doit être disponible pour utilisation.
(Facultatif) Une réplica de la base de données dans une autre région en tant que sauvegarde

En fonction de vos exigences en matière de disponibilité des serveurs et de récupération des données, les solutions peuvent aller d'un site réplique actif-actif ou actif-passif à des sauvegardes hors ligne périodiques des données. Les bases de données relationnelles, telles que SQL Server et Oracle, fournissent diverses options pour la réplication. Pour SQL Server, utilisez les groupes de disponibilité SQL Server Always On pour la haute disponibilité.

Les bases de données NoSQL comme MongoDB prennent également en charge les réplicas pour assurer la redondance. Les réplicas pour la haute disponibilité sont utilisés.

Scénario 2 : un cluster de machines virtuelles redondantes

Dans ce scénario, vous avez une charge de travail gérée par un cluster de machines virtuelles qui assurent la redondance et l’équilibrage de charge, comme un cluster Cassandra déployé dans une région. Ce type d’architecture fournit déjà un niveau élevé de redondance dans cette région. Toutefois, pour protéger la charge de travail contre une défaillance au niveau régional, envisagez de répartir le cluster entre deux régions ou d’effectuer des sauvegardes périodiques vers une autre région.

Scénario 3 : charge de travail d’application IaaS

Dans ce scénario, vous avez une application avec une charge de travail de production classique s’exécutant sur une machine virtuelle Azure (charge de travail d’application IaaS). Il peut s’agir d’un serveur web ou d’un serveur de fichiers contenant du contenu et d’autres ressources d’un site, ou d’une application métier personnalisée s’exécutant sur une machine virtuelle qui stockait ses données, ses ressources et son état d’application sur les disques de la machine virtuelle. Dans ce cas, il est important de veiller à effectuer des sauvegardes régulièrement. La fréquence des sauvegardes doit être basée sur la nature de la charge de travail de machine virtuelle. Par exemple, si l’application s’exécute quotidiennement et modifie des données, la sauvegarde doit être effectuée toutes les heures.

Un autre scénario courant concerne un serveur de rapports qui extrait des données d'autres sources et génère des rapports agrégés. La perte de cette machine virtuelle ou des disques peut entraîner la perte des rapports. Toutefois, il est possible de régénérer la sortie en réexécutant le processus de création de rapports. Dans ce cas, vous ne subissez pas vraiment de perte de données, même si le serveur de reporting est touché par un sinistre. Vous pouvez donc avoir un niveau plus élevé de tolérance en cas de perte d’une partie des données sur le serveur de rapports. Dans ce cas, le fait d’effectuer des sauvegardes moins souvent réduirait vos coûts.

Scénario 4 : problèmes liés aux données d’une application IaaS

Des problèmes peuvent également affecter les données d’une application IaaS. Par exemple, vous avez une application qui calcule, tient à jour et gère des données commerciales critiques telles que des informations de tarification. Une nouvelle version de votre application a rencontré un bogue logiciel qui a incorrectement calculé la tarification et a endommagé les données commerciales actuelles prises en charge par la plateforme. Ici, le meilleur plan d’action consiste à rétablir la version antérieure de l’application et des données. Pour ce faire, effectuez des sauvegardes périodiques de votre système.

Solutions de sauvegarde et de reprise après sinistre

Vue d’ensemble de la comparaison

Cette section couvre certaines options Azure pour la sauvegarde et la reprise d’activité. Vous pouvez vous reporter au tableau de comparaison suivant pour obtenir une vue d’ensemble générale.

Solution	Instantané	Points de restauration	Sauvegarde Azure	Azure Site Recovery (Récupération de site Azure)
Description	L’instantané est une copie du disque à un instant dans le passé et en lecture seule que vous pouvez utiliser pour la sauvegarde.	Les points de restauration peuvent être utilisés pour implémenter une sauvegarde granulaire de tous les disques attachés à votre machine virtuelle	Sauvegarde Azure est un service Azure entièrement managé pour fournir une solution simple, sécurisée et économique pour sauvegarder vos données et les récupérer	Azure Site Recovery permet d'assurer la continuité des activités de votre entreprise en maintenant les applications et les charges de travail en fonctionnement pendant les pannes
Sauvegarde incrémentielle	Oui	Oui	Oui	Oui
Copie interrégionale	Oui	Disponible en préversion publique	Oui, avec la sauvegarde de machine virtuelle Azure	Oui
Tarification	Consultez Tarification des disques Azure	N/A	Voir Estimer les coûts de sauvegarde des machines virtuelles Azure ou des serveurs locaux	Consultez Tarification Azure Site Recovery
Maintenance opérationnelle	Élevé	Moyen	Faible	Faible
Principaux avantages	Plus économique, adapté à la sauvegarde sur disque	Sauvegarder des disques au niveau de la machine virtuelle, Cohérence des applications pour les machines virtuelles exécutant le système d’exploitation Windows, Cohérence du système de fichiers pour les machines virtuelles exécutant le système d’exploitation Linux	Sauvegarde fréquente et rapide sans interruption de la machine virtuelle, stratégie de sauvegarde personnalisée, solution sans agent	Solution BCDR simple, maintenir la cohérence des applications lors du basculement, orchestrer la réplication sans interférer avec les données applicatives.

Instantanés

Un instantané est une copie en lecture seule du disque à un moment précis. Vous pouvez prendre un instantané à tout moment. Ces captures instantanées existent indépendamment du disque source et peuvent uniquement être utilisées pour créer des disques managés par la suite. Vous ne pouvez pas les utiliser pour modifier l’état d’un disque existant. Vous pouvez également utiliser des instantanés incrémentiels pour la sauvegarde incrémentielle périodique de vos disques managés.

En règle générale, vous devez utiliser des instantanés incrémentiels à des fins de sauvegarde et de récupération d’urgence, car ils réduisent vos coûts et offrent un temps de récupération plus rapide. Les instantanés incrémentiels sont des sauvegardes à un instant dans le passé des disques managés et contenant uniquement les modifications apportées depuis la dernière capture instantanée. Le premier instantané incrémentiel est une copie complète du disque. Les instantanés incrémentiels après le premier se composent uniquement des modifications apportées à un disque depuis la dernière instantané. Quand vous créez un disque à partir d’une capture instantanée, le système reconstruit le disque complet qui représente la sauvegarde du disque à un instant dans le passé, au moment où la capture instantanée incrémentielle a été effectuée. Vous pouvez également copier une instantané incrémentielle dans une nouvelle région pour la récupération d’urgence.

Vous pouvez implémenter des mécanismes de sauvegarde via des instantanés. Pour ce faire, vous devez créer des instantanés cohérents pour tous les disques utilisés par une VM, puis les répliquer dans une autre région. Une option pour créer des sauvegardes cohérentes avec des instantanés est d'arrêter la VM et de prendre des instantanés de chaque disque. Si les applications qui s’exécutent sur la machine virtuelle peuvent suspendre les E/S, profitez-en pour mettre en pause les opérations, puis prenez des instantanés de tous les disques attachés aux machines virtuelles. Prendre des captures hors connexion est plus facile que de coordonner les captures instantanées d’une machine virtuelle en cours d’exécution, mais cela nécessite un temps d’arrêt de quelques minutes.

Vous pouvez prendre une instantané à tout moment, mais si vous prenez des instantanés pendant l’exécution de la machine virtuelle, gardez ces éléments à l’esprit :

Lorsque la machine virtuelle est en cours d’exécution, les données sont toujours transmises vers les disques. Par conséquent, les instantanés d’une machine virtuelle en cours d’exécution peuvent contenir des opérations partielles qui étaient en cours d’exécution.
Si plusieurs disques sont impliqués dans une VM, des instantanés de différents disques peuvent avoir eu lieu à des moments différents.

Dans le scénario décrit, les instantanés n’ont pas été coordonnés. Ce manque de coordination est un problème pour les volumes à bandes dont les fichiers peuvent être corrompus si des modifications sont apportées pendant la sauvegarde. Le processus de sauvegarde doit donc implémenter les étapes suivantes :

Figez tous les disques.
Videz toutes les écritures en attente.
Créez un instantané incrémentiel pour les disques managés pour tous les disques.

Certaines applications Windows telles que SQL Server fournissent un mécanisme de sauvegarde coordonné via le service VSS (Volume Shadow Service) pour créer des sauvegardes cohérentes entre les applications. Sur Linux, vous pouvez utiliser un outil comme fsfreeze pour coordonner les disques (cet outil fournit des sauvegardes cohérentes dans les fichiers, et non des instantanés cohérents avec les applications). Cette procédure de sauvegarde est complexe, c'est pourquoi vous devriez envisager Vue d’ensemble d'Azure Disk Backup ou d'une solution de sauvegarde tierce qui met déjà en œuvre cette procédure. Cela entraînerait une collection d’instantanés coordonnés pour tous les disques de machine virtuelle, représentant une vue dans le temps spécifique de la machine virtuelle, en d’autres termes, un point de restauration de sauvegarde pour la machine virtuelle. Vous pouvez répéter le processus à intervalles réguliers pour créer des sauvegardes périodiques.

Points de restauration

Les points de restauration Azure VM peuvent être utilisés pour implémenter une sauvegarde granulaire et des stratégies de rétention de tous les disques attachés à votre machine virtuelle. Le point de restauration individuel de machine virtuelle est une ressource qui stocke la configuration de la machine virtuelle et des instantanés cohérents avec les applications à un instant dans le passé de tous les disques managés attachés à la machine virtuelle. Vous pouvez utiliser des points de restauration de machine virtuelle pour capturer facilement des sauvegardes cohérentes multi-disques de tous les disques attachés à votre machine virtuelle.

Les points de restauration ont trois niveaux de hiérarchie : collection de points de restauration de machine virtuelle, points de restauration de machine virtuelle et points de restauration de disque :

Niveau 1 : Les points de restauration VM sont organisés en collections de points de restauration. Une collection de points de restauration est une ressource Azure Resource Manager qui contient les points de restauration d’une machine virtuelle spécifique.
Niveau 2 : Les points de restauration de machine virtuelle contiennent un point de restauration de disque pour chacun des disques attachés.
Niveau 3 : Un point de restauration de disque contient un instantané d’un disque managé individuel.

Les points de restauration sont incrémentiels. Le premier point de restauration stocke une copie complète de tous les disques attachés à la machine virtuelle, tandis que le point de restauration successif contient uniquement les modifications incrémentielles apportées aux disques de machine virtuelle. Avec les points de restauration, vous pouvez :

Copiez les points de restauration de machine virtuelle entre les régions, restaurez les machines virtuelles dans une région différente de celle de la machine virtuelle source et suivez la progression de l’opération de copie.
Créez des disques à l’aide de points de restauration de disque et obtenez une signature d’accès partagé pour le disque. Ces disques peuvent ensuite être utilisés pour créer une nouvelle machine virtuelle.

Consultez les articles suivants pour savoir comment créer des points de restauration de machine virtuelle et Gérer les points de restauration de machine virtuelle.

Sauvegarde Azure

Sauvegarde Azure fournit des solutions simples, sécurisées et rentables pour sauvegarder vos données et les récupérer à partir d’Azure. Actuellement, le service Sauvegarde Azure prend en charge les tailles de disque allant jusqu’à 32 tébioctets (Tio). En savoir plus sur la prise en charge d'Azure Backup.

La sauvegarde des disques Azure est une solution de sauvegarde cloud native qui protège vos données sur des disques managés. Il s’agit d’une solution simple, sécurisée et économique qui vous permet de configurer la protection des disques managés en quelques étapes. Il garantit la protection de vos données en cas de sinistre.

La sauvegarde des disques Azure offre une solution clé en main qui fournit une gestion du cycle de vie des instantanés pour les disques managés en automatisant la création périodique d’instantanés et en les conservant pour une durée que vous spécifiez à l’aide d’une stratégie de sauvegarde. Vous pouvez gérer les instantanés de disque sans coûts d'infrastructure, sans script personnalisé et sans frais de gestion.

La sauvegarde des disques Azure est une solution de sauvegarde cohérente en cas de crash qui prend des sauvegardes ponctuelles d'un disque géré à l'aide d'instantanés incrémentiels et prend en charge plusieurs sauvegardes par jour. Il s’agit également d’une solution sans agent qui n’a pas d’impact sur les performances des applications de production. Elle prend en charge la sauvegarde et la restauration des disques du système d’exploitation et des données (y compris des disques partagés), qu’ils soient ou non actuellement attachés à une machine virtuelle Azure en cours d’exécution.

La sauvegarde des disques Azure est intégrée au Centre de sauvegarde, qui fournit une expérience de gestion unifiée unique dans Azure pour permettre aux entreprises de régir, superviser, exploiter et analyser les sauvegardes à grande échelle. Si vous avez besoin d’une sauvegarde cohérente avec les applications de la machine virtuelle, y compris des disques de données, ou d’une option permettant de restaurer l’intégralité d’une machine virtuelle à partir d’une sauvegarde, de restaurer un fichier ou un dossier, ou de restaurer dans une région secondaire, utilisez la solution de sauvegarde des machines virtuelles Azure. Si vous ne pouvez pas utiliser Sauvegarde Azure, vous pouvez implémenter votre propre mécanisme de sauvegarde à l’aide de captures instantanées. Toutefois, la création d’instantanés cohérents pour tous les disques utilisés par une machine virtuelle, la réplication de ces instantanés dans une autre région et la gestion continue de ce processus sont compliquées et fastidieuses.

Azure Site Recovery (Récupération de site Azure)

Azure Site Recovery permet d'assurer la continuité des activités de votre entreprise en maintenant les applications et les charges de travail en fonctionnement pendant les pannes. Il s’agit d’un service entièrement géré et payant pour vous aider à atteindre votre stratégie de continuité d’activité et de récupération d’urgence (BCDR).

Azure Site Recovery réplique les charges de travail s’exécutant sur des machines virtuelles et physiques depuis un site principal vers un emplacement secondaire. Lorsqu'une panne survient sur votre site principal, votre charge de travail est transférée sur un site secondaire, d'où elle est accessible. Une fois que l'emplacement principal fonctionne à nouveau, vos charges de travail peuvent y revenir.

Vous pouvez facilement configurer la récupération d’urgence dans une région Azure secondaire en quelques étapes. Azure Site Recovery permet de nombreux scénarios de récupération d’urgence : Azure vers Azure, VMware vers Azure, Physique vers Azure, machine virtuelle Azure Stack, Hyper-V vers Azure, récupération d’urgence pour les applications, récupération d’urgence sur un site secondaire. Pour obtenir la liste complète des avantages d’Azure Site Recovery, consultez À propos de Site Recovery.

Autres options

SQL Server exécuté dans une machine virtuelle a ses propres fonctionnalités intégrées permettant de sauvegarder votre base de données SQL Server vers Stockage Blob Azure ou un partage de fichiers. Pour plus d’informations, voir Sauvegarde et restauration de SQL Server dans les machines virtuelles Azure. En plus de la sauvegarde et de la restauration, les groupes de disponibilité SQL Server Always On peuvent gérer les réplicas secondaires de bases de données. Cela réduit considérablement le délai de reprise d’activité après sinistre.

Étapes suivantes

Explorez les différentes options :