Vue d’ensemble des groupes à haute disponibilité

S’applique à : ✔️ Machines virtuelles Linux ✔️ Machines virtuelles Windows

Remarque

Nous recommandons aux clients de choisir des groupes de machines virtuelles identiques avec mode d’orchestration flexible pour avoir une haute disponibilité avec le plus de fonctionnalités possibles. Les groupes de machines virtuelles identiques permettent aux instances de machine virtuelle d’être gérées, configurées et mises à jour de manière centralisée. De plus, ils augmentent ou diminuent automatiquement le nombre d’instances de machine virtuelle en fonction de la demande ou d’une planification définie. Les groupes à haute disponibilité offrent uniquement une haute disponibilité.

Cet article fournit une vue d’ensemble des fonctionnalités de disponibilité des machines virtuelles Azure.

Qu’est-ce qu’un groupe à haute disponibilité ?

Les groupes à haute disponibilité sont des regroupements logiques de machines virtuelles qui réduisent le risque de défaillances corrélées entraînant des pannes simultanées sur les machines virtuelles associées. Les groupes à haute disponibilité placent les machines virtuelles dans différents domaines d’erreur pour une meilleure fiabilité. Cela est particulièrement utile lorsqu’une région ne prend pas en charge les zones de disponibilité. Lorsque vous utilisez des groupes à haute disponibilité, créez au moins deux machines virtuelles par groupe. L’utilisation de deux machines virtuelles ou plus dans un groupe à haute disponibilité favorise les applications hautement disponibles et permet de respecter le contrat de niveau de service Azure de 99,95 %. L’utilisation des groupes à haute disponibilité n’entraîne pas de frais supplémentaires. Vous ne payez que pour chaque instance de machine virtuelle que vous créez.

Les groupes à haute disponibilité offrent une meilleure latence de machine virtuelle à machine virtuelle par rapport aux zones de disponibilité, car les machines virtuelles d’un groupe à haute disponibilité sont allouées à proximité. Les groupes à haute disponibilité permettent d’isoler les défaillances potentielles, ce qui réduit les points de défaillance uniques et offre une haute disponibilité. Les groupes à haute disponibilité sont toujours vulnérables à certaines défaillances d’infrastructures partagées, comme les défaillances réseau des centres de données, qui peuvent affecter plusieurs domaines d’erreur.

Pour encore plus de fiabilité que celle offerte par les groupes à haute disponibilité, utilisez des zones de disponibilité. Les zones de disponibilité offrent le plus haut niveau de fiabilité, car chaque machine virtuelle est déployée dans plusieurs centres de données, ce qui vous protège contre les coupures de courant, de mise en réseau ou de refroidissement dans un centre de données individuel. Si votre première priorité est de pouvoir compter sur une fiabilité optimale de votre charge de travail, répliquez vos machines virtuelles sur plusieurs zones de disponibilité.

Comment fonctionnent les groupes à haute disponibilité ?

Chaque machine virtuelle de votre groupe à haute disponibilité se voit attribuer un domaine de mise à jour et un domaine d’erreur par la plateforme Azure sous-jacente. Chaque groupe à haute disponibilité peut être configuré avec 3 domaines d’erreur maximum et 20 domaines de mise à jour. Ces configurations ne peuvent pas être modifiées une fois que le groupe à haute disponibilité a été créé. Les domaines de mise à jour indiquent les groupes de machines virtuelles et les équipements physiques sous-jacents pouvant être redémarrés en même temps. Lorsque plus de cinq machines virtuelles sont configurées dans un seul groupe à haute disponibilité avec cinq domaines de mise à jour, la sixième machine est placée dans le même domaine de mise à jour que la première, la septième dans le même que la deuxième, et ainsi de suite. Le redémarrage des domaines de mise à jour peut ne pas suivre un ordre séquentiel au cours de la maintenance planifiée, mais un seul domaine de mise à jour peut être redémarré à la fois. Un domaine de mise à jour redémarré bénéficie de 30 minutes pour récupérer avant que la maintenance ne soit lancée sur un autre domaine de mise à jour.

Les domaines d’erreur définissent le groupe de machines virtuelles partageant une source d’alimentation et un commutateur réseau communs. Par défaut, les machines virtuelles configurées dans votre groupe à haute disponibilité sont réparties entre trois domaines de défaillance au maximum. Le fait de placer vos machines virtuelles dans un groupe à haute disponibilité ne protège pas vos applications des défaillances du système d’exploitation ou propres aux applications, mais limite l’effet des défaillances des équipements physiques, des pannes du serveur et des coupures d’électricité.

Diagramme montrant différents clusters de calcul répartis en domaines d’erreur ; dans ces domaines d’erreur, nous avons plusieurs domaines de mise à jour

Les machines virtuelles sont également alignées avec les domaines d’erreur de disque. Cet alignement garantit que tous les disques managés attachés à une machine virtuelle se trouvent dans les mêmes domaines d’erreur.

Seules des machines virtuelles avec des disques managés peuvent être créées dans un groupe à haute disponibilité géré. Le nombre de domaines d’erreur de disques gérés varie en fonction de la région (deux ou trois par région). La commande suivante récupère une liste de domaines d’erreur par région :

az vm list-skus --resource-type availabilitySets --query '[?name==`Aligned`].{Location:locationInfo[0].location, MaximumFaultDomainCount:capabilities[0].value}' -o Table

Dans certains cas, deux machines virtuelles d’un même groupe à haute disponibilité peuvent partager un domaine d’erreur. Vous pouvez vérifier si un domaine d’erreur est partagé en accédant à votre groupe à haute disponibilité et en regardant la colonne Domaine d’erreur. Vous pouvez avoir obtenu le partage d’un domaine d’erreur si vous avez effectué cette série d’étapes lors du déploiement des machines virtuelles :

  1. Déploiement de la première machine virtuelle
  2. Arrêt ou libération de la première machine virtuelle
  3. Déploiement de la deuxième machine virtuelle

Dans ces circonstances, le disque du système d’exploitation de la deuxième machine virtuelle peut être créé dans le même domaine d’erreur que la première machine virtuelle, de sorte que les deux machines virtuelles se retrouvent dans le même domaine d’erreur. Pour éviter ce problème, il est recommandé de ne pas arrêter ni libérer les machines virtuelles entre deux déploiements.

Diagramme montrant comment les domaines d’erreur pour les disques et les machines virtuelles sont alignés.

Étapes suivantes

Pour en savoir plus sur les meilleures pratiques, consultez la rubrique relative aux meilleures pratiques Azure en matière de disponibilité.