Partage via


Vue d’ensemble des groupes à haute disponibilité

S’applique à : ✔️ Machines virtuelles Linux ✔️ Machines virtuelles Windows

Cet article fournit une vue d’ensemble des fonctionnalités de disponibilité des machines virtuelles Azure.

Remarque

Nous recommandons aux clients de choisir Virtual Machine Scale Sets avec mode d’orchestration flexible pour bénéficier d’une haute disponibilité avec la plus large gamme de fonctionnalités. Virtual Machine Scale Sets :

  • Autorise la gestion, la configuration et la mise à jour centralisées des instances de machine virtuelle.
  • Augmente ou diminue automatiquement le nombre d’instances de machine virtuelle en réponse à la demande ou à une planification définie.

Les groupes à haute disponibilité offrent uniquement une haute disponibilité.

Qu’est-ce qu’un groupe à haute disponibilité ?

Les groupes à haute disponibilité sont des regroupements logiques de machines virtuelles qui réduisent le risque de défaillances corrélées entraînant des pannes simultanées sur les machines virtuelles associées. Les groupes à haute disponibilité placent des machines virtuelles dans différents domaines d’erreur pour améliorer la fiabilité. Cette action est particulièrement utile si une région ne prend pas en charge les zones de disponibilité.

Lorsque vous utilisez des groupes à haute disponibilité, créez au moins deux machines virtuelles par groupe. L’utilisation de deux machines virtuelles ou plus dans un groupe à haute disponibilité permet d’assurer la haute disponibilité des applications et de respecter le contrat de niveau de service (SLA) Azure de 99,95 %. L’utilisation de groupes à haute disponibilité n’engendre aucun coût supplémentaire. Vous payez uniquement pour chaque instance de machine virtuelle que vous créez.

Les groupes à haute disponibilité offrent une meilleure latence de machine virtuelle à machine virtuelle que les zones de disponibilité, car les machines virtuelles d’un groupe à haute disponibilité sont allouées à proximité. Les groupes à haute disponibilité permettent d’isoler les défaillances potentielles, pour réduire les points de défaillance uniques et offrir une haute disponibilité. Les groupes à haute disponibilité sont toujours vulnérables à certaines défaillances d’infrastructures partagées, comme les défaillances réseau des centres de données, qui peuvent affecter plusieurs domaines d’erreur.

Pour encore plus de fiabilité que celle offerte par les groupes à haute disponibilité, utilisez des zones de disponibilité. Les zones de disponibilité offrent la fiabilité la plus élevée. Chaque machine virtuelle est déployée dans plusieurs centres de données pour vous protéger contre toute panne de courant, de réseau ou de refroidissement dans un centre de données particulier. Si votre première priorité est de pouvoir compter sur une fiabilité optimale de votre charge de travail, répliquez vos machines virtuelles sur plusieurs zones de disponibilité.

Comment fonctionnent les groupes à haute disponibilité ?

La plateforme Azure sous-jacente attribue un domaine de mise à niveau et un domaine d’erreur à chaque machine virtuelle de votre groupe à haute disponibilité. Chaque groupe à haute disponibilité peut avoir jusqu’à 3 domaines d’erreur et 20 domaines de mise à niveau. Vous ne pouvez pas modifier ces configurations une fois le groupe à haute disponibilité créé.

Domaines de mise à jour

Les domaines de mise à niveau indiquent les groupes de machines virtuelles et le matériel physique sous-jacent pouvant être redémarrés en même temps.

Lorsque plus de cinq machines virtuelles sont configurées dans un seul groupe à haute disponibilité avec cinq domaines de mise à niveau, la sixième machine est placée dans le même domaine de mise à niveau que la première. La septième machine virtuelle est placée dans le même domaine de mise à niveau que la deuxième machine virtuelle. Et la séquence se poursuit.

Le redémarrage des domaines de mise à niveau peut ne pas suivre un ordre séquentiel au cours de la maintenance planifiée, mais un seul domaine de mise à niveau peut être redémarré à la fois. Un domaine de mise à niveau redémarré a 30 minutes pour récupérer avant que la maintenance ne démarre sur un autre domaine de mise à niveau.

Domaines d’erreur

Les domaines d’erreur définissent le groupe de machines virtuelles partageant une source d’alimentation et un commutateur réseau communs. Par défaut, les machines virtuelles configurées dans votre groupe à haute disponibilité sont réparties entre trois domaines de défaillance au maximum.

Le placement de vos machines virtuelles dans un groupe à haute disponibilité ne protège pas votre application contre les défaillances propres au système d’exploitation ou à l’application. Toutefois, cette approche limite l’impact des défaillances du matériel physique, des pannes de réseau ou des coupures de courant susceptibles de survenir.

Diagramme montrant des clusters de calcul fractionnés en domaines d’erreur qui contiennent des domaines de mise à niveau.

Domaines d’erreur de disque

Les machines virtuelles sont également alignées avec les domaines d’erreur de disque. Cet alignement garantit que tous les disques managés attachés à une machine virtuelle se trouvent dans les mêmes domaines d’erreur.

Seules des machines virtuelles avec des disques managés peuvent être créées dans un groupe à haute disponibilité géré. Le nombre de domaines d’erreur avec des disques gérés varie en fonction de la région (deux ou trois par région).

La commande suivante récupère une liste de domaines d’erreur par région :

az vm list-skus --resource-type availabilitySets --query '[?name==`Aligned`].{Location:locationInfo[0].location, MaximumFaultDomainCount:capabilities[0].value}' -o Table

Domaines d’erreur partagés

Dans certains cas, deux machines virtuelles d’un même groupe à haute disponibilité peuvent partager un domaine d’erreur. Vous pouvez vérifier si un domaine d’erreur est partagé en accédant à votre groupe à haute disponibilité et en regardant la colonne Domaine d’erreur.

Si vos machines virtuelles ont un domaine d’erreur partagé, cela peut être dû au fait que vous avez effectué ces actions lors du déploiement de vos machines virtuelles :

  1. Déploiement de la première machine virtuelle
  2. Arrêtez ou libérez la première machine virtuelle.
  3. Déploiement de la deuxième machine virtuelle

Dans ces circonstances, le disque du système d’exploitation de la deuxième machine virtuelle peut être créé dans le même domaine d’erreur que la première machine virtuelle, de sorte que les deux machines virtuelles se retrouvent dans le même domaine d’erreur. Pour éviter ce problème, n’arrêtez pas ou ne libérez pas les machines virtuelles entre les déploiements.

Diagramme de l’alignement du domaine d’erreur avec les groupes de machines virtuelles identiques régionaux et les groupes à haute disponibilité.