Partager via


Qu’est-ce qu’un témoin de quorum ?

Dans un cluster de basculement, un témoin de quorum est un composant qui permet de maintenir la haute disponibilité du cluster en participant au processus de vote de quorum. Le quorum est un concept utilisé pour déterminer le nombre d’échecs que le cluster peut supporter tout en demeurant opérationnel.

Dans un cluster, chaque nœud obtient un vote et le témoin de quorum peut également avoir un vote. Le nombre total de votes détermine le quorum. Pour que le cluster soit opérationnel, plus de la moitié des votes doivent être actifs. Si le nombre de votes tombe en dessous de ce seuil, le cluster cesse de s’exécuter pour éviter les scénarios fractionnés de cerveau, où deux parties du cluster pensent qu’elles sont la partie active, ce qui entraîne une altération des données.

Le rôle du témoin de quorum est de fournir un vote supplémentaire pour obtenir ou maintenir une majorité lorsqu’il y a un nombre pair de nœuds, ou si certains nœuds échouent. Si le nombre de votes actifs tombe en dessous de la majorité requise, le cluster cesse d’effectuer des opérations pour empêcher les conditions de « fractionnement du cerveau ». Split-brain est un scénario où, lorsque des sections distinctes du cluster croient qu’elles fonctionnent indépendamment, ce qui peut entraîner des incohérences de données ou une altération.

Types de témoins de quorum

Il existe trois types distincts de témoins de quorum qui peuvent être configurés pour maintenir la haute disponibilité et empêcher les conditions de fractionnement du cerveau. Chacun sert de vote impartial sur l'état de santé du quorum du cluster.

  • Témoin nuage - Un service basé sur le nuage comme Azure Blob Storage
  • Témoin de disque : disque partagé accessible par tous les nœuds
  • Témoin de partage de fichiers - Dossier partagé accessible par tous les nœuds

Pour garantir l’intégrité continue des opérations et des données, ces témoins de quorum offrent chacun une méthode unique pour obtenir un vote majoritaire pour les opérations de cluster. En guise de meilleure pratique, configurez le quorum pour avoir un nombre impair d’éléments de vote. Si le cluster a un nombre pair de nœuds de vote, ajoutez un témoin de disque ou un témoin de partage de fichiers. Cette configuration permet au cluster de tolérer une défaillance de nœud supplémentaire. En outre, l’ajout d’un vote témoin garantit que le cluster peut continuer à fonctionner même si la moitié des nœuds de cluster échouent ou perdent la connectivité simultanément. Selon la configuration de quorum que vous choisissez, le cluster est configuré dans l’un des modes de quorum suivants :

mode de fonctionnement Descriptif
Nœud majoritaire (sans témoin) Seuls les nœuds disposent d'un vote. Aucun témoin de quorum n'est configuré. Le quorum du cluster dépend des votes majoritaires des nœuds de cluster actifs.
Nœud majoritaire avec témoin (disque ou partage de fichiers) Les nœuds disposent d'un vote. Par ailleurs, un témoin de quorum dispose d'un vote. Le quorum de cluster s’appuie sur les votes majoritaires des nœuds de cluster actifs, y compris les votes témoins. Un témoin de quorum peut être un témoin de disque désigné ou un témoin de partage de fichiers désigné.
Pas de majorité (témoin de disque uniquement) Aucun nœud ne dispose d'un vote. Seul un témoin de disque dispose d'un vote.

Le quorum de cluster s’appuie sur l’état du témoin de disque. En règle générale, ce mode n’est pas recommandé et il ne doit pas être sélectionné, car il crée un point de défaillance unique pour le cluster.

Remarque

Si vous utilisez un témoin de partage de fichiers ou un témoin cloud, n’oubliez pas de redémarrer le service de cluster sur le dernier nœud actif avant d’arrêter tous les nœuds de cluster pour maintenance. Cela garantit que le cluster peut reprendre les opérations en douceur lors du retour en ligne. Les types témoins comme ceux-ci ne stockent pas la dernière base de données de cluster, ce qui peut entraîner des erreurs lors du démarrage de l’appareil. Pour en savoir plus, consultez l’événement 1561.

Conseil / Astuce

Vous pouvez vérifier le vote dynamique affecté à un nœud en vérifiant la propriété DynamicWeight du nœud de cluster à l’aide de l’applet de commande Get-ClusterNode . Une valeur DynamicWeight de 0 signifie que le nœud n’a pas de vote de quorum, tandis qu’une valeur de 1 indique que le nœud a un vote de quorum.

Témoin de cloud

Le témoin cloud est différent des configurations de témoin de quorum de cluster traditionnelles, car il utilise une machine virtuelle Azure dans le cloud comme témoin de quorum au lieu d’un centre de données physique. Le témoin cloud utilise le Stockage Blob Azure pour lire et écrire un fichier blob que le système utilise comme vote décisif pour atteindre le quorum. Le diagramme suivant montre un exemple de configuration qui utilise le témoin cloud.

Diagramme illustrant un cluster de basculement avec le témoin cloud connecté au site 1 et au site 2.

Les configurations de témoins cloud ne nécessitent pas de troisième centre de données distinct et obtiennent un vote supplémentaire pour empêcher l’arrêt total si l’un des autres centres de données s’arrête. Il n’a pas besoin d’un site supplémentaire pour stocker le témoin de quorum et n’a pas besoin de la maintenance physique régulière requise pour un centre de données sur site.

En plus de la redondance, il existe d’autres avantages pour utiliser la fonctionnalité témoin cloud :

  • L'utilisation du Stockage Blob Azure supprime les frais de maintenance supplémentaires normalement requis pour l'hébergement de machines virtuelles dans le cloud public.

  • Vous pouvez utiliser le même compte de stockage Azure pour plusieurs clusters. Les seules conditions sont d'utiliser un seul blob par cluster et de nommer le nom du fichier blob d'après l'identifiant unique du cluster.

  • Réduction des coûts permanents de votre compte de stockage, car le fichier blob n'a pas besoin de beaucoup de données et n'est mis à jour que lorsque l'état du nœud de cluster change.

  • Azure dispose d’un type de ressource de témoin cloud intégré.

  • Un témoin cloud ne stocke pas une copie de la base de données du cluster.

Témoin de disque

Un témoin de disque est un type de témoin de quorum utilisé dans un cluster de basculement pour aider à maintenir la haute disponibilité du cluster. Un témoin de disque est un disque partagé auquel tous les nœuds du cluster ont accès. Le témoin de disque contient une petite quantité d’espace de stockage utilisé pour stocker la base de données de configuration du cluster. Cet espace de stockage inclut des informations importantes sur le cluster, telles que l’état de chaque nœud et la propriété des ressources du cluster. Voici comment cela fonctionne :

  • Le témoin de disque est configuré en tant que stockage partagé auquel tous les nœuds peuvent accéder, mais un seul nœud peut écrire à un moment donné.

  • Au démarrage du service de cluster, chaque nœud communique avec le témoin de disque pour lire la dernière configuration du cluster.

  • Le témoin de disque participe au processus de vote de quorum. En cas d’échec d’un nœud, le témoin de disque fournit un vote supplémentaire, ce qui peut aider à empêcher un scénario de cerveau partagé.

  • S’il existe une partition réseau, le côté de la partition avec accès au témoin de disque qui a le plus de votes continue à fonctionner afin de maintenir l’intégrité du cluster.

Le témoin de disque est utile dans les clusters avec un nombre pair de nœuds, où il peut agir comme un tiebreak pour s’assurer qu’il y a toujours un vote majoritaire. Il est également utile dans les scénarios où plusieurs nœuds échouent simultanément, car le témoin de disque peut aider à maintenir le quorum.

L’avantage clé de l’utilisation d’un témoin de disque est qu’il fournit une méthode cohérente et fiable pour tous les nœuds afin d’accepter l’état actuel du cluster. La cohérence est essentielle pour garantir le bon fonctionnement d’un cluster de basculement. Il est important de noter que le témoin de disque ne stocke pas les données utilisateur ou application ; il est exclusivement utilisé pour la base de données de configuration du cluster et le vote de quorum.

Témoin de partage de fichiers

Lorsqu'un cluster contient un nombre pair de nœuds votants, vous devez configurer un témoin. En ajoutant le vote d'un témoin, le cluster peut continuer à fonctionner si la moitié des nœuds du cluster tombent en panne simultanément ou sont déconnectés. Un témoin de partage de fichiers est un type de témoin de quorum qui utilise un partage de fichiers SMB (Server Message Block) pour conserver les informations du cluster dans un fichier journal. Ce partage de fichiers peut être hébergé sur un serveur, un stockage USB ou un stockage NAS (Network Attached Storage).

Le témoin de partage de fichiers est également bénéfique pour les clusters multisite avec un stockage répliqué. Vous pourriez utiliser un témoin de partage de fichiers dans les cas suivants :

  • Un témoin cloud ne peut pas être utilisé, car vos nœuds de cluster ne disposent pas d’une connexion Internet fiable ou d’une connectivité Internet.

  • Un témoin de disque ne peut pas être utilisé, car il n’existe aucun lecteur partagé à utiliser pour un témoin de disque. Par exemple, un cluster Storage Spaces Direct, des groupes de disponibilité (AG) Always On de SQL Server ou des groupes de disponibilité (DAG) de bases de données Exchange. Aucun de ces types de clusters n'utilise de disques partagés.

Diagramme illustrant un quorum de cluster avec un témoin de partage de fichiers étiqueté de site connecté au site 1 et au site deux.

Cet exemple est une configuration simplifiée avec deux nœuds dans deux centres de données sur site. Dans les clusters classiques, chaque nœud a un vote, un témoin de partage de fichiers donne un vote supplémentaire au témoin de quorum. Ce vote supplémentaire permet au cluster de continuer à fonctionner même si l'un des centres de données est désactivé. Dans l'exemple, le quorum du cluster a cinq votes possibles et n'a besoin que de trois votes pour continuer à fonctionner.

Toutefois, vous remarquerez peut-être qu’en plus des deux centres de données, il existe également un troisième centre de données qui agit comme témoin de partage de fichiers . Ce centre de données est séparé des deux autres sites et héberge un serveur de fichiers qui sauvegarde le partage des fichiers du système. Le témoin de partage de fichiers fait office de témoin de quorum dans cette configuration de quorum du cluster, ce qui permet de s'assurer que le système continue de fonctionner même si l'un des centres de données s'arrête inopinément.

Le fait d'avoir un témoin de partage de fichiers offre suffisamment de redondance pour que votre serveur de fichiers reste hautement disponible. Cependant, n'oubliez pas que l'hébergement du témoin de partage de fichiers sur un autre serveur dans un site séparé nécessite une configuration, une maintenance régulière et une connectivité indépendante avec les autres sites.

Configuration de témoin

En guise de meilleure pratique, configurez le quorum pour avoir un nombre impair d’éléments de vote. Si le cluster a un nombre pair de nœuds de vote, ajoutez un témoin de disque ou un témoin de partage de fichiers pour garantir la haute disponibilité. Cette configuration permet au cluster de tolérer l’échec d’un nœud supplémentaire. En outre, l’ajout d’un vote témoin garantit que le cluster peut continuer à fonctionner même si la moitié des nœuds du cluster échouent ou perdent la connectivité simultanément.

Un témoin de disque est généralement recommandé lorsque tous les nœuds de cluster ont accès au disque partagé. En revanche, un témoin de partage de fichiers est préféré pour les scénarios de récupération d’urgence multisite impliquant un stockage répliqué. La configuration d’un témoin de disque avec stockage répliqué n’est possible que si la solution de stockage prend en charge l’accès en lecture-écriture de tous les sites au stockage répliqué. Pour en savoir plus sur les types de configuration des témoins, consultez Déployer un témoin de quorum.

Attribution de votes aux nœuds

Dans les configurations de quorum avancées, vous pouvez attribuer ou supprimer des votes de quorum pour des nœuds individuels. Par défaut, chaque nœud du cluster reçoit un vote. Toutefois, même si le vote d’un nœud est supprimé, il participe toujours au cluster, reçoit des mises à jour de la base de données du cluster et reste capable d’héberger des applications.

Dans des scénarios de récupération d’urgence spécifiques, vous pouvez envisager de supprimer des votes sur certains nœuds. Par exemple, dans un cluster multisite, vous pouvez supprimer les votes des nœuds situés dans un site de sauvegarde pour les empêcher d’influencer les calculs de quorum. Cette approche est généralement recommandée seulement lors de la préparation du transfert manuel entre les sites. Il n'est pas recommandé d'attribuer le vote aux nœuds pour obtenir un nombre de nœuds votants impair. Il est préférable de configurer un témoin de disque ou un témoin de partage de fichiers.

Gestion de quorum dynamique

La gestion dynamique du quorum est une option de configuration avancée qui permet au cluster d’ajuster dynamiquement ses exigences de majorité de quorum. Cette fonctionnalité permet au cluster de rester opérationnel même si les nœuds sont arrêtés de manière séquentielle, ce qui permet au cluster de s’exécuter sur le dernier nœud survivant.

La gestion dynamique des quorums offre une flexibilité et une résilience améliorées pour les clusters de basculement, ce qui en fait une fonctionnalité précieuse pour maintenir la haute disponibilité dans les environnements dynamiques. Avec la gestion dynamique du quorum activée, le cluster peut ajuster automatiquement les votes attribués aux nœuds en fonction de l’état actuel du cluster, ce qui garantit que le cluster peut maintenir des défaillances de nœud ou des arrêts planifiés tout en conservant le quorum. Si la gestion de quorum dynamique est activée, seuls les nœuds configurés pour qu'un vote leur soit attribué peuvent voir leurs votes attribués ou retirés de manière dynamique.

Considérations clés :

  • La gestion dynamique du quorum ne permet pas au cluster de survivre à l’échec simultané de la plupart des membres de vote. Au moment de l’échec ou de l’arrêt d’un nœud, le cluster doit toujours avoir une majorité de quorum pour continuer à s’exécuter.
  • Si le vote d’un nœud est explicitement supprimé, le cluster ne peut pas ajouter ou supprimer dynamiquement ce vote.
  • Dans les clusters avec espaces de stockage direct activés, le cluster ne peut tolérer que jusqu’à deux échecs de nœud.

Recommandations générales concernant la configuration d'un quorum

Le logiciel de cluster détermine automatiquement la configuration de quorum d’un nouveau cluster en fonction du nombre de nœuds et de la disponibilité du stockage partagé. Cette configuration par défaut est généralement la plus adaptée au cluster. Nous vous recommandons de passer en revue les paramètres de quorum une fois le cluster créé et avant de le déployer dans un environnement de production.

Pour examiner la configuration détaillée du quorum, vous pouvez utiliser l’Assistant Validation d’une configuration ou l’applet de commande Test-Cluster pour exécuter le test Valider la configuration du quorum . Dans le Gestionnaire de cluster de basculement, la configuration de quorum de base s’affiche dans la section récapitulative du cluster sélectionné. Vous pouvez également récupérer des informations détaillées sur les ressources de quorum en exécutant l’applet de commande Get-ClusterQuorum .

À tout moment, vous pouvez exécuter le test Valider la configuration du quorum pour vous assurer que les paramètres de quorum sont optimaux pour votre cluster. Les résultats des tests indiquent si une modification de configuration est recommandée et fournit les paramètres optimaux. Si des ajustements sont nécessaires, vous pouvez appliquer les modifications recommandées à l’aide de l’Assistant Configurer le quorum du cluster. Une fois le cluster en production, évitez de modifier la configuration du quorum, sauf si vous évaluez et vérifiez que la modification est nécessaire pour les exigences spécifiques de votre cluster. Vous pouvez envisager de modifier la configuration du quorum dans les cas suivants :

  • Ajout ou éviction de nœuds.
  • ajout ou suppression de stockage ;
  • défaillance de longue durée d'un nœud ou d'un témoin ;
  • récupération d'un cluster dans un scénario de récupération d'urgence multisite.

Voir aussi