Windows Server 2008 R2 : Dépannage des Clusters de basculement

Lorsque l'échec n'est pas une option, configuration des clusters de basculement Windows Server peut aider à assurer la disponibilité près-compatible.

John Marlin

Windows Server a changé au cours des années, avec des versions différentes, à différents niveaux de soutien et de différentes tactiques pour le dépannage. La politique de soutien actuelle est que, pour Windows Server 2008 ou Windows Server 2008 R2 Failover Clustering solution à envisager des solutions officiellement pris en charge par Microsoft Customer Support Services (CSS), ils doivent satisfaire les critères suivants:

  • Tous les composants matériels et logiciels doivent respecter les qualifications pour recevoir un logo « Certifié pour Windows Server 2008 R2 ».
  • La solution entièrement configurée doit passer le test de validation dans la gestion de Cluster de basculement.

En s'assurant que vous avez une version avec l'appui officiel, vous avez la meilleure chance de tout ce travail. Il peut toujours y avoir des problèmes avec les fournisseurs de matériel, ou Microsoft peut besoin à s'impliquer aider avec certaines configurations, mais les chances sont que vous devez au moins être bon pour commencer. Voici un aperçu de certaines des questions plus courantes avec Windows Server 2008 R2 Failover Clustering et comment résoudre avec précision ces problèmes.

Le Cluster changeant

La façon dont les Clusters sont qualifiés a changé de façon significative dans Windows Server 2008 R2 avec l'introduction de la Validation des regroupements Assistant, qui est intégré à la gestion de clusters de basculement. L'Assistant de Validation des regroupements vous permet d'exécuter un ensemble de tests ciblées sur une collection de serveurs que vous comptez utiliser comme des nœuds dans un Cluster.

Ce processus de validation des tests le matériel et le logiciel sous-jacent directement et individuellement. Cela fournira une évaluation exacte de comment bien une configuration donnée appuiera Failover Clustering. Si vous l'utilisez sur un Cluster en cours d'exécution, elle peut aussi let you know si vous êtes réunion des meilleures pratiques. Vous devez exécuter il lorsque vous ajoutez de nouveau matériel ou pilotes au Cluster.

Pour ceux qui aiment les scripts, Failover Clustering a maintenant Windows PowerShell soutenir. C'est quelque chose avec laquelle vous devriez commencer à devenir plus familiers, comme CLUSTER.EXE n'est plus mis à jour. Si vous ne savez pas quels sont les cmdlets et ce qu'ils signifient, vous pouvez exécuter la commande Get-Help * Cluster *. Cela vous donnera une liste qui décrit les commandes, comme ceci :

Synopsis nom
----                             --------
Nouveau Cluster créer un nouveau cluster de basculement. Avant de créer un
cluster, vous devez...

Si vous ne savez pas comment utiliser la commande, vous pouvez utiliser Get-Help New-Cluster –Examples pour voir des échantillons, comme ceci :

NAME

Nouveau Cluster

CARNET DE BORD

Créer un nouveau cluster de basculement. Avant de créer un cluster, vous
doit se connecter les matériels (serveurs, réseaux et stockage), puis exécutez
les tests de validation.

-------------------------- EXAMPLE 1 --------------------------

C:\PS > New-Cluster - nom cluster1-nœud node1, ud2, node3, node4

Name
----
cluster1

Description
-----------
Cette commande crée une grappe de quatre nœuds, nommée cluster1, utilisant par défaut
paramètres d'adressage IP.

Lors de la réception des événements dans Windows, il est toujours une bonne idée de comprendre vraiment ce qu'elles signifient. Certains ne sont pas comme descriptives que vous désirez. Une liste de tous les événements, vous pouvez voir, y compris des descriptions de l'événement, est disponible en ligne.

Les journaux des événements en tête

Si vous rencontrer un problème, événements de Cluster est l'un des premières places, que vous devriez commencer la recherche. Toute critique, d'erreur ou avertissements donnés sera dans le journal des événements système. Les messages d'information (comme un groupe passe en mode hors connexion, un groupe de déplacer vers un autre nœud et ainsi de suite) sera dans le chenal d'opérationnels du Cluster. Vous pouvez voir ces événements dans l'observateur d'événements / Application et Services Logs / Microsoft / Windows / FailoverClustering.

Si vous n'êtes pas certain de ce que le problème était avec un groupe de l'Application du Service ou de la ressource, vous pouvez l'afficher en gestion de Cluster de basculement. Si vous êtes mis en évidence sur un groupe en particulier, sélectionnez « Show des événements critiques pour cette application. » Si vous êtes mis en évidence sur une ressource spécifique, sélectionnez « Afficher les événements critiques pour cette ressource. »

Ceci ouvrira le journal des événements système et le filtre pour le groupe spécifique ou une ressource. Il vous donnera toutes les occurrences trouvées dans le journal des événements système pour tous les noeuds du cluster. Cela pourrait être bénéfique, comme il vous montrera tout cela d'un endroit.

Une fois que vous avez identifié la ressource, vous pouvez aller pour les journaux d'événements système pour voir s'il y a d'autres facteurs contributifs. Ne pas être distrait par le symptôme — se concentrer sur une cause racine. Par exemple, si un nom de réseau ou l'adresse IP échoue, sont là tout autre événement de type réseau pouvant contribuer à cette (TCPIP pile échoue, défaillances de carte réseau et ainsi de suite) ?

Enregistrement de débogage de cluster a changé de séances de suivi des événements. Il n'y a pas plus de CLUSTER.JOURNAL. Le système est maintenant écrit d'extraire, de transformer et de charger des fichiers (ETL) situés dans le dossier %WinDir%\System32\winevt\logs. Ces fichiers ETL, vous pouvez générer un CLUSTER unique.Ouvrez une session pour être vu de tous les trois. C'est un « instantané » dans le temps, cependant. En d'autres termes, lorsque vous générez un Cluster.log, il n'est plus le fichier Cluster.log lui-même, par écrit. Chaque fois que vous générez un sur un nœud, il va remplacer l'actuel et remplacez-la par la nouvelle.

Vous pouvez générer des journaux avec la commande de Windows Powershell Get-ClusterLog. Cela va sortir à tous les nœuds de la grappe et de créer le fichier pour chaque nœud dans le dossier %WinDir%\Cluster\Reports. Selon le nombre de nœuds et la taille des fichiers, vous pouvez examiner certains des commutateurs supplémentaires.

Que vous avez un Cluster de neuf-nœud et souhaitez obtenir tous les journaux. Vous pouvez utiliser le commutateur –Destination d'avoir eux tous générée et copier dans un emplacement spécifique. Cela vous donnera un lieu unique pour les obtenir. Il sera également baliser le nom du nœud dans le cadre du nom du fichier (par exemple, Get-ClusterLog –Destination c:\logs créera Node1_Cluster.log, Node2_cluster.log et ainsi de suite dans le dossier C:\LOGS).

Une autre considération s'il s'agit d'un problème facilement reproductible : utilisez le commutateur –Timespan (en minutes). Simplement reproduire le problème sur un nœud et exécutez Get-ClusterLog –Timespan 5 –Node Node1. Cela génère un Cluster.log pour seulement Node1 et saisir uniquement les cinq dernières minutes.

Voici quelques conseils pour ce niveau de dépannage.

  • Le journal est complexe et détaillé. Il ne devrait pas être la première place pour démarrer la recherche.
  • Assurez-vous qu'elle capture une valeur au moins trois jours de données. De cette façon, si vous avez une défaillance vendredi soir, les données seront toujours y lorsque vous arrivez le lundi. Chaque journal est 100 MB en taille. Si vous avez besoin augmenter la taille, utiliser le –Size de Set-Clusterlog de commande de Windows Powershell 200 (ou quelle taille en mégaoctets vous spécifiez).
  • Certaines applications sont « bruyant » ou « bavard » dans les journaux. Vous devrez peut-être augmenter la taille du journal, dans l'affirmative.
  • Le journal de débogage de Cluster est généré comme GMT, ainsi vous devrez convertir les fois correspondre lors de la survenue de l'événement réel heure locale.
  • Selon ce que vous voulez voir, utilisez –Destination ou –Timespan.

Le mois prochain, nous vous jetterez grâce à des scénarios courants de dépannage.

John Marlin

**John Marlin**est ingénieur principal soutien escalade dans le groupe de soutien technique commerciale. Il a été avec Microsoft depuis plus de 19 ans, avec 14 dernières années en mettant l'accent sur les serveurs du cluster.

Contenu associé