Guide de surveillance et de résolution des problèmes des groupes de disponibilité Always On

 

THIS TOPIC APPLIES TO: yesSQL Server (starting with 2008) noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

Ce guide vous aide à démarrer sur le dépannage de certains des problèmes courants dans les groupes de disponibilité AlwaysOn et de surveillance des groupes de disponibilité AlwaysOn. Elle est destinée à fournir le contenu d’origine ainsi que d’une page d’accueil d’informations utiles déjà publiées.

Alors que ce guide ne peut pas entièrement traitent de tous les problèmes qui peuvent se produire sur la surface d’exposition volumineux couvert par les groupes de disponibilité AlwaysOn, il peut pointer vous guider dans votre analyse des causes et la résolution des problèmes. Comme les groupes de disponibilité AlwaysOn est une technologie intégrée, la plupart des problèmes que vous rencontrez sont uniquement les symptômes d’autres problèmes dans votre système de base de données. Certains problèmes provoqués par des paramètres dans un groupe de disponibilité, par exemple une base de données en cours d’interruption. Autres problèmes peuvent inclure d’autres aspects de SQL Server, tels que les paramètres de SQL Server, vous pouvez les isoler les problèmes des déploiements de fichiers de base de données et les problèmes de performances systémique non liés au groupe de disponibilité, du réplica ou de la base de données. Toujours d’autres problèmes et existent en dehors de SQL Server, tels que les e/s réseau, TCP/IP, Active Directory et Clustering de basculement Windows Server (WSFC). Souvent, qu’un problèmes de l’aire de conception dans un groupe de disponibilité, réplicas ou base de données vous oblige à résoudre les problèmes de plusieurs technologies avant de pouvoir identifier la racine.

Scénarios de dépannage

Le tableau ci-dessous contient des liens vers les scénarios de résolution des problèmes courants pour les groupes de disponibilité AlwaysOn. Ils sont classés par type de scénario, telles que la configuration, la connectivité client, le basculement et performances.

Scénario Type de scénario Description
Résoudre les problèmes de Configuration des groupes de disponibilité AlwaysOn ( SQL Server ) Configuration Fournit des informations pour vous aider à résoudre les problèmes courants de configuration des instances de serveur pour les groupes de disponibilité AlwaysOn. Problèmes courants de configuration incluent les groupes de disponibilité AlwaysOn est désactivé, comptes sont incorrectement configurés, le point de terminaison de mise en miroir de base de données n’existe pas, le point de terminaison est inaccessible (erreur SQL Server 1418), accès réseau n’existe pas, et une commande de base de données de jointure échoue (erreur SQL Server 35250).
Résoudre les problèmes « validation WSFC configuration de vote du quorum « avertissement Configuration Lorsque vous créez un groupe de disponibilité AlwaysOn à l’aide de l’Assistant Nouveau groupe de disponibilité de Microsoft SQL Server 2012, vous recevez un message d’avertissement similaire au suivant : « la configuration de vote de quorum du cluster WSFC en cours n’est pas recommandée pour ce groupe de disponibilité ».
Résoudre les problèmes lors de la création des écouteurs de groupe de disponibilité Configuration Vous rencontrez des erreurs lorsque vous tentez de créer un écouteur de groupe de disponibilité.
Résoudre les problèmes d’une opération d’ajout de fichier ( Groupes de disponibilité AlwaysOn ) Configuration Une opération d’ajout de fichier a provoqué la base de données secondaire suspendue et être dans l’état NOT SYNCHRONIZING.
Correctif : Erreur 41009 lorsque vous essayez de créer plusieurs groupes de disponibilité Configuration Vous rencontrez une erreur 41009 lorsque vous tentez de créer plusieurs groupes de disponibilité.
Impossible de se connecter à l’écouteur du groupe de disponibilité dans un environnement de sous-réseaux multiples Connectivité client Après avoir configuré l’écouteur du groupe de disponibilité, vous ne parvenez pas à l’écouteur de ping ou de la connecter à partir d’une application.
Résoudre les problèmes d’échec des basculements automatiques Basculement Un basculement automatique n’a pas réussi.
Résoudre les problèmes : Le groupe de disponibilité dépassé RTO Performance Après un basculement automatique ou un basculement manuel planifié sans perte de données, la durée de basculement dépasse votre RTO. Ou bien, lorsque vous estimez le temps de basculement d’un réplica secondaire avec validation synchrone (par exemple, un partenaire de basculement automatique), vous trouvez qu’il dépasse votre RTO.
Résoudre les problèmes : Le groupe de disponibilité dépassé RPO Performance Une fois que vous effectuez un basculement manuel forcé, la perte de données est supérieure à votre RPO. Ou bien, lorsque vous calculez la perte potentielle de données d’un réplica secondaire avec validation asynchrone, vous trouvez qu’il dépasse votre RPO.
Résoudre les problèmes : Les modifications sur le réplica principal ne sont pas répercutées sur le réplica secondaire Performance L’application cliente termine correctement une mise à jour sur le réplica principal, mais interrogeant le réplica secondaire indique que la modification n’est pas reflétée.

Outils utiles pour la résolution des problèmes

Lors de la configuration ou d’exécuter des groupes de disponibilité AlwaysOn, les différents outils peuvent vous aider à diagnostiquer différents types de problèmes. Le tableau ci-dessous fournit des liens vers des informations utiles sur les outils.

Outil Description
Utiliser le tableau de bord Always On (SQL Server Management Studio) Signale une vue en un coup de œil de l’intégrité de votre groupe de disponibilité dans une interface utilisateur conviviale.
Stratégies AlwaysOn Utilisé par le tableau de bord AlwaysOn.
Journal des erreurs SQL Server ( Groupes de disponibilité AlwaysOn ) Journaux des événements de transition pour les groupes de disponibilité, les réplicas et les bases de données, les États d’autres composants AlwaysOn et les erreurs d’AlwaysOn de l’état.
METTRE EN CLUSTER. JOURNAL ( Groupes de disponibilité AlwaysOn ) Journaux des événements, y compris les transitions d’état de la ressource du groupe de disponibilité, ainsi que les événements et les erreurs à partir de la DLL de ressource SQL Server du cluster.
Journal de diagnostic d’intégrité AlwaysOn Journaux de diagnostics de contrôle d’intégrité de SQL Server comme indiqué par le cluster WSFC (DLL de ressource SQL Server) par sp_server_diagnostics ( Transact-SQL ).
Vues de gestion dynamique et des affichages catalogue système ( Groupes de disponibilité AlwaysOn ) Des informations sur les groupes de disponibilité, telles que la configuration, l’état d’intégrité et les mesures de performances.
AlwaysOn événements étendus Fournit des tests de diagnostic détaillées des groupes de disponibilité et utiles pour l’analyse des causes.
Types d’attente d’AlwaysOn Fournit des statistiques d’attente spécifiques aux groupes de disponibilité et utiles pour le réglage des performances.
Compteurs de Performance AlwaysOn Surveiller l’activité des groupes de disponibilité AlwaysOn et sont répercutées dans le Moniteur système et est utiles pour le réglage des performances. Pour plus d’informations, consultez SQL Server, réplica de disponibilité et SQL Server, réplica de base de données.
Met en mémoire tampon en anneau d’AlwaysOn Enregistrement des alertes dans le système de SQL Server pour obtenir des diagnostics internes et peut être utilisé pour déboguer les problèmes liés aux groupes de disponibilité.

Surveillance des groupes de disponibilité AlwaysOn

Le moment idéal pour résoudre les problèmes d’un groupe de disponibilité est avant un problème et nécessite un basculement automatique ou manuelle. Cela est possible en surveillant les métriques de performances du groupe de disponibilité et d’envoyer des alertes lorsque les réplicas de disponibilité s’exécutent en dehors des limites de votre contrat de niveau de service (SLA). Par exemple, si un réplica secondaire synchrone présente des problèmes de performances qui provoquent le temps de basculement estimé à augmenter, vous ne souhaitez pas patienter jusqu'à ce qu’un basculement automatique se produit et vous découvrez que la durée de basculement dépasse votre objectif de temps de récupération.

Groupes de disponibilité AlwaysOn est une haute disponibilité et une solution de récupération d’urgence, les mesures de performances plus importants à surveiller sont le temps de basculement estimé, ce qui affecte votre objectif de temps de récupération (RTO) et la perte potentielle de données en cas de sinistre, ce qui affecte votre objectif de point de récupération (RPO). Vous pouvez collecter ces métriques à partir des données SQL Server expose à un moment donné, donc vous pouvez être averti d’un problème dans les fonctions HADR de votre système avant que les événements d’échec réel se produisent. Par conséquent, il est important de vous familiariser avec le processus de synchronisation des données de groupes de disponibilité AlwaysOn et collecter les métriques en conséquence.

Cette table ci-dessous vous oriente vers les rubriques qui vous aident à surveiller l’intégrité de votre solution de groupes de disponibilité AlwaysOn.

Rubrique Description
Surveiller les performances pour les groupes de disponibilité AlwaysOn Décrit le processus de synchronisation des données pour les groupes de disponibilité AlwaysOn, les portails de contrôle de flux et de mesures utiles lors de l’analyse d’un groupe de disponibilité ; et montre également comment collecter les métriques RTO et le RPO.
Surveillance des groupes de disponibilité ( SQL Server ) Fournit des informations sur les outils de surveillance d’un groupe de disponibilité.
La modèle d’intégrité AlwaysOn partie 1--Architecture du modèle d’intégrité Fournit une vue d’ensemble du modèle de contrôle d’intégrité AlwaysOn.
La modèle d’intégrité AlwaysOn partie 2--extension du modèle de contrôle d’intégrité Montre comment personnaliser le modèle de contrôle d’intégrité AlwaysOn et de personnaliser le tableau de bord AlwaysOn pour afficher des informations supplémentaires.
Analyse l’intégrité AlwaysOn avec PowerShell - partie 1 : vue d’ensemble d’applet de commande Fournit une vue d’ensemble des applets de commande AlwaysOn PowerShell qui peut être utilisé pour analyser l’intégrité d’un groupe de disponibilité.
Analyse l’intégrité AlwaysOn avec PowerShell - partie 2 : utilisation de l’applet de commande avancées Fournit des informations sur l’utilisation avancée d’applets de commande PowerShell d’AlwaysOn pour surveiller l’intégrité d’un groupe de disponibilité.
Analyse l’intégrité AlwaysOn avec PowerShell - partie 3 : Application de surveillance Simple Montre comment contrôler automatiquement un groupe de disponibilité avec une application.
Analyse l’intégrité AlwaysOn avec PowerShell - partie 4 : intégration avec SQL Server Agent Fournit des informations sur la façon d’intégrer l’analyse de groupe de disponibilité avec l’Agent SQL Server et de configurer une notification aux parties appropriées lorsque des problèmes surviennent.

Voir aussi

SQL Server AlwaysOn Team Blog
Serveur SQL CSS ingénieurs Blogs