Guia de solução de problemas e monitoramento dos grupos de disponibilidade AlwaysOn
THIS TOPIC APPLIES TO: SQL Server (starting with 2008) Azure SQL Database Azure SQL Data Warehouse Parallel Data Warehouse
Este guia ajuda você a começar a solução de problemas alguns dos problemas comuns em grupos de disponibilidade do AlwaysOn e monitorando grupos de disponibilidade do AlwaysOn. Destina-se a fornecer conteúdo original, bem como uma página inicial de informações úteis que já estão publicadas em outro lugar.
Embora este guia não é totalmente discutir todos os problemas que podem ocorrer na área de superfície grande compreendida pelos grupos de disponibilidade do AlwaysOn, ele pode indicar a direção certa em sua análise da causa raiz e a resolução dos problemas. Como grupos de disponibilidade AlwaysOn é uma tecnologia integrada, muitos dos problemas encontrados são apenas os sintomas de outros problemas no seu sistema de banco de dados. Alguns problemas são causados por configurações dentro de um grupo de disponibilidade, como um banco de dados de disponibilidade que está sendo suspenso. Outros problemas podem incluir problemas que você pode isolar os outros aspectos do SQL Server, como configurações do SQL Server, as implantações de arquivos de banco de dados e problemas de desempenho do sistema não relacionados para o grupo de disponibilidade, réplicas ou banco de dados. Ainda outros problemas e que existem fora do SQL Server, como e/s de rede, TCP/IP, Active Directory e Windows Server Failover Clustering (WSFC). Muitas vezes, causam problemas que superfície em um grupo de disponibilidade, réplicas ou banco de dados exige que você solucionar problemas de várias tecnologias para poder identificar a raiz.
Cenários de solução de problemas
A tabela a seguir contém links para os cenários de solução de problemas comuns para grupos de disponibilidade do AlwaysOn. Eles são categorizados por tipo de cenário, como configuração, conectividade de cliente, failover e desempenho.
Cenário | Tipo de cenário | Description |
---|---|---|
Solucionar problemas de configuração de grupos de disponibilidade do AlwaysOn ( SQL Server ) | Configuração | Fornece informações para ajudá-lo a solucionar problemas típicos ao configurar instâncias de servidor para grupos de disponibilidade do AlwaysOn. Problemas de configuração típicos incluem grupos de disponibilidade AlwaysOn está desabilitado, contas estão configuradas incorretamente, o ponto de extremidade de espelhamento de banco de dados não existe, o ponto de extremidade está inacessível (erro 1418 do SQL Server), acesso à rede não existe e falha de um comando de banco de dados de associação (erro 35250 do servidor SQL). |
Solucionar problemas de "Validando WSFC configuração de voto de quorum" aviso | Configuração | Quando você cria um grupo de disponibilidade AlwaysOn usando o Assistente de novo grupo de disponibilidade do Microsoft SQL Server 2012, você receberá uma mensagem de aviso semelhante ao seguinte: "configuração de voto de quorum de cluster WSFC atual não é recomendada para este grupo de disponibilidade." |
Solucionar problemas ao criar ouvintes de grupo de disponibilidade | Configuração | Você encontrar erros ao tentar criar um ouvinte de grupo de disponibilidade. |
Solucionar problemas de uma operação adicionar arquivo com falha ( Grupos de disponibilidade AlwaysOn ) | Configuração | Uma operação de adicionar arquivo causou o banco de dados secundário ser suspenso e estar no estado NOT SYNCHRONIZING. |
Correção: Erro 41009 quando você tentar criar vários grupos de disponibilidade | Configuração | Encontrar erro 41009 ao tentar criar vários grupos de disponibilidade. |
Não é possível conectar-se ao ouvinte do grupo de disponibilidade em um ambiente de várias sub-redes | Conectividade de cliente | Depois de configurar o ouvinte do grupo de disponibilidade, não será possível fazer ping do ouvinte ou se conectar a ele partir de um aplicativo. |
Solucionar problemas de failovers automáticos com falha | Failover | Um failover automático não foi concluída com êxito. |
Solução de problemas: O grupo de disponibilidade excedeu o RTO | Desempenho | Após um failover automático ou um failover manual planejado, sem perda de dados, o tempo de failover excede o RTO. Ou, quando você calcular o tempo de failover de uma réplica secundária de confirmação síncrona (como um parceiro de failover automático), você descubra que excede o RTO. |
Solução de problemas: O grupo de disponibilidade excedeu o RPO | Desempenho | Depois de executar um failover manual forçado, a perda de dados é maior que o RPO. Ou, ao calcular a potencial perda de dados de uma réplica secundária de confirmação assíncrona, você descobrir que excede o RPO. |
Solução de problemas: As alterações na réplica primária não são refletidas na réplica secundária | Desempenho | O aplicativo cliente conclui uma atualização na réplica primária com êxito, mas consultando a réplica secundária mostra que a alteração não será refletida. |
Ferramentas úteis para solucionar problemas
Ao configurar ou executando grupos de disponibilidade do AlwaysOn, as diferentes ferramentas podem ajudá-lo a diagnosticar diferentes tipos de problemas. A tabela a seguir fornece links para informações úteis sobre as ferramentas.
Ferramenta | Description |
---|---|
Usar o Painel AlwaysOn (SQL Server Management Studio) | Relatórios de uma exibição de um instantâneo da integridade de seu grupo de disponibilidade em uma interface fácil de usar. |
Políticas AlwaysOn | Usado pelo painel AlwaysOn. |
Log de erros do SQL Server ( Grupos de disponibilidade AlwaysOn ) | Logs de eventos de transição para grupos de disponibilidade, réplicas e bancos de dados, status de outros componentes AlwaysOn e erros do AlwaysOn do estado. |
CLUSTER. LOG ( Grupos de disponibilidade AlwaysOn ) | Logs de eventos, inclusive as transições de estado do recurso de grupo de disponibilidade, bem como eventos e erros de DLL de recursos do SQL Server do cluster. |
Log de diagnóstico de integridade do AlwaysOn | Logs de diagnóstico de integridade do SQL Server conforme relatado para o cluster WSFC (DLL de recurso do SQL Server) pelo sp_server_diagnostics ( Transact-SQL ). |
Exibições de gerenciamento dinâmico e exibições de catálogo do sistema ( Grupos de disponibilidade AlwaysOn ) | Fornece informações sobre os grupos de disponibilidade como métricas de desempenho, configuração e status de integridade. |
Eventos estendidos do AlwaysOn | Fornece o diagnóstico detalhados dos grupos de disponibilidade e são úteis para análise da causa raiz. |
Tipos de espera do AlwaysOn | Fornece estatísticas de espera específicas para grupos de disponibilidade e são úteis para ajuste de desempenho. |
Contadores de desempenho do AlwaysOn | Monitorar a atividade de grupos de disponibilidade AlwaysOn e são refletidas no Monitor do sistema e é útil para ajuste de desempenho. Para obter mais informações, consulte do SQL Server, réplica de disponibilidade e SQL Server, réplica de banco de dados. |
Buffers de anel do AlwaysOn | Registrar alertas dentro do sistema do SQL Server para diagnósticos internos e pode ser usado para depurar problemas relacionados aos grupos de disponibilidade. |
Monitorando grupos de disponibilidade do AlwaysOn
O momento ideal para solucionar problemas de um grupo de disponibilidade é antes de um problema exige um failover automático ou manual. Isso pode ser feito pelo monitoramento de métricas de desempenho do grupo de disponibilidade e enviar alertas quando estiver executando as réplicas de disponibilidade fora dos limites do seu contrato de nível de serviço (SLA). Por exemplo, se uma réplica secundária síncrona tiver problemas de desempenho que fazer com que o tempo estimado de failover aumentar, você não deseja Aguarde até que um failover automático ocorre e você descobrir que o tempo de failover excede seu objetivo de tempo de recuperação.
Como grupos de disponibilidade AlwaysOn é uma alta disponibilidade e a solução de recuperação de desastres, as métricas de desempenho mais importantes para monitorar são o tempo estimado de failover, que afeta o seu objetivo de tempo de recuperação (RTO) e a potencial perda de dados em um desastre, o que afeta o seu objetivo de ponto de recuperação (RPO). Você pode reunir essas métricas dos dados do SQL Server expõe a qualquer momento, para que você pode ser alertado de um problema nas capacidades HADR de seu sistema antes de ocorrer os eventos de falha real. Portanto, é importante para se familiarizar com o processo de sincronização de dados dos grupos de disponibilidade do AlwaysOn e coletar as métricas de acordo.
A tabela abaixo aponta você para tópicos que podem ajudá-lo a monitorar a integridade de sua solução de grupos de disponibilidade AlwaysOn.
Tópico | Description |
---|---|
Monitorar o desempenho para grupos de disponibilidade do AlwaysOn | Descreve o processo de sincronização de dados para grupos de disponibilidade AlwaysOn, as entradas de controle de fluxo e métricas úteis ao monitorar um grupo de disponibilidade; e também mostra como coletar métricas RTO e RPO. |
Monitoramento de grupos de disponibilidade ( SQL Server ) | Fornece informações sobre ferramentas para monitorar um grupo de disponibilidade. |
O modelo de integridade AlwaysOn parte 1 – arquitetura do modelo de integridade | Fornece uma visão geral do modelo de integridade do AlwaysOn. |
O modelo de integridade AlwaysOn parte 2 – estendendo o modelo de integridade | Mostra como personalizar o modelo de integridade do AlwaysOn e personalizar o painel AlwaysOn para mostrar informações extras. |
Monitorando a integridade do AlwaysOn com o PowerShell - parte 1: Visão geral básica de Cmdlet | Fornece uma visão geral básica do AlwaysOn cmdlets do PowerShell que pode ser usados para monitorar a integridade de um grupo de disponibilidade. |
Monitorando a integridade do AlwaysOn com o PowerShell - parte 2: uso avançado do Cmdlet | Fornece informações sobre o uso avançado de cmdlets do PowerShell de AlwaysOn para monitorar a integridade de um grupo de disponibilidade. |
Monitorando a integridade do AlwaysOn com o PowerShell - parte 3: um simples aplicativo de monitoramento | Mostra como monitorar automaticamente um grupo de disponibilidade com um aplicativo. |
Monitorando a integridade do AlwaysOn com o PowerShell - parte 4: integração com o SQL Server Agent | Fornece informações sobre como integrar o monitoramento do grupo de disponibilidade com o SQL Server Agent e configurar a notificação para as pessoas apropriadas quando surgem problemas. |
Consulte também
Blog da equipe do AlwaysOn do SQL Server
Blogs dos engenheiros do CSS SQL Server