Compartilhar via


Diferenças entre os modos de disponibilidade de um Grupo de Disponibilidade AlwaysOn

Aplica-se:SQL Server

No Grupos de disponibilidade AlwaysOn, o modo de disponibilidade é uma propriedade de réplica que determina se uma determinada réplica de disponibilidade pode ser executada em modo de confirmação síncrona. Para cada réplica de disponibilidade, o modo de disponibilidade deve ser configurado para o modo de confirmação síncrona, modo de confirmação assíncrona ou modo somente configuração. Se a réplica primária estiver configurada para o modo de confirmação assíncrona, ela não aguardará que nenhuma réplica secundária escreva registros de log de transações de entrada no disco (para proteger o log). Se uma réplica secundária específica estiver configurada para o modo de confirmação assíncrona, a réplica primária não aguardará que a réplica secundária proteja o log. Se a réplica primária e uma determinada réplica secundária forem ambas configuradas para modo de confirmação síncrona, a réplica primária aguardará que a réplica secundária confirme que protegeu o log (a menos que a réplica secundária não execute ping na réplica primária dentro do período do tempo limite de sessãodela).

Observação

Se período do tempo limite de sessão primário for excedido por uma réplica secundária, a réplica primária deslocará temporariamente em modo de confirmação assíncrona para a réplica secundária. Quando a réplica secundária se reconecta com a réplica primária, elas retomam o modo de confirmação síncrona.

Modos de disponibilidade suportados

Os grupos de disponibilidade Always On dão suporte a três modos de disponibilidade:

  • Modo de confirmação assíncrona
  • Modo de confirmação síncrona
  • Modo somente de configuração

OModo de confirmação assíncrona é uma solução de recuperação de desastre que funciona bem quando as réplicas de disponibilidade são distribuídas em distâncias consideráveis. Se cada réplica secundária estiver em execução no modo de confirmação assíncrona, a réplica primária não aguardará que nenhuma das réplicas secundárias proteja o log. Em vez disso, imediatamente após gravar um registro de log no arquivo de log local, a réplica primária enviará a confirmação de transação ao cliente. A réplica primária é executada com latência de transação mínima em relação a uma réplica secundária configurada para o modo de confirmação assíncrona. Se o primário atual estiver configurado para o modo de disponibilidade de confirmação assíncrona, ele realizará a confirmação de transações de forma assíncrona para todas as réplicas secundárias, independentemente das configurações individuais de modo de disponibilidade destas.

Para obter mais informações, consulte Modo de disponibilidade de confirmação assíncrona, posteriormente neste tópico.

OModo de confirmação síncrona enfatiza a alta disponibilidade sobre o desempenho, à custa do aumento da latência da transação. No modo de confirmação síncrona, as transações aguardam para enviar a confirmação de transação para o cliente até que a réplica secundária proteja o log no disco. Quando sincronização de dados começar em um banco de dados secundário, a réplica secundária começará a aplicar registros de log de entrada do banco de dados primário correspondente. Assim que todo registro de log for protegido, o banco de dados secundário entrará no estado SYNCHRONIZED. Portanto, cada nova transação é protegida pela réplica secundária antes de o registro de log ser gravado no arquivo de log local. Quando todos os bancos de dados secundários de uma determinada réplica secundária são sincronizados, o modo de confirmação síncrona oferece suporte ao failover manual e, opcionalmente, ao failover automático.

Para obter mais informações, consulte Modo de disponibilidade de confirmação síncrona, posteriormente neste tópico.

Modo somente de configuração se aplica a grupos de disponibilidade que não estão em um Cluster de Failover do Windows Server. Uma réplica no modo somente configuração não contém dados do usuário. No modo somente configuração, o banco de dados mestre de réplica armazena metadados de configuração do grupo de disponibilidade. Para obter mais informações, consulte Grupo de disponibilidade com réplica somente configuração.

A ilustração a seguir mostra um grupo de disponibilidade com cinco réplicas de disponibilidade. A réplica primária e a réplica secundária estão configuradas para modo de confirmação síncrona com failover automático. Outra réplica secundária está configurada para o modo de confirmação síncrona apenas com failover manual planejado e duas réplicas secundárias estão configuradas para o modo de confirmação assíncrona, que dá suporte somente a failover manual forçado (geralmente denominado failover forçado).

Disponibilidade e modos de failover de réplicas

O comportamento de sincronização e failover entre duas réplicas de disponibilidade depende do modo em que ambas estão configuradas. Por exemplo, para que a confirmação síncrona ocorra, a réplica primária e a réplica secundária devem ser configuradas para confirmação síncrona. Da mesma forma, para o failover automático, ambas as réplicas precisam ser configuradas para o failover automático. Portanto, o comportamento do cenário de implantação ilustrado anteriormente pode ser resumido na tabela a seguir, que explora o comportamento com cada réplica primária potencial:

Réplica Primária Atual Destinos de failover automático Comportamento do modo de confirmação síncrona com Comportamento do modo de confirmação assíncrona com Failover automático possível
01 02 02 e 03 04 Sim
02 01 01 e 03 04 Sim
03 01 e 02 04 Não
04 01, 02 e 03 Não

Normalmente, o Nó 04 como uma réplica de confirmação assíncrona é implantado em um site de recuperação de desastre. A permanência dos Nós 01, 02 e 03 no modo de confirmação assíncrona depois do failover no Nó 04 impede a degradação de desempenho potencial em seu grupo de disponibilidade devido à alta latência da rede entre os dois sites.

Modo de disponibilidade de confirmação assíncrona

No modo de confirmação assíncrona, a réplica secundária nunca é sincronizada com a réplica primária. Embora um determinado banco de dados secundário possa ficar em dia com o banco de dados primário correspondente, qualquer banco de dados secundário pode se atrasar em qualquer ponto. O modo de confirmação assíncrona pode ser útil em um cenário de recuperação de desastre no qual a réplica primária e a réplica secundária são separadas por uma distância significativa e onde você não deseja que pequenos erros afetem a réplica primária ou em situações em que o desempenho seja mais importante do que a proteção de dados sincronizada. Além disso, como a réplica primária não aguarda confirmações da réplica secundária, os problemas na réplica secundária nunca afetam a réplica primária.

Uma réplica secundária de confirmação assíncrona tenta acompanhar os registros de log recebidos da réplica primária. Mas bancos de dados secundários de confirmação assíncrona sempre permanecem não sincronizados e têm a tendência de ficarem desatualizados em relação aos bancos de dados primários correspondentes. Normalmente, é pequeno o intervalo entre um banco de dados secundário de confirmação assíncrona e o banco de dados primário correspondente. Mas o intervalo poderá ficar significativo se o servidor que hospeda a réplica secundária estiver sobrecarregado ou se a rede estiver lenta.

A única forma de failover com suporte no modo de confirmação assíncrona é o failover forçado (com possível perda de dados). Forçar o failover é o último recurso, que deve ser usado apenas em situações nas quais a réplica primária atual permanecerá indisponível por um período estendido e a disponibilidade imediata dos bancos de dados primários é mais crítica que o risco da possível perda de dados. O destino do failover deve ser uma réplica cuja função está no estado SECONDARY ou RESOLVING. As transições de destino do failover para a função primária e as cópias dos bancos de dados se tornam o banco de dados primário. Qualquer banco de dados secundário restante, junto com os bancos de dados primários antigos, quando ficam disponíveis, é suspenso manualmente até você os retome individualmente. No modo de confirmação assíncrona, todos os logs de transação que a réplica primária original ainda não havia enviado para a réplica secundária anterior foram perdidos. Isso significa que alguns ou todos os novos bancos de dados primários podem estar sem as transações confirmadas recentemente. Para obter mais informações sobre o funcionamento do failover forçado e sobre as melhores práticas para utilizá-lo, consulte Failover e modos de failover (Grupos de disponibilidade AlwaysOn).

Modo de disponibilidade com confirmação síncrona

No modo de disponibilidade de confirmação síncrona (modo de confirmação síncrona), depois de ingressar em um grupo de disponibilidade, cada banco de dados secundário fica em dia com o banco de dados primário correspondente e entra no estado SYNCHRONIZED. O banco de dados secundário permanece SYNCHRONIZED contanto que a sincronização de dados continue. Isso garante que todas as transações confirmadas em um determinado banco de dados primário sejam confirmadas no banco de dados secundário correspondente. Quando cada banco de dados secundário de uma determinada réplica secundária for sincronizado, o estado de integridade de sincronização da réplica secundária como um todo será HEALTHY.

Nesta seção:

Fatores que interrompem a sincronização de dados

Quando todos seus bancos de dados estiverem sincronizados, uma réplica secundária inserirá o estado de HEALTHY. A réplica secundária sincronizada permanecerá íntegra a menos que uma das seguintes condições ocorra:

  • Um atraso ou falha na rede ou no computador faz com que a sessão entre a réplica secundária e a réplica primária atinja o tempo limite.

    Observação

    Para obter informações sobre a propriedade de tempo da sessão das réplicas de disponibilidade, confira Visão geral dos grupos de disponibilidade AlwaysOn (SQL Server).

  • Você suspende um banco de dados secundário na réplica secundária. A réplica secundária para de ser sincronizada e seu estado da integridade de sincronização é marcado como NOT_HEALTHY. A réplica secundária não poderá ficar íntegra novamente até que o banco de dados secundário suspenso seja retomado e ressincronizado ou removido do grupo de disponibilidade.

  • Você adiciona um banco de dados primário ao grupo de disponibilidade. As réplicas secundárias previamente sincronizadas inserem o estado da integridade de sincronização NOT_HEALTHY. Este estado indica que pelo menos um banco de dados está no estado de sincronização NOT SYNCHRONIZING. Uma réplica secundária específica não poderá estar SAUDÁVEL novamente até que um banco de dados secundário correspondente tenha sido preparado na réplica, unido ao grupo de disponibilidade e sincronizado com o novo banco de dados primário.

  • Você altera a réplica primária ou a réplica secundária para o modo de disponibilidade de confirmação assíncrona. Depois de alterar para o modo de confirmação assíncrona, a réplica secundária permanecerá no estado de integridade de sincronização HEALTHY contanto que a sincronização de dados continue. No entanto, se somente a réplica primária for alterada para o modo de confirmação assíncrona, a réplica secundária de confirmação síncrona inserirá o estado da integridade de sincronização PARTIALLY_HEALTHY. Este estado indica que pelo menos um banco de dados está no estado de sincronização SYNCHRONIZING, mas nenhum dos bancos de dados está no estado NOT SYNCHRONIZING.

  • Você altere qualquer réplica secundária para o modo de disponibilidade de confirmação síncrona. Isso faz com que a réplica secundária seja marcada como estando no estado de integridade de sincronização PARTIALLY_HEALTHY até que todos os bancos de dados estejam no estado de sincronização SYNCHRONIZED.

Dica

Para exibir a integridade de sincronização de um grupo de disponibilidade, réplica de disponibilidade ou banco de dados de disponibilidade, consulte a coluna synchronization_health ou synchronization_health_desc de sys.dm_hadr_availability_group_states, sys.dm_hadr_availability_replica_statesou sys.dm_hadr_database_replica_states, respectivamente.

Como a sincronização funciona em uma réplica secundária

No modo de confirmação síncrona, depois que uma réplica secundária ingressa no grupo de disponibilidade e estabelece uma sessão com a réplica primária:

  1. A réplica secundária grava registros de log de entrada no disco (consolida o log).
  2. A réplica secundária envia uma mensagem de confirmação para a réplica primária.

Depois que o log consolidado no banco de dados secundário alcançar o final do log no banco de dados primário, o estado do banco de dados secundário será definido como SINCRONIZADO.

O tempo necessário para a sincronização depende de quão longe o banco de dados secundário estava atrás do banco de dados primário no início da sessão. Esse delta é medido pelo número de registros de log recebidos inicialmente da réplica primária, pela carga de trabalho no banco de dados primário e pela velocidade do host da instância da réplica secundária.

O processo de transação

No modo de confirmação síncrona, as transações são confirmadas em ambas as réplicas nesta ordem:

  1. A réplica primária recebe uma transação de um cliente.

  2. A réplica primária grava o registro no log de transações e envia simultaneamente o registro de log para as réplicas secundárias.

    Depois que um registro de log é gravado no log de transações do banco de dados primário, a transação só pode ser desfeita caso haja um failover para um secundário que não recebeu o log.

  3. A réplica primária aguarda confirmação da réplica secundária de confirmação síncrona.

  4. A réplica secundária endurece o log e retorna uma confirmação para a réplica primária.

  5. A réplica primária conclui o processamento de confirmação e envia uma mensagem de confirmação ao cliente.

Tempo limite de confirmação síncrona

Se uma réplica secundária de confirmação síncrona atingir o tempo limite sem confirmar se ela protegeu o log, as seguintes ações ocorrerão no grupo de disponibilidade:

  1. A réplica primária marca a réplica secundária como defeituosa.
  2. O estado da réplica secundária é alterado para DESCONECTADO.
  3. O sistema primário para de aguardar a confirmação.
  4. O grupo de disponibilidade marca o estado de sincronização como NOT SYNCHRONIZING e o estado da réplica como NOT_HEALTHY.

Esse comportamento garante que uma réplica secundária com falha de confirmação síncrona não impeça o endurecimento do log na réplica primária.

Quando a réplica secundária estiver online novamente:

  1. O estado da réplica secundária muda para CONNECTED.
  2. A réplica secundária processa a fila de envio de log da réplica primária.
  3. O estado de sincronização transita para SYNCHRONIZING e o estado de integridade da réplica para PARTIALLY_HEALTHY.

Depois que a fila de envio de log é processada, o estado de sincronização se torna SINCRONIZADO e a integridade da réplica torna-se SAUDÁVEL.

O modo de confirmação síncrona protege seus dados exigindo a sincronização dos dados entre dois locais, às custas de algum aumento da latência da transação.

Modo de confirmação síncrona com apenas failover manual

Quando essas réplicas forem conectadas e o banco de dados for sincronizado, haverá suporte ao failover manual. Se a réplica secundária for desativada, a réplica primária não será afetada. A réplica primária será executada exposta se não houver nenhuma réplica SYNCHRONIZED (ou seja, sem enviar dados a nenhuma réplica secundária). Se a réplica primária for perdida, as réplicas secundárias entrarão no estado RESOLVING, mas o proprietário do banco de dados poderá forçar um failover na réplica secundária (com possível perda de dados). Para obter mais informações, confira Failover e Modos de Failover (Grupos de Disponibilidade AlwaysOn).

Modo de confirmação síncrona com failover automático

O failover automático fornece alta disponibilidade, assegurando que o banco de dados seja rapidamente disponibilizado novamente após a perda da réplica primária. Para configurar um grupo de disponibilidade para failover automático, você precisará definir a réplica primária atual e pelo menos uma secundária para o modo de confirmação síncrona com failover automático. O SQL Server 2019 (15.x) aumentou o número máximo de réplicas síncronas para 5, em comparação com 3 no SQL Server 2017 (14.x). Você pode configurar esse grupo de cinco réplicas para ter failover automático dentro do grupo. Há uma réplica primária, além de quatro réplicas secundárias síncronas.

Além disso, para que um failover automático seja possível em um determinado momento, esta réplica secundária deverá ser sincronizada com a réplica primária (quer dizer, os bancos de dados secundários são todos sincronizados) e o cluster WSFC (Windows Server Failover Clustering) deverá ter quorum. Se a réplica primária ficar indisponível nessas condições, ocorrerá um failover automático. A réplica secundária alterna para a função da réplica primária e oferece seu banco de dados como banco de dados primário. Para obter mais informações, confira a seção "Failover automático" do tópico Failover e modos de failover (grupos de disponibilidade AlwaysOn).

Observação

Para obter informações sobre o quórum WSFC e Grupos de disponibilidade Always On, confira Configuração de modos de quórum WSFC e votação (SQL Server).

Latência de dados na réplica secundária

A implementação do acesso somente leitura a réplicas secundárias será útil se as suas cargas de trabalho somente leitura puderem tolerar certa latência de dados. Nas situações em que a latência de dados é inaceitável, considere executar cargas de trabalho somente leitura na réplica primária.

A réplica primária envia registros de log de alterações no banco de dados primário para as réplicas secundárias. Em cada banco de dados secundário, um thread de restauração dedicado aplica os registros de log. Em um banco de dados secundário de acesso de leitura, uma determinada alteração de dados não aparece nos resultados da consulta até que o registro de log que contém a alteração tenha sido aplicado ao banco de dados secundário e a transação tenha sido confirmada no banco de dados primário.

Isso significa que há alguma latência, geralmente apenas uma questão de segundos, entre as réplicas primária e secundária. No entanto, em casos incomuns, como quando problemas de rede reduzem a taxa de transferência, a latência pode se tornar significativa. A latência aumenta quando ocorrem gargalos de E/S e quando a movimentação de dados é suspensa. Para monitorar a movimentação de dados suspensa, você pode usar o Painel Always On ou a exibição de gerenciamento dinâmico sys.dm_hadr_database_replica_states.

A partir da versão prévia do SQL Server 2025 (17.x), para reduzir a latência, você pode reduzir o tempo, em milissegundos, que a réplica primária leva para confirmar transações para a réplica secundária. Examine o tempo de confirmação do grupo de disponibilidade (ms) para saber mais.

Para alterar o modo de disponibilidade e o modo de failover

Para ajustar votos de quorum

Para executar um failover manual

Para exibir um grupo de disponibilidade, réplica de disponibilidade e estados de bancos de dados.

Conteúdo relacionado

Consulte também

Visão geral dos Grupos de Disponibilidade AlwaysOn (SQL Server)
Failover e modos de failover (Grupos de Disponibilidade AlwaysOn)
WSFC (Windows Server Failover Clustering) com o SQL Server