Compartilhar via


Cluster de Failover do Windows Server com SQL Server

Um cluster WSFC ( Clustering de Failover) do Windows Server é um grupo de servidores independentes que trabalham juntos para aumentar a disponibilidade de aplicativos e serviços. O SQL Server 2014 aproveita os serviços e recursos do WSFC para dar suporte a Grupos de Disponibilidade AlwaysOn e Instâncias de Cluster de Failover do SQL Server.

Termos e definições

Um cluster WSFC (Windows Server Failover Clustering) é um grupo de servidores independentes que trabalham juntos para aumentar a disponibilidade de aplicativos e serviços.

Instância de cluster de failover. Uma instância de um serviço Windows que gerencia um recurso de endereço IP, um recurso de nome de rede e recursos adicionais que são necessários para executar um ou mais aplicativos ou serviços. Os clientes podem usar o nome da rede para acessar os recursos no grupo, semelhante ao uso de um nome de computador para acessar os serviços em um servidor físico. No entanto, como uma instância de cluster de failover é um grupo, ela pode ser realocada para outro nó sem afetar o nome ou o endereço subjacente.

Nó Um sistema do Microsoft Windows Server que é um membro ativo ou inativo de um cluster de servidor.

Recurso de cluster: Uma entidade física ou lógica que pode ser de propriedade de um nó, ativada, desativada, movida entre nós e gerenciada como um recurso de cluster. Um recurso de cluster pode ser de propriedade de apenas um único nó em determinado momento.

Grupo de recursos Uma coleção de recursos de cluster gerenciados como um único objeto de cluster. Normalmente, um grupo de recursos contém todos os recursos de cluster necessários para executar um aplicativo ou serviço específico. O failover e o failback sempre atuam em grupos de recursos.

Dependência de recurso Um recurso do qual outro recurso depende. Se o recurso A depender do recurso B, B será uma dependência de A.

Recurso de nome de rede Um nome de servidor lógico que é gerenciado como um recurso de cluster. Um recurso de nome de rede deve ser usado com um recurso de endereço IP.

Proprietário preferencial: um nó em que um grupo de recursos prefere funcionar. Cada grupo de recursos é associado a uma lista de proprietários preferidos classificados em ordem de preferência. Durante o failover automático, o grupo de recursos é movido para o próximo nó preferido na lista de proprietários preferidos.

Possível proprietário: um nó secundário no qual um recurso pode ser executado. Cada grupo de recursos é associado a uma lista de possíveis proprietários. Os grupos de recursos só podem fazer failover para nós listados como possíveis proprietários.

Modo de quorum A configuração de quorum em um cluster de failover que determina o número de falhas de nó que o cluster pode sustentar.

Quorum forçado O processo para iniciar o cluster, embora apenas uma minoria dos elementos necessários para alcançar quorum esteja em comunicação.

Para obter mais informações, consulte: Glossário de Failover Cluster

Visão geral do Windows Server Failover Clustering

O Windows Server Failover Clustering fornece recursos de infraestrutura que dão suporte aos cenários de alta disponibilidade e recuperação de desastres dos aplicativos de servidor hospedados, como o Microsoft SQL Server e o Microsoft Exchange. Se houver falha em um nó de cluster ou serviço, os serviços que foram hospedados naquele nó poderão ser transferidos automática ou manualmente para outro nó disponível em um processo conhecido como failover.

Os nós no cluster WSFC funcionam juntos para fornecer coletivamente esses tipos de recursos:

  • Metadados distribuídos e notificações. O serviço WSFC e os metadados de aplicativos hospedados são mantidos em cada nó do cluster. Esses metadados incluem a configuração e o status do WSFC, além das configurações dos aplicativos hospedados. As alterações nos metadados ou status de um nó são propagadas automaticamente para os outros nós no cluster.

  • Gerenciamento de recursos. Nódulos individuais no cluster podem fornecer recursos físicos, como armazenamento diretamente anexado, interfaces de rede e acesso ao armazenamento em disco compartilhado. Os aplicativos hospedados se registram como um recurso de cluster e podem configurar dependências de inicialização e saúde em outros recursos.

  • Monitoramento de integridade. A detecção de integridade entre nós e de nó primário é realizada por meio de uma combinação de comunicações de rede de estilo de pulsação e de monitoramento de recursos. A saúde geral do cluster é determinada pelos votos de um quórum de nós no cluster.

  • Coordenação de failover. Cada recurso é configurado para ser hospedado em um nó primário, e cada um deles pode ser transferido automática ou manualmente para um ou mais nós secundários. Uma política de failover baseado em integridade controla a transferência automática de propriedade de recurso entre nós. Nódulos e aplicativos hospedados são notificados quando ocorre uma conmutação por falha para que possam reagir adequadamente.

Para obter mais informações, consulte: Clusters de failover no Windows Server 2008 R2

Tecnologias AlwaysOn do SQL Server e WSFC

O ALWAYSOn do SQL Server 2014 é uma nova solução de alta disponibilidade e recuperação de desastre que aproveita o WSFC. O AlwaysOn fornece uma solução integrada e flexível que aumenta a disponibilidade do aplicativo, fornece melhores retornos sobre investimentos em hardware e simplifica a implantação e o gerenciamento de alta disponibilidade.

Os Always On Availability Groups e as AlwaysOn Failover Cluster Instances utilizam o WSFC como tecnologia de plataforma, registrando componentes como recursos de cluster WSFC. Os recursos relacionados são combinados em um grupo de recursos, que pode se tornar dependente de outros recursos de cluster WSFC. Em seguida, o serviço de cluster WSFC pode detectar e sinalizar a necessidade de reiniciar a instância do SQL Server ou transferi-la automaticamente para um nó diferente do servidor no cluster WSFC.

Importante

Para aproveitar ao máximo as tecnologias AlwaysOn do SQL Server, você deve aplicar vários pré-requisitos relacionados ao WSFC.

Para obter mais informações, consulte: Pré-requisitos, restrições e recomendações para grupos de disponibilidade AlwaysOn (SQL Server)

Alta disponibilidade no nível da instância com AlwaysOn Failover Cluster Instances

Uma Instância de Cluster de Failover AlwaysOn (FCI) é uma instância do SQL Server instalada entre os nós em um cluster WSFC. Esse tipo de instância tem dependências de recurso no armazenamento de disco compartilhado (via Fibre Channel ou iSCSI SAN) e em um nome de rede virtual. O nome da rede virtual tem uma dependência de recurso em um ou mais endereços IP virtuais, cada um em uma sub-rede diferente. O serviço do SQL Server e o serviço SQL Server Agent são registrados como recursos, e ambos são dependentes do recurso de nome de rede virtual.

No caso de um failover, o serviço WSFC transfere a propriedade dos recursos da instância para um nó de failover designado. A instância do SQL Server é reiniciada no nó de failover e os bancos de dados são recuperados normalmente. Em qualquer momento determinado, apenas um único nó do cluster pode hospedar a FCI e os recursos subjacentes.

Observação

Uma Instância de Cluster de Failover AlwaysOn requer um armazenamento de disco compartilhado simétrico, como uma SAN (rede de área de armazenamento) ou um compartilhamento de arquivos SMB. Os volumes de armazenamento de disco compartilhados devem estar disponíveis a todos os nós de failover potenciais no cluster do WSFC.

Para mais informações, consulte: Instâncias de cluster de failover AlwaysOn

Alta disponibilidade no nível de banco de dados com Grupos de Disponibilidade Always On

Um grupo de disponibilidade é um conjunto de bancos de dados de usuário que fazem failover juntos. Um grupo de disponibilidade consiste em uma réplica de disponibilidade primária e em uma a quatro réplicas secundárias que são mantidas pelo movimento de dados baseado em log do SQL Server para proteção de dados, dispensando o armazenamento compartilhado. Cada réplica é hospedada por uma instância do SQL Server em um nó diferente do cluster WSFC. O grupo de disponibilidade e um nome de rede virtual correspondente são registrados como recursos no cluster do WSFC.

Um ouvinte de grupo de disponibilidade no nó de réplica primária responde às solicitações de cliente de entrada para conectar-se ao nome de rede virtual e, com base nos atributos da cadeia de conexão, redireciona cada solicitação à instância apropriada do SQL Server .

No caso de um failover, em vez de transferir a propriedade de recursos físicos compartilhados para outro nó, o WSFC é utilizado para reconfigurar uma réplica secundária em outra instância do SQL Server para se tornar a réplica primária do grupo de disponibilidade. O recurso de nome de rede virtual do grupo de disponibilidade é transferido para aquela instância.

A qualquer momento, apenas uma única instância do SQL Server pode hospedar a réplica primária dos bancos de dados de um grupo de disponibilidade, todas as réplicas secundárias associadas devem residir em uma instância separada e cada instância deve residir em nós físicos separados.

Observação

Os Grupos de Disponibilidade AlwaysOn não exigem a implantação de uma Instância de Cluster de Failover nem o uso do armazenamento compartilhado simétrico (SAN ou SMB).

Uma FCI (Instância de Cluster de Failover) pode ser usada junto com um grupo de disponibilidade para aprimorar a disponibilidade de uma réplica de disponibilidade. Entretanto, para impedir situações de competição potenciais no cluster do WSFC, o failover automático do grupo de disponibilidade não tem suporte de e para uma réplica de disponibilidade que está hospedada em uma FCI ou vice-versa.

Para obter mais informações, consulte: Visão geral dos Grupos de Disponibilidade AlwaysOn (SQL Server)

Monitoramento de integridade e failover do WSFC

A alta disponibilidade para uma solução AlwaysOn é realizada por meio do monitoramento proativo de integridade dos recursos de cluster do WSFC físicos e lógicos, juntamente com o failover automático e reconfiguração do hardware redundante. Um administrador do sistema também pode iniciar um failover manual de um grupo de disponibilidade ou instância do SQL Server de um nó para outro.

Políticas de failover para nós, instâncias de clusters de failover e grupos de disponibilidade

Uma política de failover é configurada no nó do cluster WSFC, na FCI (Instância de Cluster de Failover) do SQL Server e nos níveis do grupo de disponibilidade. Essas políticas, baseadas na severidade, duração e frequência do status do recurso do cluster não íntegro e na capacidade de resposta do nó, podem disparar uma reinicialização do serviço ou um failover automático de recursos do cluster de um nó para outro ou disparar a movimentação de uma réplica primária de grupo de disponibilidade de uma instância do SQL Server para outra.

O failover de uma réplica de grupo de disponibilidade não afeta a instância subjacente do SQL Server. O failover de uma FCI move as réplicas do grupo de disponibilidade hospedado com a instância.

Para mais informações, consulte: Política de Failover para Instâncias de Cluster de Failover

Detecção de saúde de recursos do WSFC

Cada recurso em um nó de cluster do WSFC pode reportar sua integridade e status, periodicamente ou sob demanda. Uma variedade de circunstâncias pode indicar falha de recurso; Por exemplo, falha de energia, erros de disco ou memória, erros de comunicação de rede ou serviços não responsivos.

Os recursos de cluster WSFC, como redes, armazenamento ou serviços, podem ser dependentes uns dos outros. A integridade cumulativa de um recurso é determinada pela acúmulo bem-sucedido de sua integridade com a integridade de cada uma de suas dependências de recurso.

Detecção de saúde entre nós do WSFC e votação de quorum

Cada nó em um cluster do WSFC participa da comunicação de pulsação periódica para compartilhar o status de integridade do nó com os outros nós. Nós sem resposta são considerados como em estado com falha.

Um conjunto de nós de quorum é uma maioria dos nós de votação e testemunhas no cluster WSFC. A integridade geral e o status de um cluster WSFC são determinados por um voto de quorumperiódico. A presença de um quorum significa que o cluster está íntegro e é capaz de fornecer tolerância a falhas no nível de nó.

Um modo de quorum é configurado no nível do cluster WSFC que determina a metodologia usada para votação de quorum e quando executar um failover automático ou colocar o cluster offline.

Dica

É uma boa prática sempre ter um número ímpar de votos de quorum em um cluster WSFC. Para a finalidade da votação de quorum, o SQL Server não precisa ser instalado em todos os nós do cluster. Um servidor adicional pode agir como um membro do quorum, ou o modelo de quorum do WSFC pode ser configurado para usar um compartilhamento de arquivo remoto como um desempatador.

Para obter mais informações, consulte: Modos de quorum WSFC e configuração de votação (SQL Server)

Recuperação de desastre por meio de quorum forçado

Dependendo das práticas operacionais e da configuração do cluster WSFC, você pode incorrer em failovers automáticos e manuais e ainda manter uma solução AlwaysOn robusta e tolerante a falhas do SQL Server. No entanto, se um quorum dos nós de votação qualificados no cluster WSFC não puder se comunicar entre si ou se o cluster WSFC falhar na validação de integridade, o cluster WSFC poderá ficar offline.

Se o cluster WSFC ficar offline devido a um desastre não planejado ou devido a uma falha persistente de hardware ou comunicações, será necessária uma intervenção administrativa manual para forçar um quorum e colocar os nós de cluster sobreviventes novamente online em uma configuração não tolerante a falhas.

Posteriormente, uma série de etapas também devem ser executadas para reconfigurar o cluster WSFC, recuperar as réplicas de banco de dados afetadas e restabelecer um novo quorum.

Para obter mais informações, consulte: Recuperação de desastre do WSFC por meio de quorum forçado (SQL Server)

Relação dos componentes AlwaysOn do SQL Server com o WSFC

Existem várias camadas de relações entre os recursos e componentes do SQL Server AlwaysOn e do WSFC.

Os grupos de disponibilidade AlwaysOn são hospedados em instâncias do SQL Server. Uma solicitação de cliente que especifica um nome de rede de ouvinte de grupo de disponibilidade lógico para conectar-se a um banco de dados primário ou secundário é redirecionada para o nome de rede de instância apropriado da instância subjacente do SQL Server ou da Instância de Cluster de Failover do SQL Server (FCI).

As instâncias do SQL Server estão hospedadas ativamente em um único nó. Quando presente, uma instância autônoma do SQL Server sempre reside em um único nó com um nome de rede de instância estático. Quando presente, uma FCI do SQL Server estará ativa em um entre dois ou mais nós de failover possíveis com um único nome de rede de instância virtual.

Nós são membros de um cluster do WSFC. Os metadados e o status de configuração do WSFC de todos os nós são armazenados em cada nó. Cada servidor pode fornecer armazenamento assimétrico ou volumes de SAN (armazenamento compartilhado) para bancos de dados de usuário ou sistema. Cada servidor tem pelo menos uma interface de rede física em uma ou mais sub-redes IP.

O serviço WSFC monitora a integridade e gerencia a configuração de um grupo de servidores. O serviço WSFC (Cluster de Failover do Windows Server) propaga alterações nos metadados e no status da Configuração do WSFC para todos os nós no cluster. Metadados parciais e status podem ser armazenados em um compartilhamento de arquivos remotos para testemunha de quorum do WSFC. Dois ou mais nós ativos ou testemunhas constituem um quórum para votar sobre a integridade do cluster WSFC.

As chaves do Registro de Grupos de Disponibilidade AlwaysOn são subchaves do cluster WSFC. Se você excluir e recriar um cluster WSFC, deverá desabilitar e reabilitar o recurso Grupos de Disponibilidade AlwaysOn em cada instância de servidor habilitada para Grupos de Disponibilidade AlwaysOn no cluster WSFC original. Para obter mais informações, consulte Habilitar e desabilitar grupos de disponibilidade AlwaysOn (SQL Server).

Diagrama de contexto do componente AlwaysOn do SQL Server

Tarefas Relacionadas

Conteúdo relacionado

Consulte Também

Instâncias de Cluster de Failover AlwaysOn (SQL Server)Visão Geral dos Grupos de Disponibilidade AlwaysOn (SQL Server)Modos de Quorum e Configuração de Votação do WSFC (SQL Server)Política de Failover para Instâncias de Cluster de FailoverRecuperação de Desastre do WSFC por Meio de Quorum Forçado (SQL Server)