Definir clustering de failover do Windows Server

Concluído

A maioria das organizações e empresas, incluindo a Contoso, se esforça para garantir a alta disponibilidade de suas cargas de trabalho críticas. A Contoso pode considerar o uso do clustering de failover do Windows Server. Esse é um recurso do Windows Server que fornece alta disponibilidade de cargas de trabalho comuns baseadas no Windows, incluindo compartilhamentos de arquivos, VMs (máquinas virtuais), sistemas de gerenciamento de banco de dados e serviços de mensagens.

Visão geral do clustering de failover

Para obter alta disponibilidade de cargas de trabalho, você cria um cluster de failover que consiste em vários computadores Windows Server. Se um servidor que faz parte de um cluster de failover falhar ou ficar indisponível, outro servidor no mesmo cluster de failover assumirá os serviços que o nó com falha estava executando. Isso chama-se failover e resulta em interrupções mínimas de serviço para clientes que acessam o serviço.

Os usos mais comuns do clustering de failover incluem:

  • Compartilhamentos de arquivos altamente ou continuamente disponíveis hospedando bancos de dados do Microsoft SQL Server e arquivos de disco e configuração das VMS do Microsoft Hyper-V.
  • Serviços e aplicativos altamente disponíveis que são executados em servidores físicos ou em VMs convidadas hospedadas em servidores Hyper-V clusterizados.

Componentes do clustering de failover

Um cluster de failover consiste nos componentes descritos na tabela a seguir.

Componente Descrição
Nodos Computadores Windows Server que são membros de um cluster de failover. Esses computadores têm o recurso de clustering de failover do Windows Server instalado e executam cargas de trabalho altamente disponíveis que consistem em serviços, aplicativos e recursos.
Clientes Computadores que consomem serviços e aplicativos altamente disponíveis em execução em um cluster de failover. Deve haver vários caminhos de rede entre os clientes e o cluster.
Redes Permitem a comunicação entre nós e computadores consumindo cargas de trabalho clusterizadas. Além disso, os nós acessam frequentemente o armazenamento compartilhado.
Função agrupada Uma função ou um serviço altamente disponível que é executado no nó de cluster. Os clientes consomem esse serviço conectando-se ao nó de cluster. Se um serviço desse tipo ficar indisponível em um nó, o cluster fará failover automaticamente para outro nó.
Recursos Elementos físicos ou lógicos, como uma pasta compartilhada, disco ou endereço IP, que o cluster de failover gerencia. Os recursos podem fornecer serviço aos clientes ou podem ser partes integrais de aplicativos altamente disponíveis. Um recurso pode ser executado somente em um nó por vez.
Armazenamento de cluster Além de seu próprio armazenamento local, onde o sistema operacional do Windows Server está instalado, cada nó de cluster tem acesso ao armazenamento compartilhado altamente disponível, onde residem os dados e a configuração do aplicativo. Por exemplo, o armazenamento de cluster hospeda dados de configuração e discos rígidos virtuais de VMs convidadas altamente disponíveis.

Uma representação da arquitetura de um cluster de failover com dois nós e armazenamento compartilhado.

Observação

O armazenamento compartilhado não precisa ser anexado diretamente a vários nós. A tecnologia Espaços de Armazenamento Diretos introduzida no Windows Server 2016 permite o compartilhamento de discos anexados a nós individuais.

Níveis funcionais de clustering de failover

Os recursos de clustering de failover do Windows Server dependem do nível funcional do cluster. Em geral, você gostaria de garantir que o cluster use o nível funcional mais alto possível. No entanto, o suporte para níveis funcionais mais baixos no Windows Server 2016 e no Windows Server 2025 permite que você execute atualizações sem interrupção de clusters de failover que executam versões anteriores do sistema operacional. Dessa forma, durante uma atualização, é possível ter nós do Windows Server 2016 e do Windows Server 2025 no mesmo cluster de failover, eliminando a necessidade de tempo de inatividade.

Dica

Depois que todos os nós que estavam executando o Windows Server 2016 tiverem sido substituídos por nós do Windows Server 2025, você poderá atualizar o nível funcional do cluster.

Quórum do clustering de failover

Em um cluster de failover, o termo quorum representa o número de componentes de clustering que devem estar disponíveis para que o cluster permaneça online. Esses componentes podem incluir os nós de cluster e uma testemunha. O termo testemunha designa um recurso cuja função é estabelecer e manter um quorum. Para essa finalidade, um cluster de failover pode usar:

  • Um compartilhamento de arquivo
  • Um disco
  • Um blob no Armazenamento do Azure

O quórum é determinado com base no número de votos associados aos nós de cluster e à testemunha. A finalidade do quorum é evitar o cenário de "cérebro dividido". Nesse cenário, como resultado de problemas de conectividade de internodos, dois conjuntos de nós em um cluster poderiam potencialmente começar a operar independentemente uns dos outros, resultando na corrupção do estado do cluster e de seus recursos.

O modelo de quorum define a alocação de votos. O cluster de failover do Windows Server oferece gerenciamento dinâmico de quórum. Isso oferece maior disponibilidade em um cluster de failover, monitorando e ajustando continuamente o modelo de quórum com base nos nós de cluster disponíveis.

O cálculo de quorum do cluster é ajustado quando o número de nós é alterado. Mesmo que um cluster de failover tenha menos de 50% do número original de nós, o cluster de failover continuará funcionando, e as funções de cluster ainda estarão disponíveis. Com o quorum dinâmico habilitado, um cluster de failover pode sobreviver com apenas um nó em execução.

Observação

O modelo de quorum dinâmico é habilitado por padrão.

O clustering de failover também dá suporte aos seguintes recursos relacionados ao quórum:

  • Pesos de nó. O Windows Server usa o peso do nó de cluster principalmente nos ambientes em que os nós de failover estão em vários locais físicos. Nesses ambientes, talvez você queira que o cluster de failover continue em execução ininterrupta no local primário, mesmo que vários nós no local secundário fiquem indisponíveis. Para fazer isso, você pode atribuir um peso de nó de 0 aos nós de cluster de failover no local secundário, o que efetivamente elimina seu impacto no estado do quórum.
  • Testemunha dinâmica. Por padrão, o Windows Server ajusta dinamicamente o voto da testemunha com base no número de nós de votação no cluster de failover. Se o cluster de failover tiver um número ímpar de votos, a testemunha de quórum não terá um voto. Se o cluster de failover tiver um número par de votos, a testemunha de quórum terá um voto. O voto da testemunha de quórum também é ajustado dinamicamente com base no estado do recurso de testemunha. Se o recurso de testemunha estiver offline ou tiver falhado, a testemunha não terá uma votação.
  • Desempate para divisão de 50% do nó. O cluster de failover pode ajustar dinamicamente o voto de um nó para manter um número ímpar de votos totais. Para fazer isso, o cluster de failover primeiro ajusta o voto de testemunha de quórum aproveitando a funcionalidade de testemunha dinâmica. Se uma testemunha de quórum não estiver disponível, o cluster de failover poderá ajustar o voto de um nó. Também há uma propriedade de cluster de failover que você pode usar para determinar qual site sobreviverá se houver uma divisão de nó de 50% e nenhum site tiver um quórum.

A funcionalidade de um cluster de failover depende não só de um quorum, mas também dos recursos disponíveis para nós de cluster e da capacidade de eles executarem as cargas de trabalho clusterizadas que fazem failover nesse nó. Por exemplo, um cluster com cinco nós ainda terá um quorum mesmo que dois nós falhem. No entanto, cada nó de cluster restante continuará atendendo aos clientes somente se ele tiver recursos suficientes para executar funções de cluster que realizaram failover nos três nós restantes. Esses recursos incluem armazenamento, capacidade de processamento, largura de banda de rede e memória. Você pode configurar a prioridade da VM, a ordem de inicialização, os hosts preferenciais e a não afinidade para decidir os nós nos quais a função de cluster pode ser executada.

Tipos de testemunha de clustering de failover

Há três tipos de testemunha de quórum disponíveis para o clustering de failover.

  • A testemunha de disco usa um recurso de disco clusterizado no mesmo cluster de failover. Todos os nós devem ter acesso ao disco compartilhado.
  • A testemunha de compartilhamento de arquivos usa um compartilhamento de arquivos externo. É possível implementar isso usando uma unidade USB anexada a um comutador de rede.
  • A testemunha de nuvem usa um blob em uma conta de armazenamento do Azure.

Importante

Ao escolher o tipo de testemunha de quórum, você deve garantir que a testemunha permaneça acessível para a maioria dos cenários que afetam a disponibilidade do nó do cluster.