Implementar clusters estendidos
Tradicionalmente, os clusters de failover proporcionavam proteção de alta disponibilidade contra falhas localizadas em um ou mais nós de cluster que residem no mesmo local físico. Você pode usar clusters estendidos quando necessário para fornecer a funcionalidade equivalente em vários locais físicos.
O que são clusters estendidos?
Um cluster estendido implementa alta disponibilidade e recuperação de desastre em dois locais físicos separados. Ambos os locais hospedam um sistema de armazenamento separado, com replicação unidirecional e síncrona do site primário para o site secundário. Para minimizar o tempo de inatividade, se uma falha afetar a disponibilidade do site primário, o cluster transfere automaticamente suas tarefas para os nós no site secundário. Para eventos de manutenção planejados no site primário, você pode usar Hyper-V Migração Dinâmica para transferir suavemente cargas de trabalho para o outro site, evitando totalmente o tempo de inatividade.
O uso de clusters estendidos oferece várias vantagens em relação à manutenção manual de um site de recuperação de desastre:
- Replicação automática e failover automático de cargas de trabalho clusterizadas.
- Reduza a sobrecarga administrativa.
- Minimize a possibilidade de erro humano, que é inerente a processos manuais.
Por outro lado, os clusters estendidos são mais complexos de projetar e implementar. Normalmente, eles também exigem um investimento adicional em infraestrutura de rede e armazenamento.
Visão geral da réplica de armazenamento
Os clusters stretch aproveitam a Réplica de Armazenamento, um recurso do Windows Server que fornece replicação de volumes entre servidores ou clusters para recuperação de desastre. Usando a réplica de armazenamento, os clusters estendidos podem sincronizar os volumes de armazenamento anexados com nós de cluster estendido em dois locais separados.
A Réplica de Armazenamento dá suporte à replicação síncrona e assíncrona:
- A replicação síncrona replica dados em uma rede de baixa latência, dentro de milissegundos de tempo de viagem de ida e volta, garantindo que não haja perda de dados no nível do sistema de arquivos durante um failover.
- A replicação assíncrona replica dados em distâncias mais longas que estão sujeitas a latências mais altas, mas sem a garantia de que ambos os sites têm cópias idênticas dos dados no momento de um failover.
Importante
Os clusters estendidos exigem replicação síncrona. Esse requisito impõe o limite de latência de rede de ida e volta de 5 ms entre dois grupos de nós de cluster nos sites replicados. Dependendo das características de conectividade de rede física, essa restrição normalmente se traduz em uma distância de cerca de 20 a 30 milhas.
Recursos da réplica de armazenamento
Os principais recursos da réplica de armazenamento estão listados na tabela a seguir.
| Característica | Descrição |
|---|---|
| Replicação em nível de bloco | Com a replicação em nível de bloco, não há a possibilidade de bloqueio de arquivos. |
| Simplicidade | Conte com o Windows Admin Center para orientar você pelo processo de criação de uma parceria de replicação entre dois servidores. Para implantar um cluster estendido, use um assistente baseado no Gerenciador de Cluster de Failover. |
| Uso do SMB (Bloco de Mensagens do Servidor) 3.0 | A réplica de armazenamento é baseada no protocolo SMB 3.x, introduzido no Windows Server 2012 e aprimorado consideravelmente nas versões seguintes do Windows Server. Todas as características avançadas do protocolo SMB, como o SMB Multichannel e o SMB Direct, estão disponíveis para a Réplica de Armazenamento. |
| Segurança | A réplica de armazenamento apresenta uma ampla gama de mecanismos de segurança, o que inclui a assinatura de pacotes, criptografia dos dados completa com AES-128-GCM, suporte para aceleração de criptografia por terceiros e prevenção contra ataques man-in-the-middle por meio de integridade de pré-autenticação. A Réplica de Armazenamento também conta com o Kerberos AES256 para toda a autenticação entre nós. |
| Restrições de rede | Nos casos em que há vários caminhos de rede entre volumes replicados, você pode configurar o tráfego de Réplica de Armazenamento para usar adaptadores de rede designados. Isso permite minimizar o impacto potencial do tráfego de replicação nas cargas de trabalho de produção. |
| Provisionamento fino | Você tem a opção de implementar o provisionamento dinâmico nos Espaços de Armazenamento Diretos, minimizando os tempos de replicação iniciais. |
Pré-requisitos para a implantação de clusters estendidos
Os pré-requisitos para implementar clusters estendidos incluem:
Os nós de cluster devem ser membros da mesma floresta AD DS ou de uma floresta AD DS confiável.
Cada nó de cluster deve ter pelo menos 2 GB de RAM e dois núcleos de CPU por servidor.
Cada nó do cluster deve estar executando a edição do Windows Server 2025 Datacenter ou do Windows Server 2016 Datacenter. É possível usar o Windows Server 2025 Standard Edition, mas essa configuração dá suporte à replicação de um único volume de até 2 terabytes (TB) somente em tamanho.
Cada nó de cluster deve ter no mínimo 1 adaptador Ethernet gigabit para replicação síncrona, embora o RDMA (Acesso remoto direto à memória) seja preferível.
Dois conjuntos de volumes (um para dados e outro para logs) no site primário e secundário, com as seguintes configurações:
Os discos devem ser inicializados como uma GPT (tabela de partição GUID), em vez de um MBR (registro mestre de inicialização).
- Os volumes devem ser formatados com ReFS ou NTFS.
- Os tamanhos dos volumes de dados e do setor devem corresponder.
- Os tamanhos dos volumes de log e do setor devem corresponder.
- Os volumes de log devem usar o armazenamento mais rápido do que os volumes de dados.
- Os volumes de log não devem ser usados para outras cargas de trabalho.
Conectividade bidirecional por meio do Protocolo de Mensagem de Controle de Internet (ICMP), SMB (porta 445, mais porta 5445 para SMB Direct) e Web Services-Management (WS-MAN) (porta 5985) entre os dois sites.
Uma rede entre servidores com largura de banda suficiente para corresponder às gravações de E/S das cargas de trabalho clusterizadas e menos de 5 ms de latência de ida e volta.
Considerações sobre a implantação de um cluster estendido
Os clusters estendidos não são adequados para todas as cargas de trabalho e todos os cenários. Ao projetar uma solução de cluster estendido, identifique claramente os requisitos e as expectativas organizacionais. Além disso, tenha em mente que os clusters estendidos impõem mais sobrecarga de gerenciamento do que os clusters tradicionais, em que todos os nós residem no mesmo local físico. Você também deve considerar cuidadosamente a escolha ideal da testemunha de quorum para maximizar sua disponibilidade em caso de um desastre que afete um local físico inteiro.
Importante
Aplicativos e serviços com estado, como Microsoft SQL Server, Hyper-V, Microsoft Exchange Server e AD DS, devem usar seus próprios mecanismos de resiliência nativos, em vez de depender de clusters estendidos para alta disponibilidade.
Considerações sobre failover e failback em um cluster estendido
Como parte do planejamento para a implantação de um cluster estendido, você precisa definir sua configuração de failover e failback considerando o seguinte:
- Dependências de infraestrutura. Você deve definir claramente os serviços críticos, como AD DS, DNS e DHCP, que devem permanecer disponíveis após um failover para o site secundário.
- Modelo de quorum. É importante escolher o modelo de quorum que preserva a funcionalidade do cluster após um failover.
- Publicação de serviço e resolução de nomes. Se você tiver serviços publicados para seus usuários internos ou externos, como email e páginas da Web, lembre-se de que, em alguns casos, o failover para outro site requer alterações de nome ou endereço IP. Se esse for o caso, você deverá ter um procedimento para alterar registros DNS no DNS interno ou público. Para reduzir o tempo de inatividade, recomendamos que você reduza o valor de TTL (Vida Útil) de registros DNS críticos.
- Conectividade do cliente. No caso de um desastre, um plano de failover deve acomodar a conectividade de aplicativos cliente para cargas de trabalho clusterizadas. Isso inclui clientes internos e externos.
- O procedimento de failback. Você deve planejar e implementar um processo de failback a ser executado depois que o site primário voltar a ficar online. O failback é tão importante quanto um failover, pois se você executá-lo incorretamente, poderá causar perda de dados e tempo de inatividade do serviço.
Criar um cluster estendido
Você pode criar um cluster estendido usando o Windows Admin Center, o Gerenciador de Cluster de Failover ou o Windows PowerShell. O Windows Admin Center simplifica a implementação de clusters estendidos orientando você pelo processo de provisionamento e automatizando a maioria das tarefas de configuração. Isso inclui suporte para:
- Clusters hiperconvergentes (clustering de failover, Hyper-V e Espaços de Armazenamento Diretos).
- Clusters de armazenamento (clustering de failover e Espaços de Armazenamento Diretos).
Observação
Criar um cluster estendido usando o Gerenciador de Cluster de Failover ou o Windows PowerShell é mais complexo. Ambos os métodos exigem a execução de cada uma das etapas de implementação intermediária. Em termos mais simples, isso começa com a criação de um cluster de failover tradicional, não estendido, que consiste em todos os nós do site primário e secundário. Depois de criar o cluster e concluir sua validação, em cada site, você criará um conjunto separado de volumes de armazenamento. Por fim, você configura a Réplica de Armazenamento para replicar volumes de armazenamento entre os dois sites.