Agrupamento de failover no Windows Server e no Azure Local

2025-06-29
Aplica-se a: ✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Local 2311.2 and later

O clustering de failover é uma estratégia poderosa para garantir alta disponibilidade e operações contínuas em ambientes críticos. Ele envolve uma configuração de computadores independentes, conhecidos como nós, que funcionam juntos para aprimorar a disponibilidade e a escalabilidade de aplicativos e serviços, agora chamados de funções clusterizados. Esses nós são interconectados por meio de cabeamento físico e software.

Se ocorrer uma falha em um ou mais nós, os nós restantes assumirão automaticamente a carga de trabalho, um processo chamado failover, minimizando interrupções. Além disso, a saúde das funções clusterizadas é continuamente monitorada. Se algum problema for detectado, as funções serão reiniciadas ou migradas para outro nó para manter a operação perfeita. Essa abordagem proativa garante que os serviços permaneçam consistentemente disponíveis, mesmo que ocorram falhas de hardware ou software.

A rede é uma função crucial em clusters de failover habilitando a comunicação confiável e a troca eficiente de dados entre nós de cluster e com clientes externos. Os clusters geralmente empregam redes privadas dedicadas para funções internas, como sinais de pulsação e gerenciamento de cluster, enquanto redes públicas separadas lidam com o acesso do cliente e os dados do aplicativo. Essa separação de rede melhora o desempenho e a segurança isolando o tráfego crítico do cluster de interrupções externas. Ele também aumenta a tolerância a falhas, garantindo que as operações internas de cluster permaneçam ininterruptas e que as conexões de cliente mantenham alta disponibilidade durante eventos de failover.

A integridade do cluster é monitorada continuamente por meio de sinais de pulsação, que ajudam a detectar problemas. Se surgir um problema, o sistema poderá iniciar automaticamente um failover para manter a continuidade do serviço. Para proteger dados confidenciais e atender aos padrões organizacionais, os clusters de failover incorporam medidas de segurança robustas, como criptografia, para proteger dados em trânsito e em repouso. Eles também usam o controle de acesso granular para gerenciar permissões e direitos de acesso efetivamente.

Para saber mais sobre agrupamento de failover no Azure Local, consulte Reconhecimento de quorum de cluster e de pool.

Configuração de failover ativo e passivo

Os clusters de failover podem ser configurados em duas configurações principais, ativo-ativo e ativo-passivo. Cada configuração tem seus próprios compromissos: onde ativo-ativo foca no desempenho e na eficiência de recursos, enquanto ativo-passivo enfatiza a simplicidade e a confiabilidade em cenários de failover. A escolha depende de necessidades organizacionais específicas e da criticidade dos aplicativos que estão sendo clusterizados.

Configuração	Operação
Ativo	Em um cluster de failover ativo-ativo, todos os nós estão ativos e funcionam juntos simultaneamente para equilibrar a carga de trabalho em todo o cluster. Essa configuração distribui tarefas, poder de processamento ou serviços entre todos os nós disponíveis, fazendo uso eficiente dos recursos. Veja como funciona: Balanceamento de carga: Cada nó manipula uma parte da carga de trabalho total, melhorando o desempenho e garantindo que nenhum nó se torne um gargalo. Essa distribuição igual pode melhorar a capacidade de resposta e a taxa de transferência, pois vários nós estão atendendo solicitações simultaneamente. Utilização de recursos: Uma configuração ativa-ativa maximiza a utilização de recursos, pois todos os nós estão operacionais e contribuindo para o desempenho do cluster. Essa configuração é ideal para ambientes em que a maximização dos recursos disponíveis é essencial. Tolerância a falhas: Se um nó falhar, os nós restantes no cluster poderão continuar a lidar com a carga de trabalho. A perda de um nó pode reduzir temporariamente a capacidade geral, mas o sistema permanece operacional sem interrupções de serviço.
Passivo	Em um cluster de failover ativo-passivo, alguns nós são designados como ativos, enquanto outros estão em espera, prontos para assumir o comando caso um nó ativo falhe. Veja como funciona: Nós em espera: Os nós passivos estão essencialmente em um estado de "espera", não tratando tarefas ou serviços durante operações normais. Esses nós são preparados para assumir as responsabilidades caso um nó ativo experimente uma falha. Processo de failover: quando uma falha é detectada, um nó em espera é ativado para assumir as responsabilidades do nó com falha. Isso envolve colocar rapidamente o nó passivo online para garantir a continuidade dos serviços. Alocação de recursos: As configurações ativas-passivas podem não fazer uso total dos recursos de hardware disponíveis durante operações normais, pois os nós em espera permanecem ociosos. No entanto, essa configuração pode ser mais simples de gerenciar e pode garantir um desempenho previsível em determinadas condições. Simplicidade e confiabilidade: Uma configuração ativa-passiva pode ser vantajosa para aplicativos em que a estabilidade e a previsibilidade são mais importantes do que maximizar a eficiência operacional. Geralmente, é mais fácil implementar e manter em comparação a uma configuração ativa-ativa.

Configuração

Operação

Ativo

Em um cluster de failover ativo-ativo, todos os nós estão ativos e funcionam juntos simultaneamente para equilibrar a carga de trabalho em todo o cluster. Essa configuração distribui tarefas, poder de processamento ou serviços entre todos os nós disponíveis, fazendo uso eficiente dos recursos. Veja como funciona:

Balanceamento de carga: Cada nó manipula uma parte da carga de trabalho total, melhorando o desempenho e garantindo que nenhum nó se torne um gargalo. Essa distribuição igual pode melhorar a capacidade de resposta e a taxa de transferência, pois vários nós estão atendendo solicitações simultaneamente.

Utilização de recursos: Uma configuração ativa-ativa maximiza a utilização de recursos, pois todos os nós estão operacionais e contribuindo para o desempenho do cluster. Essa configuração é ideal para ambientes em que a maximização dos recursos disponíveis é essencial.

Tolerância a falhas: Se um nó falhar, os nós restantes no cluster poderão continuar a lidar com a carga de trabalho. A perda de um nó pode reduzir temporariamente a capacidade geral, mas o sistema permanece operacional sem interrupções de serviço.

Passivo

Em um cluster de failover ativo-passivo, alguns nós são designados como ativos, enquanto outros estão em espera, prontos para assumir o comando caso um nó ativo falhe. Veja como funciona:

Nós em espera: Os nós passivos estão essencialmente em um estado de "espera", não tratando tarefas ou serviços durante operações normais. Esses nós são preparados para assumir as responsabilidades caso um nó ativo experimente uma falha.

Processo de failover: quando uma falha é detectada, um nó em espera é ativado para assumir as responsabilidades do nó com falha. Isso envolve colocar rapidamente o nó passivo online para garantir a continuidade dos serviços.

Alocação de recursos: As configurações ativas-passivas podem não fazer uso total dos recursos de hardware disponíveis durante operações normais, pois os nós em espera permanecem ociosos. No entanto, essa configuração pode ser mais simples de gerenciar e pode garantir um desempenho previsível em determinadas condições.

Simplicidade e confiabilidade: Uma configuração ativa-passiva pode ser vantajosa para aplicativos em que a estabilidade e a previsibilidade são mais importantes do que maximizar a eficiência operacional. Geralmente, é mais fácil implementar e manter em comparação a uma configuração ativa-ativa.

Funcionalidades do clustering de failover

O clustering de failover fornece um conjunto abrangente de funcionalidades projetadas para maximizar o tempo de atividade, garantir a integridade dos dados e simplificar o gerenciamento de tarefas críticas. Esses recursos permitem que as organizações mantenham a continuidade do serviço, gerenciem recursos com eficiência e se recuperem rapidamente de falhas de hardware ou software. Algumas funcionalidades oferecidas pelo cluster de failover são:

Nós de cluster e quorum:

Nós do cluster colaboram para manter o que é conhecido como um quorum, que é essencialmente o número mínimo de votos dos membros necessários para que o cluster funcione corretamente. Esse mecanismo impede cenários de divisão cerebral, em que partes divididas de um cluster podem tentar operar de forma independente, potencialmente causando inconsistências. Modelos de quorum, como Maioria do Nó, Maioria do Nó e Disco, Maioria do Nó e Compartilhamento de Arquivos e Sem Maioria (Somente Disco), determinam como os votos são atribuídos e contados. Por exemplo, a Maioria do Nó atribui a cada nó um voto, enquanto a Maioria do Nó e do Disco incorporam votos adicionais de um disco ou de um compartilhamento de arquivos.
Configuração de armazenamento:

Um recurso notável dos clusters de failover é o CSV (Cluster Shared Volume), que permite que vários nós acessem o mesmo armazenamento simultaneamente, permitindo o gerenciamento e a coordenação do disco suave sem perda de desempenho. Os CSVs são parte integrante das configurações de armazenamento em clusters de failover. Os CSVs facilitam o acesso eficiente ao disco, permitindo que os nós lidem com tarefas de armazenamento de forma colaborativa.
Monitoramento e gerenciamento proativos:

Os clusters de failover empregam sinais de pulsação como um meio de monitorar a integridade dos nós e suas funções. Esses sinais ajudam a detectar problemas como falhas de nó ou interrupções de serviço. Quando esses problemas são detectados, o sistema pode iniciar automaticamente procedimentos de failover, garantindo a continuidade e minimizando o tempo de inatividade.
Segurança e conformidade:

A segurança é um aspecto vital dos clusters de failover, incorporando recursos como criptografia e controle de acesso para proteger dados e operações de cluster. Os clusters ajudam as organizações a atender aos requisitos de conformidade para aplicativos críticos, garantindo o tratamento seguro de dados e o desempenho confiável do sistema. Isso os torna adequados para ambientes que exigem proteção de dados rigorosa e adesão regulatória.
Casos de uso:

O clustering de failover tem várias aplicações práticas, incluindo recuperação de desastres, balanceamento de carga e computação de alto desempenho. Ele dá suporte a aplicativos críticos fornecendo alta disponibilidade, permitindo que as empresas mantenham operações mesmo em condições adversas. Por exemplo, em cenários de recuperação de desastre, os clusters podem restaurar rapidamente os serviços transferindo operações para nós não afetados.
- O clustering de failover garante alta disponibilidade ou disponibilidade contínua para aplicativos e serviços críticos em execução em servidores físicos ou máquinas virtuais. Se ocorrer uma falha, essas funções poderão ser rapidamente movidas ou reiniciadas em outro nó, minimizando o tempo de inatividade e mantendo o desempenho e a redundância consistentes.
- Aplicativos, como o Microsoft SQL Server e máquinas virtuais Hyper-V, se beneficiam do clustering de failover, experimentando interrupções mínimas de serviço, mesmo durante falhas de hardware ou software.

Recursos de clustering de failover

Esta tabela de recursos foi projetada para ajudá-lo a entender, planejar, implantar e gerenciar o cluster de failover com eficiência.

Noções básicas	Planejamento	Implantação
Novidades no clustering de failover	Planejamento dos requisitos de hardware do clustering de failover e opções de armazenamento	Criação de um cluster de failover
Expansão de servidor de arquivos para dados de aplicativos	Usar CSVs (Volumes Compartilhados do Cluster)	Implantar um servidor de arquivos com dois nós
Quorum de cluster e pool	Usar clusters de máquina virtual de convidado com espaços de armazenamento diretos	Pré-configurar objetos de computador de cluster no Active Directory Domain Services
Reconhecimento de domínio de falha		Configuração de contas de cluster no Active Directory
SMB Multichannel simplificado e redes de cluster de várias NICs		Recuperar um cluster de failover sem quorum
Balanceamento de carga de VM		Implantar uma testemunha de quorum
Conjuntos de cluster		Atualizações sem interrupção do sistema operacional do cluster
Afinidade de cluster		Atualizar um cluster de failover no mesmo hardware
		Implantar um cluster desanexado do Active Directory

Gerenciar	Ferramentas e configurações	Recursos da comunidade
Atualização com suporte a cluster	Cmdlets do PowerShell para clustering de failover	Fórum do Cluster de Failover
Serviço de Saúde	Cmdlets do PowerShell para atualização com suporte a cluster	Failover Clustering Blog
Migração de domínio do cluster
Solução de problemas usando o Relatório de Erros do Windows

Compartilhar via

Agrupamento de failover no Windows Server e no Azure Local

Configuração de failover ativo e passivo

Funcionalidades do clustering de failover

Recursos de clustering de failover

Comentários

Recursos adicionais