Compartilhar via


Agrupamento de failover no Windows Server e no Azure Local

O clustering de failover é uma estratégia poderosa para garantir alta disponibilidade e operações contínuas em ambientes críticos. Ele envolve uma configuração de computadores independentes, conhecidos como nós, que funcionam juntos para aprimorar a disponibilidade e a escalabilidade de aplicativos e serviços, agora chamados de funções clusterizados. Esses nós são interconectados por meio de cabeamento físico e software.

Se ocorrer uma falha em um ou mais nós, os nós restantes assumirão automaticamente a carga de trabalho, um processo chamado failover, minimizando interrupções. Além disso, a saúde das funções clusterizadas é continuamente monitorada. Se algum problema for detectado, as funções serão reiniciadas ou migradas para outro nó para manter a operação perfeita. Essa abordagem proativa garante que os serviços permaneçam consistentemente disponíveis, mesmo que ocorram falhas de hardware ou software.

A rede é uma função crucial em clusters de failover habilitando a comunicação confiável e a troca eficiente de dados entre nós de cluster e com clientes externos. Os clusters geralmente empregam redes privadas dedicadas para funções internas, como sinais de pulsação e gerenciamento de cluster, enquanto redes públicas separadas lidam com o acesso do cliente e os dados do aplicativo. Essa separação de rede melhora o desempenho e a segurança isolando o tráfego crítico do cluster de interrupções externas. Ele também aumenta a tolerância a falhas, garantindo que as operações internas de cluster permaneçam ininterruptas e que as conexões de cliente mantenham alta disponibilidade durante eventos de failover.

A integridade do cluster é monitorada continuamente por meio de sinais de pulsação, que ajudam a detectar problemas. Se surgir um problema, o sistema poderá iniciar automaticamente um failover para manter a continuidade do serviço. Para proteger dados confidenciais e atender aos padrões organizacionais, os clusters de failover incorporam medidas de segurança robustas, como criptografia, para proteger dados em trânsito e em repouso. Eles também usam o controle de acesso granular para gerenciar permissões e direitos de acesso efetivamente.

Para saber mais sobre agrupamento de failover no Azure Local, consulte Reconhecimento de quorum de cluster e de pool.

Configuração de failover ativo e passivo

Os clusters de failover podem ser configurados em duas configurações principais, ativo-ativo e ativo-passivo. Cada configuração tem seus próprios compromissos: onde ativo-ativo foca no desempenho e na eficiência de recursos, enquanto ativo-passivo enfatiza a simplicidade e a confiabilidade em cenários de failover. A escolha depende de necessidades organizacionais específicas e da criticidade dos aplicativos que estão sendo clusterizados.

Configuração Operação
Ativo Em um cluster de failover ativo-ativo, todos os nós estão ativos e funcionam juntos simultaneamente para equilibrar a carga de trabalho em todo o cluster. Essa configuração distribui tarefas, poder de processamento ou serviços entre todos os nós disponíveis, fazendo uso eficiente dos recursos. Veja como funciona:

  • Balanceamento de carga: Cada nó manipula uma parte da carga de trabalho total, melhorando o desempenho e garantindo que nenhum nó se torne um gargalo. Essa distribuição igual pode melhorar a capacidade de resposta e a taxa de transferência, pois vários nós estão atendendo solicitações simultaneamente.
  • Utilização de recursos: Uma configuração ativa-ativa maximiza a utilização de recursos, pois todos os nós estão operacionais e contribuindo para o desempenho do cluster. Essa configuração é ideal para ambientes em que a maximização dos recursos disponíveis é essencial.
  • Tolerância a falhas: Se um nó falhar, os nós restantes no cluster poderão continuar a lidar com a carga de trabalho. A perda de um nó pode reduzir temporariamente a capacidade geral, mas o sistema permanece operacional sem interrupções de serviço.
  • Passivo Em um cluster de failover ativo-passivo, alguns nós são designados como ativos, enquanto outros estão em espera, prontos para assumir o comando caso um nó ativo falhe. Veja como funciona:

  • Nós em espera: Os nós passivos estão essencialmente em um estado de "espera", não tratando tarefas ou serviços durante operações normais. Esses nós são preparados para assumir as responsabilidades caso um nó ativo experimente uma falha.
  • Processo de failover: quando uma falha é detectada, um nó em espera é ativado para assumir as responsabilidades do nó com falha. Isso envolve colocar rapidamente o nó passivo online para garantir a continuidade dos serviços.
  • Alocação de recursos: As configurações ativas-passivas podem não fazer uso total dos recursos de hardware disponíveis durante operações normais, pois os nós em espera permanecem ociosos. No entanto, essa configuração pode ser mais simples de gerenciar e pode garantir um desempenho previsível em determinadas condições.
  • Simplicidade e confiabilidade: Uma configuração ativa-passiva pode ser vantajosa para aplicativos em que a estabilidade e a previsibilidade são mais importantes do que maximizar a eficiência operacional. Geralmente, é mais fácil implementar e manter em comparação a uma configuração ativa-ativa.
  • Funcionalidades do clustering de failover

    O clustering de failover fornece um conjunto abrangente de funcionalidades projetadas para maximizar o tempo de atividade, garantir a integridade dos dados e simplificar o gerenciamento de tarefas críticas. Esses recursos permitem que as organizações mantenham a continuidade do serviço, gerenciem recursos com eficiência e se recuperem rapidamente de falhas de hardware ou software. Algumas funcionalidades oferecidas pelo cluster de failover são:

    • Nós de cluster e quorum:

      Nós do cluster colaboram para manter o que é conhecido como um quorum, que é essencialmente o número mínimo de votos dos membros necessários para que o cluster funcione corretamente. Esse mecanismo impede cenários de divisão cerebral, em que partes divididas de um cluster podem tentar operar de forma independente, potencialmente causando inconsistências. Modelos de quorum, como Maioria do Nó, Maioria do Nó e Disco, Maioria do Nó e Compartilhamento de Arquivos e Sem Maioria (Somente Disco), determinam como os votos são atribuídos e contados. Por exemplo, a Maioria do Nó atribui a cada nó um voto, enquanto a Maioria do Nó e do Disco incorporam votos adicionais de um disco ou de um compartilhamento de arquivos.

    • Configuração de armazenamento:

      Um recurso notável dos clusters de failover é o CSV (Cluster Shared Volume), que permite que vários nós acessem o mesmo armazenamento simultaneamente, permitindo o gerenciamento e a coordenação do disco suave sem perda de desempenho. Os CSVs são parte integrante das configurações de armazenamento em clusters de failover. Os CSVs facilitam o acesso eficiente ao disco, permitindo que os nós lidem com tarefas de armazenamento de forma colaborativa.

    • Monitoramento e gerenciamento proativos:

      Os clusters de failover empregam sinais de pulsação como um meio de monitorar a integridade dos nós e suas funções. Esses sinais ajudam a detectar problemas como falhas de nó ou interrupções de serviço. Quando esses problemas são detectados, o sistema pode iniciar automaticamente procedimentos de failover, garantindo a continuidade e minimizando o tempo de inatividade.

    • Segurança e conformidade:

      A segurança é um aspecto vital dos clusters de failover, incorporando recursos como criptografia e controle de acesso para proteger dados e operações de cluster. Os clusters ajudam as organizações a atender aos requisitos de conformidade para aplicativos críticos, garantindo o tratamento seguro de dados e o desempenho confiável do sistema. Isso os torna adequados para ambientes que exigem proteção de dados rigorosa e adesão regulatória.

    • Casos de uso:

      O clustering de failover tem várias aplicações práticas, incluindo recuperação de desastres, balanceamento de carga e computação de alto desempenho. Ele dá suporte a aplicativos críticos fornecendo alta disponibilidade, permitindo que as empresas mantenham operações mesmo em condições adversas. Por exemplo, em cenários de recuperação de desastre, os clusters podem restaurar rapidamente os serviços transferindo operações para nós não afetados.

      • O clustering de failover garante alta disponibilidade ou disponibilidade contínua para aplicativos e serviços críticos em execução em servidores físicos ou máquinas virtuais. Se ocorrer uma falha, essas funções poderão ser rapidamente movidas ou reiniciadas em outro nó, minimizando o tempo de inatividade e mantendo o desempenho e a redundância consistentes.

      • Aplicativos, como o Microsoft SQL Server e máquinas virtuais Hyper-V, se beneficiam do clustering de failover, experimentando interrupções mínimas de serviço, mesmo durante falhas de hardware ou software.

    Recursos de clustering de failover

    Esta tabela de recursos foi projetada para ajudá-lo a entender, planejar, implantar e gerenciar o cluster de failover com eficiência.

    Noções básicas Planejamento Implantação
    Novidades no clustering de failover Planejamento dos requisitos de hardware do clustering de failover e opções de armazenamento Criação de um cluster de failover
    Expansão de servidor de arquivos para dados de aplicativos Usar CSVs (Volumes Compartilhados do Cluster) Implantar um servidor de arquivos com dois nós
    Quorum de cluster e pool Usar clusters de máquina virtual de convidado com espaços de armazenamento diretos Pré-configurar objetos de computador de cluster no Active Directory Domain Services
    Reconhecimento de domínio de falha Configuração de contas de cluster no Active Directory
    SMB Multichannel simplificado e redes de cluster de várias NICs Recuperar um cluster de failover sem quorum
    Balanceamento de carga de VM Implantar uma testemunha de quorum
    Conjuntos de cluster Atualizações sem interrupção do sistema operacional do cluster
    Afinidade de cluster Atualizar um cluster de failover no mesmo hardware
    Implantar um cluster desanexado do Active Directory
    Gerenciar Ferramentas e configurações Recursos da comunidade
    Atualização com suporte a cluster Cmdlets do PowerShell para clustering de failover Fórum do Cluster de Failover
    Serviço de Saúde Cmdlets do PowerShell para atualização com suporte a cluster Failover Clustering Blog
    Migração de domínio do cluster
    Solução de problemas usando o Relatório de Erros do Windows