Cenários de failover de cluster em seu dispositivo de GPU do Azure Stack Edge Pro
Este artigo identifica os cenários comuns de failover, como o dispositivo Azure Stack Edge responde e o impacto geral nas cargas de trabalho implantadas no cluster caso ocorra um failover.
Sobre a ativação pós-falha
O Azure Stack Edge pode ser configurado como um único dispositivo autônomo ou um cluster de dois nós. Em um cluster de dois nós, os nós clusterizados fornecem alta disponibilidade para aplicativos e serviços que estão sendo executados no cluster.
Se um dos nós clusterizados falhar, o outro nó começará a fornecer serviço - esse processo é conhecido como failover. O failover também pode ocorrer se os componentes de hardware associados a um ou ambos os nós do dispositivo, como unidades de disco, unidades de fonte de alimentação (PSUs) ou rede, falharem ou quando você atualizar os nós do dispositivo.
Cenários de failover
O failover pode ocorrer como resultado de falha de componente de hardware, falha de nó ou ao atualizar o cluster do Azure Stack Edge.
Falhas de hardware
Estas tabelas resumem os cenários de falha para um componente de hardware físico associado ao cluster de dispositivos, como uma ou mais unidades de disco, fonte de alimentação ou rede.
Falhas na unidade de disco
Nó A | Nó B | Cluster sobrevive | Ativação pós-falha | Detalhes |
---|---|---|---|---|
1 unidade de disco falha | Sem falhas | Sim | No | O cluster é degradado até que o disco seja substituído. |
2 ou mais unidades de disco falham | Sem falhas | Sim | No | O cluster é degradado até que o disco seja substituído. |
1 ou mais unidades de disco falham | 1 ou mais unidades de disco falham | Não | O cluster fica offline. |
Falhas na fonte de alimentação
Nó A | Nó B | Cluster sobrevive | Ativação pós-falha | Detalhes |
---|---|---|---|---|
1 PSU falha | Sem falhas | Sim | No | Outra falha na fonte de alimentação no nó A resultará em failover para o nó B. |
1 PSU falha | 1 PSU falha | Sim | No | Outra falha na fonte de alimentação em qualquer um dos nós resultará em failover. |
2 PSUs falham | Sem falhas | Sim | Sim | VMs no nó A fazem failover para o nó B. |
2 PSUs falham (TBC) | 1 PSU falha | Sim | Sim | VMs no nó A fazem failover para o nó B. |
2 PSUs falham | 2 PSUs falham | Não | O cluster fica offline. |
Falhas de rede
Nó A | Nó B | Cluster sobrevive | Ativação pós-falha | Detalhes |
---|---|---|---|---|
Falha na porta 1, porta 2, porta 5 ou porta 6 | Sem falhas | Sim | No | A porta com falha não está disponível. As aplicações que escutam nesta porta são afetadas |
1 ou ambas as portas 3 e 4 falham | Sem falhas | Sim | Sim | Failover de VMs no nó A para o nó B |
Falhas e atualizações de nós
Falha do nó
Esta tabela resume os cenários de falha quando um nó inteiro falhou no cluster.
Nó A | Nó B | Cluster sobrevive | Ativação pós-falha | Detalhes |
---|---|---|---|---|
Falha de nó inteiro | Sem falhas | Sim | Sim | VMs do failover do nó A para o nó B |
Falha de nó inteiro | Falha de nó inteiro | Não | - | O cluster fica offline |
Reiniciar | Sem falhas | Sim | Sim | VMs do failover do nó A para o nó B |
Reiniciar | Reiniciar | Não | - | O cluster fica offline até que a reinicialização seja concluída |
O componente principal falha. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | Sem falhas | Sim | Sim | VMs do failover do nó A para o nó B |
O componente principal falha. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | O componente principal falha. Por exemplo, placa-mãe, DIMM e disco do sistema operacional. | Não | - | O cluster fica offline |
Atualização do nó
Nó A | Nó B | Cluster sobrevive | Ativação pós-falha | Detalhes |
---|---|---|---|---|
Atualização do nó | Sem falhas | Sim | Sim | VMs do failover do nó A para o nó B |
Atualização do nó | 2 PSUs falham | Não | - | O cluster fica offline |
Atualização do nó | Todo o nó falha ou fica offline | Não | - | O cluster fica offline |
Atualização do nó | Reiniciar | Não | - | O cluster fica offline |
Atualização do nó | O componente principal falha, como placa-mãe, DIMM e disco do sistema operacional. | Não | - | O cluster fica offline |
Próximos passos
- Saiba mais sobre tamanhos e tipos de VM para GPU do Azure Stack Edge Pro.