Cluster failover scenarios no seu Azure Stack Edge Pro dispositivo GPU

Este artigo identifica os cenários comuns de failover, como o dispositivo Azure Stack Edge responde, e o impacto global nas cargas de trabalho implementadas no cluster em caso de falha.

Sobre a ativação pós-falha

O Azure Stack Edge pode ser configurado como um único dispositivo autónomo ou um cluster de dois nós. Num cluster de dois nós, os nós agrupados proporcionam uma elevada disponibilidade para aplicações e serviços que estão a decorrer no cluster.

Se um dos nómadas agrupados falhar, o outro nó começa a fornecer serviço - este processo é conhecido como failover. A falha também pode ocorrer se os componentes de hardware associados a um ou ambos os nós do seu dispositivo, tais como unidades de disco, unidades de alimentação (PSUs) ou falha de rede ou quando atualizar os nós do dispositivo.

Cenários de failover

A falha pode ocorrer em resultado de falha do componente de hardware, falha no nó ou ao atualizar o cluster Azure Stack Edge.

Falhas de hardware

Estas tabelas resumem os cenários de falha para um componente de hardware físico associado ao cluster do seu dispositivo, como uma ou mais unidades de disco, alimentação de energia ou rede.

Falhas na unidade de disco

Nó A Nó B Cluster sobrevive Ativação pós-falha Detalhes
Falha na unidade de disco 1 Sem falhas Yes No O cluster é degradado até que o disco seja substituído.
Falha de 2 ou mais unidades de disco Sem falhas Yes No O cluster é degradado até que o disco seja substituído.
1 ou mais unidades de disco falham 1 ou mais unidades de disco falham No O cluster está desligado.

Falhas na unidade de alimentação

Nó A Nó B Cluster sobrevive Ativação pós-falha Detalhes
1 PSU falha Sem falhas Yes No Outra falha de alimentação no nó A resultará em falha no nó B.
1 PSU falha 1 PSU falha Yes No Outra falha de alimentação em ambos os nós resultará em falha.
2 PSUs falham Sem falhas Yes Yes VMs no nó A falham no nó B.
2 PSUs falham (TBC) 1 PSU falha Yes Yes VMs no nó A falham no nó B.
2 PSUs falham 2 PSUs falham No O cluster está desligado.

Falhas de rede

Nó A Nó B Cluster sobrevive Ativação pós-falha Detalhes
Porta 1, Porto 2, Porto 5 ou Porto 6 falha Sem falhas Yes No A porta falhada não está disponível. As aplicações que escutam nesta porta são impactadas
1 ou ambos do Porto 3 e porto 4 falham Sem falhas Yes Yes VMs no nó A falham no nó B

Falhas e atualizações de nó

Falha no nó

Esta tabela resume os cenários de falha quando um nó inteiro falhou no seu cluster.

Nó A Nó B Cluster sobrevive Ativação pós-falha Detalhes
O nó inteiro falha Sem falhas Yes Yes VMs do nó A falham no nó B
O nó inteiro falha O nó inteiro falha No - Cluster fica offline
Reiniciar Sem falhas Yes Yes VMs do nó A falham no nó B
Reiniciar Reiniciar No - O cluster está offline até que o reboot esteja concluído
O componente do núcleo falha. Por exemplo, motherboard, DIMM e disco de SO. Sem falhas Yes Yes VMs do nó A falham no nó B
O componente do núcleo falha. Por exemplo, motherboard, DIMM e disco de SO. O componente do núcleo falha. Por exemplo, motherboard, DIMM e disco de SO. No - Cluster fica offline

Atualização do nó

Nó A Nó B Cluster sobrevive Ativação pós-falha Detalhes
Atualização do nó Sem falhas Yes Yes VMs do nó A falham no nó B
Atualização do nó 2 PSUs falham No - Cluster fica offline
Atualização do nó Nó inteiro falha ou fica offline No - Cluster fica offline
Atualização do nó Reiniciar No - Cluster fica offline
Atualização do nó O componente do núcleo falha como a motherboard, DIMM e o disco DE. No - Cluster fica offline

Passos seguintes