Condividi tramite


Scenari di failover del cluster nel dispositivo Azure Stack Edge Pro GPU

Questo articolo identifica gli scenari di failover comuni, il modo in cui il dispositivo Azure Stack Edge risponde e l'impatto complessivo sui carichi di lavoro distribuiti nel cluster in caso di failover.

Informazioni sul failover

Azure Stack Edge può essere configurato come un singolo dispositivo autonomo o un cluster a due nodi. In un cluster a due nodi, i nodi in cluster offrono disponibilità elevata per applicazioni e servizi in esecuzione nel cluster.

Se uno dei nodi in cluster ha esito negativo, l'altro nodo inizia a fornire il servizio. Questo processo è noto come failover. Il failover può verificarsi anche se i componenti hardware associati a uno o entrambi i nodi del dispositivo, ad esempio unità disco, unità di alimentazione (PSU) o errori di rete o quando si aggiornano i nodi del dispositivo.

Scenari di failover

Il failover può verificarsi a causa di un errore del componente hardware, di un errore del nodo o durante l'aggiornamento del cluster Azure Stack Edge.

Errori hardware

Queste tabelle riepilogano gli scenari di errore per un componente hardware fisico associato al cluster del dispositivo, ad esempio una o più unità disco, alimentatore o rete.

Errori di unità disco

Nodo A Nodo B Il cluster sopravvive Failover Dettagli
1 unità disco non riuscita Nessun errore No Il cluster è danneggiato fino a quando il disco non viene sostituito.
2 o più unità disco hanno esito negativo Nessun errore No Il cluster è danneggiato fino a quando il disco non viene sostituito.
1 o più unità disco hanno esito negativo 1 o più unità disco hanno esito negativo No Il cluster diventa offline.

Guasti dell'unità di alimentazione

Nodo A Nodo B Il cluster sopravvive Failover Dettagli
1 PSU ha esito negativo Nessun errore No Un altro guasto dell'alimentatore nel nodo A comporterà il failover nel nodo B.
1 PSU ha esito negativo 1 PSU ha esito negativo No Un altro guasto di alimentazione in uno dei due nodi comporterà il failover.
2 PSU hanno esito negativo Nessun errore Macchine virtuali nel nodo A eseguire il failover nel nodo B.
2 PSU hanno esito negativo (TBC) 1 PSU ha esito negativo Macchine virtuali nel nodo A eseguire il failover nel nodo B.
2 PSU hanno esito negativo 2 PSU hanno esito negativo No Il cluster diventa offline.

Errori di rete

Nodo A Nodo B Il cluster sopravvive Failover Dettagli
La porta 1, la porta 2, la porta 5 o la porta 6 ha esito negativo Nessun errore No La porta non riuscita non è disponibile. Le app in ascolto su questa porta sono interessate
1 o entrambe le porte 3 e porta 4 hanno esito negativo Nessun errore Macchine virtuali nel nodo A di failover nel nodo B

Errori e aggiornamenti dei nodi

Errore del nodo

Questa tabella riepiloga gli scenari di errore quando un intero nodo non è riuscito nel cluster.

Nodo A Nodo B Il cluster sopravvive Failover Dettagli
L'intero nodo ha esito negativo Nessun errore Macchine virtuali dal nodo A di failover al nodo B
L'intero nodo ha esito negativo L'intero nodo ha esito negativo No - Il cluster diventa offline
Riavvio Nessun errore Macchine virtuali dal nodo A di failover al nodo B
Riavvio Riavvio No - Il cluster è offline fino al completamento del riavvio
Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. Nessun errore Macchine virtuali dal nodo A di failover al nodo B
Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. No - Il cluster diventa offline

Aggiornamento del nodo

Nodo A Nodo B Il cluster sopravvive Failover Dettagli
Aggiornamento del nodo Nessun errore Macchine virtuali dal nodo A di failover al nodo B
Aggiornamento del nodo 2 PSU hanno esito negativo No - Il cluster diventa offline
Aggiornamento del nodo L'intero nodo ha esito negativo o passa offline No - Il cluster diventa offline
Aggiornamento del nodo Riavvio No - Il cluster diventa offline
Aggiornamento del nodo Il componente principale ha esito negativo, ad esempio scheda madre, DIMM e disco del sistema operativo. No - Il cluster diventa offline

Passaggi successivi