Scenari di failover del cluster nel dispositivo Azure Stack Edge Pro GPU
Questo articolo identifica gli scenari di failover comuni, il modo in cui il dispositivo Azure Stack Edge risponde e l'impatto complessivo sui carichi di lavoro distribuiti nel cluster in caso di failover.
Informazioni sul failover
Azure Stack Edge può essere configurato come un singolo dispositivo autonomo o un cluster a due nodi. In un cluster a due nodi, i nodi in cluster offrono disponibilità elevata per applicazioni e servizi in esecuzione nel cluster.
Se uno dei nodi in cluster ha esito negativo, l'altro nodo inizia a fornire il servizio. Questo processo è noto come failover. Il failover può verificarsi anche se i componenti hardware associati a uno o entrambi i nodi del dispositivo, ad esempio unità disco, unità di alimentazione (PSU) o errori di rete o quando si aggiornano i nodi del dispositivo.
Scenari di failover
Il failover può verificarsi a causa di un errore del componente hardware, di un errore del nodo o durante l'aggiornamento del cluster Azure Stack Edge.
Errori hardware
Queste tabelle riepilogano gli scenari di errore per un componente hardware fisico associato al cluster del dispositivo, ad esempio una o più unità disco, alimentatore o rete.
Errori di unità disco
Nodo A | Nodo B | Il cluster sopravvive | Failover | Dettagli |
---|---|---|---|---|
1 unità disco non riuscita | Nessun errore | Sì | No | Il cluster è danneggiato fino a quando il disco non viene sostituito. |
2 o più unità disco hanno esito negativo | Nessun errore | Sì | No | Il cluster è danneggiato fino a quando il disco non viene sostituito. |
1 o più unità disco hanno esito negativo | 1 o più unità disco hanno esito negativo | No | Il cluster diventa offline. |
Guasti dell'unità di alimentazione
Nodo A | Nodo B | Il cluster sopravvive | Failover | Dettagli |
---|---|---|---|---|
1 PSU ha esito negativo | Nessun errore | Sì | No | Un altro guasto dell'alimentatore nel nodo A comporterà il failover nel nodo B. |
1 PSU ha esito negativo | 1 PSU ha esito negativo | Sì | No | Un altro guasto di alimentazione in uno dei due nodi comporterà il failover. |
2 PSU hanno esito negativo | Nessun errore | Sì | Sì | Macchine virtuali nel nodo A eseguire il failover nel nodo B. |
2 PSU hanno esito negativo (TBC) | 1 PSU ha esito negativo | Sì | Sì | Macchine virtuali nel nodo A eseguire il failover nel nodo B. |
2 PSU hanno esito negativo | 2 PSU hanno esito negativo | No | Il cluster diventa offline. |
Errori di rete
Nodo A | Nodo B | Il cluster sopravvive | Failover | Dettagli |
---|---|---|---|---|
La porta 1, la porta 2, la porta 5 o la porta 6 ha esito negativo | Nessun errore | Sì | No | La porta non riuscita non è disponibile. Le app in ascolto su questa porta sono interessate |
1 o entrambe le porte 3 e porta 4 hanno esito negativo | Nessun errore | Sì | Sì | Macchine virtuali nel nodo A di failover nel nodo B |
Errori e aggiornamenti dei nodi
Errore del nodo
Questa tabella riepiloga gli scenari di errore quando un intero nodo non è riuscito nel cluster.
Nodo A | Nodo B | Il cluster sopravvive | Failover | Dettagli |
---|---|---|---|---|
L'intero nodo ha esito negativo | Nessun errore | Sì | Sì | Macchine virtuali dal nodo A di failover al nodo B |
L'intero nodo ha esito negativo | L'intero nodo ha esito negativo | No | - | Il cluster diventa offline |
Riavvio | Nessun errore | Sì | Sì | Macchine virtuali dal nodo A di failover al nodo B |
Riavvio | Riavvio | No | - | Il cluster è offline fino al completamento del riavvio |
Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. | Nessun errore | Sì | Sì | Macchine virtuali dal nodo A di failover al nodo B |
Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. | Il componente principale ha esito negativo. Ad esempio, scheda madre, DIMM e disco del sistema operativo. | No | - | Il cluster diventa offline |
Aggiornamento del nodo
Nodo A | Nodo B | Il cluster sopravvive | Failover | Dettagli |
---|---|---|---|---|
Aggiornamento del nodo | Nessun errore | Sì | Sì | Macchine virtuali dal nodo A di failover al nodo B |
Aggiornamento del nodo | 2 PSU hanno esito negativo | No | - | Il cluster diventa offline |
Aggiornamento del nodo | L'intero nodo ha esito negativo o passa offline | No | - | Il cluster diventa offline |
Aggiornamento del nodo | Riavvio | No | - | Il cluster diventa offline |
Aggiornamento del nodo | Il componente principale ha esito negativo, ad esempio scheda madre, DIMM e disco del sistema operativo. | No | - | Il cluster diventa offline |
Passaggi successivi
- Informazioni su dimensioni e tipi di vm per Azure Stack Edge Pro GPU.