Skenario failover kluster di perangkat Azure Stack Edge Pro GPU Anda
Artikel ini mengidentifikasi skenario failover umum, bagaimana perangkat Azure Stack Edge merespons, dan dampak keseluruhan pada beban kerja yang disebarkan pada kluster jika terjadi failover.
Tentang failover
Azure Stack Edge dapat disiapkan sebagai satu perangkat mandiri atau kluster dua node. Dalam kluster dua node, node berkluster menyediakan ketersediaan tinggi untuk aplikasi dan layanan yang berjalan pada kluster.
Jika salah satu node terkluster gagal, simpul lain mulai menyediakan layanan - proses ini dikenal sebagai failover. Failover juga dapat terjadi jika komponen perangkat keras yang terkait dengan satu atau kedua simpul perangkat Anda seperti drive disk, unit catu daya (PSU), atau jaringan gagal atau saat Anda memperbarui simpul perangkat Anda.
Skenario failover
Failover dapat terjadi sebagai akibat dari kegagalan komponen perangkat keras, kegagalan node, atau saat memperbarui kluster Azure Stack Edge.
Kegagalan perangkat keras
Tabel ini meringkas skenario kegagalan untuk komponen perangkat keras fisik yang terkait dengan kluster perangkat Anda seperti satu atau beberapa drive disk, catu daya, atau jaringan.
Kegagalan drive disk
Node A | Simpul B | Kluster bertahan | Failover | Detail |
---|---|---|---|---|
1 disk drive gagal | Tidak ada kegagalan | Ya | Tidak | Kluster terdegradasi hingga disk diganti. |
2 atau lebih disk drive gagal | Tidak ada kegagalan | Ya | Tidak | Kluster terdegradasi hingga disk diganti. |
1 atau lebih disk drive gagal | 1 atau lebih disk drive gagal | Tidak | Kluster offline. |
Kegagalan unit catu daya
Node A | Simpul B | Kluster bertahan | Failover | Detail |
---|---|---|---|---|
1 PSU gagal | Tidak ada kegagalan | Ya | Tidak | Kegagalan catu daya lain pada node A akan mengakibatkan failover ke node B. |
1 PSU gagal | 1 PSU gagal | Ya | Tidak | Kegagalan catu daya lain pada salah satu node akan mengakibatkan failover. |
2 PSU gagal | Tidak ada kegagalan | Ya | Ya | VM pada node A failover ke node B. |
2 PSU gagal (TBC) | 1 PSU gagal | Ya | Ya | VM pada node A failover ke node B. |
2 PSU gagal | 2 PSU gagal | Tidak | Kluster offline. |
Kegagalan jaringan
Node A | Simpul B | Kluster bertahan | Failover | Detail |
---|---|---|---|---|
Port 1, Port 2, Port 5, atau Port 6 gagal | Tidak ada kegagalan | Ya | Tidak | Port yang gagal tidak tersedia. Aplikasi yang mendengarkan di port ini terpengaruh |
1 atau kedua Port 3 dan Port 4 gagal | Tidak ada kegagalan | Ya | Ya | VM pada simpul A failover ke node B |
Kegagalan dan pembaruan node
Kegagalan node
Tabel ini meringkas skenario kegagalan ketika seluruh simpul gagal pada kluster Anda.
Node A | Simpul B | Kluster bertahan | Failover | Detail |
---|---|---|---|---|
Seluruh simpul gagal | Tidak ada kegagalan | Ya | Ya | VM dari node A failover ke node B |
Seluruh simpul gagal | Seluruh simpul gagal | Tidak | - | Kluster menjadi offline |
Reboot | Tidak ada kegagalan | Ya | Ya | VM dari node A failover ke node B |
Reboot | Reboot | Tidak | - | Kluster offline hingga boot ulang selesai |
Komponen inti gagal. Misalnya, motherboard, DIMM, dan disk OS. | Tidak ada kegagalan | Ya | Ya | VM dari node A failover ke node B |
Komponen inti gagal. Misalnya, motherboard, DIMM, dan disk OS. | Komponen inti gagal. Misalnya, motherboard, DIMM, dan disk OS. | Tidak | - | Kluster menjadi offline |
Pembaruan simpul
Node A | Simpul B | Kluster bertahan | Failover | Detail |
---|---|---|---|---|
Pembaruan simpul | Tidak ada kegagalan | Ya | Ya | VM dari node A failover ke node B |
Pembaruan simpul | 2 PSU gagal | Tidak | - | Kluster menjadi offline |
Pembaruan simpul | Seluruh simpul gagal atau offline | Tidak | - | Kluster menjadi offline |
Pembaruan simpul | Reboot | Tidak | - | Kluster menjadi offline |
Pembaruan simpul | Komponen inti gagal seperti motherboard, DIMM, dan disk OS. | Tidak | - | Kluster menjadi offline |
Langkah berikutnya
- Pelajari tentang Ukuran dan jenis VM untuk GPU Azure Stack Edge Pro.