共用方式為


Azure Stack Edge Pro GPU 裝置上的叢集容錯移轉案例

本文會介紹常見的容錯移轉案例、Azure Stack Edge 裝置如何回應,以及在容錯移轉發生時,對叢集上已部署工作負載的整體影響。

有關容錯移轉

Azure Stack Edge 可以設定為單一獨立裝置或雙節點叢集。 在雙節點叢集中,叢集節點會為叢集上執行的應用程式和服務提供高可用性。

如果其中一個叢集節點失敗,其他節點即會開始提供服務,這個流程稱為容錯移轉。 如果與裝置的一或兩個節點相關聯的硬體元件 (例如磁碟機、電源供應器 (PSU) 或是網路) 失敗,或是更新裝置節點時,也可能會發生容錯移轉。

容錯移轉案例

容錯移轉的發生原因包括硬體元件失敗、節點失敗,或是更新 Azure Stack Edge 叢集。

硬體失敗

下表摘要說明與裝置叢集相關聯的實體硬體元件失敗案例,例如一或多個磁碟機、電源供應器或網路。

磁碟機失敗

節點 A 節點 B 叢集存續 容錯移轉 詳細資料
1 個磁碟機失敗 沒有失敗 No 叢集會降級,直到更換磁碟為止。
2 個以上磁碟機失敗 沒有失敗 No 叢集會降級,直到更換磁碟為止。
1 個以上磁碟機失敗 1 個以上磁碟機失敗 No 叢集離線。

電源供應器單位失敗

節點 A 節點 B 叢集存續 容錯移轉 詳細資料
1 個 PSU 失敗 沒有失敗 No 節點 A 上的另一個電源供應器失敗會導致容錯移轉至節點 B。
1 個 PSU 失敗 1 個 PSU 失敗 No 任一節點上的另一個電源供應器失敗會導致容錯移轉。
2 個 PSU 失敗 沒有失敗 Yes Yes 節點 A 上的 VM 容錯移轉至節點 B。
2 個 PSU 失敗 (TBC) 1 個 PSU 失敗 Yes Yes 節點 A 上的 VM 容錯移轉至節點 B。
2 個 PSU 失敗 2 個 PSU 失敗 No 叢集離線。

網路失敗

節點 A 節點 B 叢集存續 容錯移轉 詳細資料
連接埠 1、連接埠 2、連接埠 5 或連接埠 6 失敗 沒有失敗 No 失敗的連接埠無法使用。 接聽此連接埠的應用程式會受到影響
連接埠 3 和連接埠 4 的其中一個或兩個都失敗 沒有失敗 Yes Yes 節點 A 上的 VM 容錯移轉至節點 B

節點失敗和更新

節點失敗

下表摘要說明叢集上整個節點失敗時的失敗案例。

節點 A 節點 B 叢集存續 容錯移轉 詳細資料
整個節點失敗 沒有失敗 Yes Yes 節點 A 的 VM 容錯移轉至節點 B
整個節點失敗 整個節點失敗 No - 叢集離線
重新啟動 沒有失敗 Yes Yes 節點 A 的 VM 容錯移轉至節點 B
重新啟動 重新啟動 No - 叢集會離線,直到重新啟動完成為止
核心元件失敗。 例如,主機板、DIMM 和 OS 磁碟。 沒有失敗 Yes Yes 節點 A 的 VM 容錯移轉至節點 B
核心元件失敗。 例如,主機板、DIMM 和 OS 磁碟。 核心元件失敗。 例如,主機板、DIMM 和 OS 磁碟。 No - 叢集離線

節點更新

節點 A 節點 B 叢集存續 容錯移轉 詳細資料
節點更新 沒有失敗 Yes Yes 節點 A 的 VM 容錯移轉至節點 B
節點更新 2 個 PSU 失敗 No - 叢集離線
節點更新 整個節點失敗或離線 No - 叢集離線
節點更新 重新啟動 No - 叢集離線
節點更新 核心元件失敗,例如主機板、DIMM 和 OS 磁碟。 No - 叢集離線

下一步