可用性設定組概觀

適用於: ✔️ Linux 虛擬機 ✔️ Windows 虛擬機

本文概述了 Azure 虛擬機(VM)的可用性特性。

注意

我們建議客戶選擇虛擬機器擴展集搭配彈性編排模式以提供高可用性與最廣泛的功能。 虛擬機器規模設定組合

  • 允許集中管理、設定和更新 VM 實例。
  • 自動增加或減少 VM 實例數目,以回應需求或定義的排程。

可用性組合提供高可用性,但無法提供與可用性區域同等的韌性。

什麼是可用性設定組?

可用性設定組是 VM 的邏輯分組,可降低相互關聯的失敗導致相關 VM 同時關閉的機率。 可用性集將虛擬機分散在多個故障領域,提升可靠性。 這種配置在不支援可用性區域的地區特別有用。

當您使用可用性設定組時,請在可用性設定組內建立兩個或多個 VM。 在可用性集中使用兩個或以上虛擬機有助於保持應用程式高度可用,並符合 99.95% Azure 服務水準協議(SLA)。 使用可用性設定組不需要額外費用。 且只須為您建立的每一個 VM 執行個體付費。

可用性集比可用性區域提供更低的虛擬機間延遲,因為虛擬機彼此物理距離較近。 可用性設定組具備容錯隔離功能,以減少單一故障點並提供高可用性。 可用性組仍可能受到某些共享基礎設施故障的影響,例如資料中心層級的網路故障,這會影響多個故障域。

如需比可用性設定組所提供更高的可靠性,請使用可用性區域。 可用性區域具有最高的可靠性。 每個 VM 都會部署在多個資料中心,以協助您避免在個別數據中心失去電源、網路或冷卻。 如果您的最高優先順序是為工作負載提供最佳可靠性,請跨多個可用性區域複寫您的虛擬機器。

可用性設定組如何運作?

底層的 Azure 平台會為你的可用性設定中的每個虛擬機器分配一個 更新網域 以及一個 錯誤網域。 每個可用性設定組最多可以有 3 個容錯網域和 20 個更新網域。 這些設定在建立可用性設定後就無法更改。

更新網域

更新網域表示可以同時重新啟動的虛擬機和基礎實體硬體群組。

如果在一個有五個更新網域的可用性設定集中,有超過五個虛擬機器,第六台虛擬機器會被放在與第一個相同的更新網域,第七台則與第二個相同的更新網域,依此類推。

在計劃性維護期間,重新啟動的更新網域順序可能不會循序進行,但一次只會重新啟動一個更新網域。 重新啟動的更新網域需要 30 分鐘才能復原,再在不同的更新網域上開始維護。

故障域

容錯網域定義共用通用電源和網路交換器的虛擬機器群組。 根據預設,可用性設定組內設定的虛擬機器最多可分散到三個容錯網域。

將虛擬機放入可用性設定組並不會保護您的應用程式免於作業系統或應用程式特定的失敗。 但它確實會限制潛在的實體硬體故障、網路中斷或電源中斷的影響。

顯示計算群集分割成容錯域,容錯域中包含更新域的圖表。

磁碟故障網域

VM 會與磁碟故障網域對齊。 對齊配置可確保所有連接到虛擬機器 (VM) 的受控磁碟位於相同的故障區域。

在受管理的可用性設定組中只能建立使用受控磁碟的 VM。 受控磁碟容錯網域的數目依區域而異:每個區域的兩個或三個受控磁碟容錯網域。

下列命令會擷取每個區域的容錯網域清單:

az vm list-skus --resource-type availabilitySets --query '[?name==`Aligned`].{Location:locationInfo[0].location, MaximumFaultDomainCount:capabilities[0].value}' -o Table

共用容錯網域

在某些情況下,相同可用性設定組中的兩個 VM 可能會共用一個容錯網域。 您可以移至可用性設定組並檢查容錯網域數據行,以確認共用容錯網域 。

如果您的 VM 有共用容錯網域,可能是因為您在部署 VM 時採取了這些動作:

  1. 部署第一個 VM。
  2. 停止或解除分配第一個虛擬機器。
  3. 部署第二個 VM。

在這些情況下,第二個 VM 的 OS 磁碟可能會建立在與第一個 VM 相同的容錯網域上,因此這兩個 VM 會位於相同的容錯網域。 若要避免此問題,請勿在部署期間停止或解除分配 VM。

故障域與區域虛擬機器擴展集和可用性設定組對齊的圖表。

  • 有關 Azure 可用性的最佳實務,請參閱特定 Azure 服務的 韌性檢查清單