可用性設定組概觀

適用於:✔️ Linux VM ✔️ Windows VM

注意

我們建議客戶選擇具有彈性協調流程模式的虛擬機器擴展集,以獲得功能範圍最廣泛的高可用性。 虛擬機器擴展集允許集中管理、設定和更新 VM 執行個體,並可自動增加或減少 VM 執行個體數目,以回應需求或已定義的排程。 可用性設定組僅提供高可用性。

本文提供 Azure 虛擬機器 (VM) 的可用性功能的概觀。

什麼是可用性設定組?

可用性設定組是 VM 的邏輯分組,可降低相互關聯的失敗導致相關 VM 同時關閉的機率。 可用性設定組會將 VM 放在不同的容錯網域中,以提升可靠性,特別是在區域不支援可用性區域時特別有用。 使用可用性設定組時,請在可用性設定組內建立兩部以上的 VM。 在可用性設定組中使用兩部以上的 VM 可協助高可用性應用程式,並符合 99.95% 的 Azure SLA。 使用可用性設定組不需要額外的成本,您只需支付您所建立之每個 VM 實例的費用。

相較於可用性區域,可用性設定組能改善 VM 對 VM 的延遲,因為可用性設定組中的 VM 配置時會較接近。 可用性設定組對於許多可能失敗有錯誤隔離,能將單一失敗點減到最少,並提供高可用性。 可用性設定組仍然容易受到某些共用基礎結構故障的影響,例如資料中心網路故障,這可能會影響多個容錯網域。

如需比可用性設定組所提供更高的可靠性,請使用可用性區域。 可用性區域提供最高的可靠性,因為每部 VM 都部署在多個資料中心,讓您免於受到個別資料中心電力、網路或冷卻等方面的損失。 如果您最高的優先順序是工作負載的最佳可靠性,請跨多個可用性區域複寫 VM。

可用性設定組如何運作?

基礎 Azure 平台會為可用性集合中的每部虛擬機器指派一個更新網域和一個容錯網域。 每個可用性設定組最多可設定 3 個容錯網域和 20 個更新網域。 建立可用性設定組之後,就無法變更這些設定。 更新網域表示虛擬機器群組和可同時重新啟動的基礎實體硬體。 當具有五個更新網域的一個可用性設定組中設定了超過五部虛擬機器,會將第六部虛擬機器放入與第一部虛擬機器相同的更新網域中,而第七部則會放入與第二部相同的更新網域中,以此類推。 重新啟動的更新網域順序可能不會在規劃的維護事件期間循序進行,而只會一次重新啟動一個更新網域。 在不同的更新網域上起始維護之前,重新啟動的更新網域有 30 分鐘的復原時間。

容錯網域定義共用通用電源和網路交換器的虛擬機器群組。 根據預設,可用性設定組內設定的虛擬機器最多可分散到三個容錯網域。 雖然將虛擬機器放入可用性設定組,並無法保護應用程式不會遭受作業系統失敗或特定應用程式失敗,但確實能侷限住潛在實體硬體故障、網路中斷或電力中斷等所帶來的影響。

Diagram showing various compute clusters split into fault domains and within those fault domains, we have multiple update domains

VM 也會與磁碟容錯網域一致。 此一配合行為可確保連接到 VM 的所有受控磁碟都位於相同的容錯網域。

在受管理的可用性設定組中只能建立使用受控磁碟的 VM。 受控磁碟容錯網域數目會依區域而異,每個區域會有兩個或三個受控磁碟容錯網域。 下列命令會擷取每個區域的容錯網域清單:

az vm list-skus --resource-type availabilitySets --query '[?name==`Aligned`].{Location:locationInfo[0].location, MaximumFaultDomainCount:capabilities[0].value}' -o Table

在某些情況下,相同可用性設定組中的兩個 VM 可能會共用一個容錯網域。 您可以藉由移至可用性設定組並且檢查 [容錯網域] 資料行,確認共用的容錯網域。 共用的容錯網域可能是當您部署 VM 時,完成下列順序所造成:

  1. 部署第一個 VM。
  2. 停止/解除配置第一個 VM。
  3. 部署第二個 VM。

在這些情況下,第二個 VM 的 OS 磁碟可能會建立在與第一個 VM 相同的容錯網域上,因此這兩個 VM 會位於相同的容錯網域。 若要避免此問題,我們建議您不要在部署之間停止/解除配置 VM。

Diagram showing how the fault domains for disks and VMs are aligned.

下一步

如需最佳作法資訊,請參閱 Azure 可用性最佳作法