Azure 提供一組完整的可靠性功能,可協助您符合工作負載需求。 Azure 可靠性檔提供每個 Azure 服務如何支援這些平臺可靠性功能的服務特定指南,例如暫時性錯誤處理、可用性區域、多區域支援,以及備份支援。 若要查看目前的可靠性服務指南清單,請參閱 依服務的可靠性指南。
除了可靠性服務指南之外,Azure 可靠性檔也包含一般資訊,例如:
- Azure 區域:Azure 區域的資訊,包含配對區域、非配對區域,以及不同的區域設定。
- Azure 可用性區域:可用性區域的相關信息,包括它們如何支援高可用性和災害復原。 本節也包含支援可用性區域的 Azure 服務和區域清單。
-
可靠性概念:基本可靠性概念,例如:
- 商務持續性、高可用性和災害復原。
- 備援、復寫(數據備援)和備份
- 容錯移轉和容錯回復。
- Microsoft與您之間共同的責任。
什麼是可靠性?
可靠性 是指工作負載在可接受的服務層級上一致執行的能力,並符合商務持續性需求。 可靠性是雲端運算中的關鍵概念。 在 Azure 中,可靠性是透過多種因素組合而實現,包括平台本身的設計、各項服務、應用程式結構,以及最佳做法的實作。
在工作負載中實現可靠性的兩種關鍵方法是:
- 彈性: 在出現問題(例如臨時錯誤、基礎設施中斷或意外需求高峰)時承受並繼續運作的能力。 彈性可協助您避免中斷。
- 可恢復性: 在中斷後恢復正常操作的能力。 如果確實發生中斷,可恢復性可協助您還原回可靠狀態。
Azure 平臺和服務提供許多可靠性功能,例如可用性區域、多區域支援、資料複寫,以及備份和還原。 設計工作負載以符合其商務持續性需求時,必須考慮這些功能。
小提示
可靠性也會併入解決方案設計的其他元素,包括如何安全地部署變更、如何管理效能以避免因高負載而停機,以及如何測試與驗證解決方案的每個部分。。 若要深入了解,請參閱 Azure Well-Architected Framework (部分機器或 AI 翻譯)。
「Azure」區域
Azure 在全球超過 60 個區域提供,分布於多個地理位置。 每個區域都是一組實體設施,包含資料中心與網路基礎結構。 所有區域可能會劃分為稱做「地理位置」的地理區域。 每個地理位置都是一個資料落地邊界,並可能包含一個或多個區域。
Azure 區域 提供特定類型的復原選項。 許多區域都提供 可用性區域,有些區域則有 配對區域,而其他區域則沒有配對。 選擇服務的區域時,請務必注意該區域中可用的復原選項。
- 若要檢視 Azure 區域清單,請參閱 Azure 區域清單。
- 若要查看部署至 Azure 各區域的服務清單,請參閱依區域的產品可用性 (英文)
Azure 可用性區域
許多 Azure 區域會提供 可用性區域,這是一個區域內獨立的資料中心群組。 可用性區域是達成 Azure 平臺上可靠性的重要方式,因為它們會在區域內提供某種層級的實體隔離。
可用性區域彼此距離足夠接近,可與其他可用性區域維持低延遲連線,但又相距夠遠,足以降低多個區域同時受到本機中斷或天氣影響的可能性。 可用性區域擁有獨立的電源、冷卻和網路基礎結構。 其設計目的是當一個區域遇到中斷時,其餘區域仍可支援區域服務、容量與高可用性。
- 如需可用性區域的詳細資訊,請參閱什麼是可用性區域?(部分機器或 AI 翻譯)。
- 若要檢視哪些區域支援可用性區域,請參閱 Azure 區域清單。
可靠性概念
可靠性概念一節提供一些在 Azure 中支撐可靠性的重要概念和原則概觀。
商務持續性、高可用性和災害復原
商務持續性規劃可理解為透過高可用性和災害復原設計進行的持續性風險管理流程。
考慮商務持續性時,請務必理解下列詞語:
商務持續性是指企業在失敗、中斷或災難期間仍能持續營運的狀態。 商務持續性需要主動式規劃、準備,並實作復原性的系統與流程。
高可用性指的是設計解決方案以滿足企業對可用性的需求,並具有復原性以因應日常可能影響可用時間需求的問題。
災害復原是針對非常見風險與可能導致之重大中斷情況進行規劃。
如需透過高可用性和災害復原設計進行商務持續性和商務持續性規劃的資訊,請參閱 什麼是商務持續性、高可用性和災害復原?。
備援、復寫和備份
我們通常會將雲端視為全球分散式、無處不在的系統。 不過,實際上雲端是由數據中心內執行的硬體所組成。 復原需要您考慮與雲端裝載元件執行所在的實體位置相關聯的一些風險。
備援 是維護服務元件多個相同複本的能力,並且以防止任何一個元件變成單一失敗點的方式使用這些複本。
複製或數據冗餘是維護多個數據副本的能力,稱為複本。
備份 是維護時間戳數據複本的能力,可用來還原遺失的數據。
如需備援、復寫和備份的簡介,請參閱 什麼是備援、復寫和備份?。
容錯移轉和容錯回復
維護應用程式和數據副本的冗餘複本的常見原因是能夠執行故障轉移。 透過故障轉移,您可以將流量和要求從狀況不良的實例重新導向到狀況良好的實例。 然後,一旦原始實例再次變成狀況良好,您可以執行容錯回復以返回原始組態。
如需故障轉移和容錯回復的詳細資訊,請參閱 什麼是故障轉移和容錯回復?。
共同責任
Azure 服務具備因應多種常見失敗的復原性,每項產品皆提供服務等級協定 (SLA),說明了可預期的可用時間。 不過,工作負載的整體可靠性取決於您如何設計解決方案來滿足業務需求。 某些商務持續性計劃可能會將某些失敗風險視為不重要,但另一些方案則可能會將其視為關鍵性。
在 Azure 公用雲端平台中,可靠性是 Microsoft 與您共用的責任。 由於您所設計與部署的每項工作負載都具有不同層級的可靠性,因此從可靠性觀點來看,您必須理解哪些層級該主要由誰負責。 若要進一步瞭解共同責任的運作方式,尤其是在面對中斷或災難時,請參閱 可靠性的共同責任。