跨區域使用可用性區域和異地災害復原的區域內復原 (Azure 事件方格)

本文描述 Azure 事件方格如何在具有可用性區域的區域中發生失敗時,支援事件方格資源定義和資料的自動區域內復原。 其也描述具有配對區域的區域中發生失敗時,事件方格如何支援將事件方格資源定義 (無資料) 自動復原至另一個區域。

使用可用性區域的區域內復原

每個可容忍本機失敗的 Azure 區域中,Azure 可用性區域的實際位置都不同。 其透過高效能網路進行連線,而往返延遲小於 2 毫秒。 每個可用性區域都是由一或多個配備獨立電力、冷卻系統和網路基礎結構的資料中心所組成。 如果其中一個區域受到影響,則其餘兩個區域會支援區域服務、容量和高可用性。 如需可用性區域的詳細資訊,請參閱區域和可用性區域。 在本文中,您也可以查看具有可用性區域的區域清單。

在區域中,會自動跨三個可用性區域 (可用時) 複寫主題、系統主題、網域以及事件訂用帳戶和事件資料的事件方格資源定義。 其中一個可用性區域發生失敗時,事件方格資源會自動容錯移轉至另一個可用性區域,而不需要任何人為介入。 您目前無法控制 (啟用或停用) 此功能。 現有的區域開始支援可用性區域時,將會自動容錯移轉現有的事件方格資源,以利用此功能。 不需採取客戶動作。

此圖顯示使用另一個區域來防範當地語系化災害和區域或大型地理災害的可用性區域。

跨區域進行異地災害復原

Azure 區域遇到長時間中斷時,您可能有興趣基於商務持續性而容錯移轉至替代區域的選項。 許多 Azure 區域有地理配對,有些則沒有。 如需具有配對區域的區域清單,請參閱所有地理位置的 Azure 跨區域複寫配對

針對具有地理配對的區域,事件方格提供功能,以將發佈流量容錯移轉至自訂主題、系統主題和網域的配對區域。 事件方格會在幕後將主題、系統主題、網域和事件訂用帳戶的資源定義自動同步至配對區域。 不過,事件資料不會複寫至配對區域。 在正常狀態下,事件會儲存在您為該資源所選取的區域中。 當發生區域中斷且 Microsoft 起始故障轉移時,新的事件會開始流向異地配對區域,並從該處分派,而不需要您介入。 中斷緩解之後,會從該處分派原始區域中所發佈和接受的事件。

Microsoft 起始的容錯移轉會由 Microsoft 在少數的情況下施行,用以將事件方格資源從受影響的區域容錯移轉至對應的地理配對區域。 Microsoft 有權決定執行此選項的時機。 此機制在容錯移轉使用者的流量之前,無須經過使用者同意。

您可以更新主題或網域的設定,來啟用或停用此功能。 選取 [跨地理位置] 選項 (預設值) 來啟用 Microsoft 起始的容錯移轉,以及選取 [區域] 予以停用。 如需設定此設定的詳細步驟,請參閱設定資料落地。 如果您選擇區域,則 Microsoft 不會將任何類型的數據復寫至另一個區域,而且您可以定義自己的災害復原計劃。 如需詳細資訊,請參閱針對 Azure 事件方格主題和網域建置您自己的災害復原方案。

顯示事件方格自定義主題之 [組態] 頁面的螢幕快照。

以下是您想要停用 Microsoft 起始故障轉移功能的一些原因:

  • Microsoft 起始的容錯移轉會以最大的努力完成。
  • 某些地理配對不符合您組織的數據落地需求。

在這類情況下,建議的選項是針對 Azure 事件方格主題和網域建置您自己的災害復原方案。 雖然此選項需要更多投入量,但可讓您更快速地進行容錯移轉,而且您可以控制次要區域的選擇。 如果您想要針對 Azure 事件方格主題實作用戶端災害復原,則請參閱針對 Azure 事件方格主題建置您自己的用戶端災害復原

RTO 和 RPO

災害復原是以兩個計量來測量:

  • 恢復點目標 (RPO):可能遺失的數據分鐘數或小時。
  • 復原時間目標 (RTO):服務可能會關閉的分鐘數或小時。

事件方格的自動故障轉移具有元數據的不同 RPO 和 RTO(主題、網域、事件訂閱)和數據(事件)。 如果您需要與下列不同規格,您仍然可以使用健康情況 API 主題來實作自己的用戶端故障轉移。

復原點目標 (RPO)

  • 中繼資料 RPO:零分鐘。 針對適用的資源,建立/更新/刪除資源時,會將資源定義同步複寫至地理配對。 發生容錯移轉時,不會遺失任何中繼資料。

  • 資料 RPO:發生容錯移轉時,會從配對區域處理新的資料。 一旦受影響的區域緩和中斷,就會從該處分派未處理的事件。 如果區域復原所需的時間比事件上所設定的存留時間值還要長,則可能會卸除資料。 若要緩解此資料遺失,建議您為事件訂用帳戶設定無效信件目的地。 如果受影響的區域遺失且無法復原,將會遺失一些數據。 在最佳案例中,訂閱者會跟上發佈速率,而且只會遺失幾秒鐘的數據。 最糟案例是訂閱者未主動處理事件且存留時間上限為 24 小時時,最多遺失 24 小時的資料。

復原時間目標 (RTO)

  • 中繼資料 RTO:容錯移轉決策是以配對區域中可用容量這類因素為基礎,而且可以持續 60 (含) 以上分鐘。 一旦起始故障轉移,在5分鐘內,事件方格就會開始接受主題和訂用帳戶的建立/更新/刪除呼叫。

  • 數據 RTO:與上述資訊相同。

重要

  • 在伺服器端災害復原的情況下,如果配對區域沒有額外容量可容納額外流量,則事件方格無法起始容錯移轉。 復原會以最大的努力完成。
  • 使用這項功能不需要付費。
  • 合作夥伴命名空間和合作夥伴主題不支援異地災害復原。

下一步

請參閱針對 Azure 事件方格主題建置您自己的用戶端災害復原