共用方式為


Microsoft Fabric 中的可靠性

本文說明 Microsoft Fabric 中的可靠性支援,以及具有可用性區域的區域復原能力和跨區域復原和商務持續性。 如需更多關於 Azure 可靠性的詳細概觀,請參閱 Azure 可靠性

可用性區域支援

可用性區域 是每個 Azure 區域內的數據中心實體分隔群組。 當某個區域失敗時,服務可以轉移到其他剩餘的區域之一。

Fabric 在商業上合理地努力支援區域冗餘可用性區域,資源會自動跨區域複製,您不需進行任何安裝或設定。

必要條件

  • Fabric 目前在有限的區域中提供部分可用性區域支援。 此部分可用性區域支援涵蓋多項體驗 (及/或體驗內的特定功能)。
  • 事件串流之類的體驗不支援可用性區域。
  • 如果您使用 OneLake,數據工程支援可用區域。 如果您使用ADLS Gen2等其他數據源,則必須確定已啟用區域備援記憶體 (ZRS)。
  • 區域可用性不一定適用於處於預覽狀態的 Fabric 體驗和/或功能。
  • Power BI 中的內部部署閘道和大型語意模型不支援可用性區域。
  • Data Factory (管線) 支援西歐的可用性區域,但如果區域中斷,新的或正在進行的管線執行可能會失敗。

支援的區域

Fabric 會盡合理的商業努力,在各地區提供可用區域支援,如下所示:

美洲 Power BI 資料超市 資料倉儲 即時分析 Data Factory (管線) 資料工程 SQL Database 啟動項
巴西南部
加拿大中部
美國中部
美國東部
美國東部 2
美國中南部
美國西部 2
美國西部 3
歐洲 Power BI 資料超市 資料倉儲 即時分析 Data Factory (管線) 資料工程 SQL Database 啟動項
法國中部
德國中西部
義大利北部
北歐
挪威東部
波蘭中部
英國南部
西歐
瑞典中部
中東 Power BI 資料超市 資料倉儲 即時分析 Data Factory (管線) 資料工程 SQL Database 啟動項
卡達中部
以色列中部
非洲 Power BI 資料超市 資料倉儲 即時分析 Data Factory (管線) 資料工程 SQL Database 啟動項
南非北部
亞太地區 Power BI 資料超市 資料倉儲 即時分析 Data Factory (管線) 資料工程 SQL Database 啟動項
澳大利亞東部
日本東部
東南亞

區域關閉體驗

在全區域中斷期間,不需在區域復原期間採取任何動作。 支援區域中所列區域的 Fabric 功能會自動自我修復和重新平衡,以充分利用狀況良好的區域。 如果主要節點位於失敗的區域,執行Spark作業可能會失敗。 在這種情況下,必須重新提交作業。

重要

雖然 Microsoft 努力提供統一且一致的可用區域支援,但在某些可用區域失敗的情況下,位於客戶需求波動較大的 Azure 區域中的 Fabric 容量可能會經歷比平常更高的延遲。

跨區域災害復原和商務持續性

災害復原 (DR) 是指組織用來從高影響事件中復原的做法,例如自然災害或導致停機時間和數據遺失的失敗部署。 無論原因為何,解決災害的最佳辦法是定義完善且經過測試的 DR 方案,以及主動支援 DR 的應用程式設計。 開始建立災害復原計劃之前,請參閱 設計災害復原策略的建議

針對DR,Microsoft使用 共同責任模型。 在此模型中,Microsoft可確保基準基礎結構和平臺服務可供使用。 不過,許多 Azure 服務不會自動複製數據,也不會在發生故障的區域自動切換至另一個可用的區域進行跨區域數據同步。 針對這些服務,您必須負責設定適用於您工作負載的災害復原計劃。 在 Azure 平臺即服務上執行的大部分服務 (PaaS) 供應專案都提供支援DR的功能和指引。 您可以使用 服務特定功能來支援快速復原 ,以協助開發DR方案。

本節描述 Fabric 的災害復原方案,其設計目的是協助組織在發生非計劃性區域災害時,讓資料保持安全且可供存取。 方案中會涵蓋下列主題:

  • 跨區域複寫:Fabric 為儲存在 OneLake 中的資料提供跨區域複寫。 您可以根據需求加入或退出此功能。

  • 災害後的資料存取:在區域性災害案例中,Fabric 會保證資料存取,但有特定限制。 雖然容錯移轉後會限制新項目的建立或修改,但主要焦點會維持在確保現有資料保持可供存取且完好無損。

  • 復原指導:Fabric 提供一組結構化的指示,以引導您完成復原程序。 結構化指導可讓您更輕鬆地轉換回一般作業。

Power BI 現在是 Fabric 的一部分,已備妥穩固的災害復原系統,並提供下列功能:

  • 預設使用 BCDR:Power BI 會自動在其預設供應項目中包含災害復原功能。 您不需要個別選擇加入或啟用此功能。

  • 跨區域複寫:Power BI 使用 Azure 儲存體異地備援複寫Azure SQL 異地備援複寫,以保證備份執行個體存在於其他區域,而且可供使用。 這表示資料會跨不同區域複寫,以強化其可用性,並降低與區域中斷相關的風險。

  • 災害後的持續服務和存取:即使在干擾性事件期間,Power BI 項目仍可供在唯讀模式下存取。 這些項目包括語意模型、報表和儀表板,可確保企業可以繼續其分析和決策程序,而不會造成重大障礙。

如需詳細資訊,請參閱 Power BI 高可用性、容錯移轉和災害復原常見問題

重要

對於住家所在的區域沒有 Azure 配對區域且受災害影響的客戶,即便這些容量內的資料已被複寫,使用 Fabric 容量的能力仍可能會受到影響。 這項限制與主區域的基礎結構有關,對於能力的運作至關重要。

主區域和容量功能

若要有效地規劃災害復原,請務必了解主區域與容量位置之間的關聯性。 了解主區域和容量位置可協助您有策略地選取容量區域,以及對應的複寫和復原程序。

組織租戶和資料儲存的主區域會根據第一位使用者註冊時提供的帳單地址位置來設定。 如需租用戶設定的進一步詳細資料,請移至 Power BI 實作規劃:租用戶設定。 當您建立新的容量時,資料儲存體預設會設定為主要區域。 如果您想要將資料儲存體區域變更為另一個區域,則必須啟用 Fabric Premium 的功能 Multi-Geo

重要

為數據容量選擇其他區域並不會將所有資料完全遷移到該區域。 某些資料元素仍會儲存在主區域中。 若要查看哪些資料會留在主區域,以及哪些資料會儲存在已啟用 Multi-Geo 的區域,請參閱設定 Fabric Premium 的 Multi-Geo 支援

如果主區域沒有配對區域,則當主區域發生災害時,任何已啟用 Multi-Geo 的區域中的容量都可能會面臨作業問題,因為核心服務功能會繫結至主區域。

如果您選取歐盟內已啟用 Multi-Geo 的區域,則您的資料保證會儲存在歐盟資料界限內。

若要了解如何識別主區域,請參閱尋找 Fabric 主區域

災害復原容量設定

Fabric 會在容量設定頁面上提供災害復原開關。 Azure 的區域配對與 Fabric 的服務存在保持一致的地方便可使用。 以下是此開關的具體細節:

  • 角色存取:只有具有容量管理員角色或更高階角色的使用者才能使用此開關。

  • 細微性:此開關的細微性是容量層級。 其同時適用於 Premium 和 Fabric 容量。

  • 資料範圍:災害復原切換特別適用於 OneLake 資料,其中包括 Lakehouse 和倉儲資料。 此開關不會影響儲存在 OneLake 外部的資料。

  • Power BI 的 BCDR 持續性:雖然 OneLake 資料的災害復原可以開啟和關閉,但不論開關是開啟還是關閉,都一律支援適用於 Power BI 的 BCDR。

  • 頻率:變更災害復原容量設定後,必須等候 30 天才能再次改變。 等候期間已被設置,以維持穩定性並防止頻繁切換,

災害復原租戶設定的螢幕擷取畫面。

附註

啟用災害復原容量設定或建立容量內的新工作區之後,數據復寫可能需要一些時間才能啟動。 您可以在 Microsoft Fabric 容量計量應用程式中,檢查特定工作區的記憶體是否以「OneLake BCDR 記憶體」計費,以確認復寫已經開始。

資料複寫

當您開啟災害復原容量設定時,跨區域複寫會啟用為 OneLake 資料的災害復原功能。 Fabric 平台會根據 Azure 區域進行配置,以提供異地備援配對。 不過,某些區域沒有 Azure 配對區域,或配對區域不支援 Fabric。 針對這些區域,便無法使用資料複寫。 如需詳細資訊,請參閱具有可用性區域但沒有區域配對的區域Fabric 區域可用性

附註

雖然 Fabric 在 OneLake 中提供資料複寫解決方案來支援災害復原,但有顯著的限制。 例如,KQL 資料庫和查詢集的資料會儲存在 OneLake 外部,這表示需要個別的災害復原方法。 如需每個 Fabric 項目的災害復原方法詳細資料,請參閱本文件的其餘部分。

計費

Fabric 中的災害復原功能可讓您異地複寫資料,以提高安全性和可靠性。 此功能會耗用更多儲存體和交易,兩者分別會以 BCDR 儲存體和 BCDR 作業的形式計費。 您可以在 Microsoft Fabric 容量計量應用程式中監視和管理這些顯示為個別明細項目的成本。

如需所有相關災害復原成本的詳盡明細,以協助您據此進行規劃和編列預算,請參閱 OneLake 計算和儲存體耗用量

設定災害復原

雖然 Fabric 提供災害復原功能來支援資料復原,但您必須遵循特定手動步驟,才能在中斷期間還原服務。 本節詳細說明為了針對潛在的中斷做好準備,您所應該採取的動作。

階段 1:準備

  • 啟用災害復原容量設定:定期檢閱並設定災害復原容量設定,以確保其符合您的保護和效能需求。

  • 建立資料備份:以符合災害復原方案的方式,將儲存在 OneLake 外部的重要資料複製到另一個區域。

階段 2:災害容錯移轉

當重大災害使得主要區域無法復原時,Microsoft Fabric 會起始區域容錯移轉。 直到容錯移轉完成並在 Microsoft Fabric 支援頁面上張貼通知之前,無法存取 Fabric 入口網站。

容錯移轉完成所需的時間可能不同,但通常不到一小時。 容錯移轉完成後,預期會有以下情況:

  • Fabric 入口網站:您可以存取入口網站,而且瀏覽現有工作區、工作區中的任務流程和項目等讀取作業會繼續運作。 所有寫入作業 (例如建立或修改工作區) 則會暫停。

  • Power BI:您可以執行讀取作業,例如顯示儀表板和報表。 不支援重新整理、報表發佈作業、儀表板和報表修改,以及其他需要變更中繼資料的作業。

  • Lakehouse/倉儲:您無法開啟這些項目,但可以透過 OneLake API 或工具來存取檔案。

  • Spark 作業定義:您無法開啟 Spark 作業定義,但可透過 OneLake API 或工具來存取程式碼檔案。 容錯移轉後會儲存任何中繼資料或設定。

  • 筆記本:您無法開啟筆記本,而且在災害發生後不會儲存程式碼內容。

  • ML 模型/實驗:您無法開啟 ML 模型或實驗。 災害發生後不會儲存程式碼內容和中繼資料,例如執行計量和設定。

  • 資料流程 Gen2/管線/Eventstream:您無法開啟這些項目,但可以使用受支援的災害復原目的地 (lakehouses 或倉儲) 來保護資料。

  • KQL 資料庫/查詢集:容錯移轉後無法存取 KQL 資料庫和查詢集。 需要進行更多必要步驟才能保護 KQL 資料庫和查詢集中的資料。

在災害案例中,Fabric 入口網站和 Power BI 處於唯讀模式,而且其他 Fabric 項目無法使用,您可以使用 API 或第三方工具來存取儲存在 OneLake 中的資料。 入口網站和 Power BI 都會保有對該資料執行讀寫作業的能力。 此能力可確保重要資料仍可供存取和可供修改,並降低業務營運的中斷可能性。

OneLake 資料仍可透過多個通道來存取:

OneLake 目錄在災難容錯移轉期間仍可使用,但僅限唯讀模式:*[探索] 索引標籤:您可以存取 [探索] 索引標籤以檢視所有項目與工作區,包括其中繼資料與相關詳細資料。 * 治理索引標籤:您可以存取 [治理] 索引卷標,以檢視深入解析、建議的動作和治理工具,這些都是根據故障轉移前最近的成功模型重新整理而生成的。

階段3:復原方案

雖然 Fabric 可確保資料在災害發生後仍可供存取,但您也可以採取行動,將其服務完全恢復到事件發生前的狀態。 本節提供逐步指南,以協助您完成復原程序。

復原步驟

  1. 在災害發生後,於任何區域中建立新的 Fabric 容量。 鑒於這類事件發生期間的需求很高,建議您選取主要地理位置以外的區域,以提高計算服務可用性的可能性。 如需如何建立容量的相關資訊,請參閱購買 Microsoft Fabric 訂用帳戶

  2. 在新建立的容量中建立工作區。 如有必要,請使用與舊工作區相同的名稱。

  3. 使用與您想要復原的項目相同的名稱建立項目。 如果您使用自訂指令碼來復原 Lakehouse 和倉儲,此步驟便很重要。

  4. 還原項目。 針對每個項目,請遵循體驗特定災害復原指導中的相關章節來還原項目。

下一步