Share via


鏡像 Azure Cosmos DB (預覽)

Microsoft Fabric 中的鏡像提供順暢的 No-ETL 體驗,可將現有的 Azure Cosmos DB 數據與 Microsoft Fabric 中的其餘數據整合。 您可以近乎即時地將 Azure Cosmos DB 數據直接復寫到 Fabric OneLake,而不會影響交易式工作負載的效能。

OneLake 中的數據會以開放原始碼差異格式儲存,並自動提供給 Fabric 上所有分析引擎使用。

您可以使用 T-SQL 來執行複雜的匯總查詢,以及用於數據探索的 Spark。 您可以順暢地存取筆記本中的數據、使用數據科學來建置機器學習模型,以及使用整合所提供的 Copilot Direct Lake 建置商業智能報告。

重要

Azure Cosmos DB 的鏡像目前為預覽狀態。 預覽期間不支持生產工作負載。 目前僅支援適用於 NoSQL 的 Azure Cosmos DB 帳戶。

為什麼要在 Fabric 中使用鏡像?

使用 Fabric 中的鏡像,您不需要將多個廠商的不同服務拼湊在一起。 相反地,您可以享受高度整合、端對端且易於使用的產品,其設計目的是簡化分析需求,並針對開放性而建置。

如果您要在 Azure Cosmos DB 中尋找作業資料的分析,鏡像會提供:

  • 無 ETL、Azure Cosmos DB 數據上符合成本效益的近乎即時分析,而不會影響您的要求單位耗用量
  • 輕鬆地將各種來源的數據帶入 Fabric OneLake
  • 使用 v 順序進行差異數據表優化,以進行閃電快速讀取
  • 單鍵與 Power BI 與 Direct Lake 和整合 Copilot
  • 透過將各種來源的數據聯結至各種來源,以取得豐富的商業見解
  • 更豐富的應用程式整合以存取查詢和檢視

OneLake 數據會以開放原始碼 Delta Lake 格式儲存,可讓您將它與 Microsoft 內外的各種解決方案搭配使用。 此數據格式可協助您更輕鬆地為分析需求建置單一數據資產。

內建了哪些分析體驗?

鏡像資料庫是 Fabric Synapse 中的專案,資料倉儲 與倉儲SQL 分析端點不同。

適用於 Azure Cosmos DB 的網狀架構鏡像圖表。

每個鏡像 Azure Cosmos DB 資料庫都有三個專案,您可以在 Fabric 工作區中與其互動:

鏡像資料庫

鏡像資料庫會顯示在 Fabric OneLake 中停止或啟動複寫的複寫狀態和控件。 您也可以使用 Azure Cosmos DB 數據總管,以唯讀模式檢視源資料庫。 使用數據總管,您可以在來源 Azure Cosmos DB 資料庫中檢視容器並加以查詢。 這些作業會從您的 Azure Cosmos DB 帳戶取用要求單位(RU)。 源資料庫的任何變更都會立即反映在 Fabric 的源資料庫檢視中。 您無法從 Fabric 寫入源資料庫,因為您只能檢視數據。

SQL 分析端點

每個鏡像資料庫都有自動產生的 SQL 分析端點,可在鏡像程式所建立的 OneLake Delta 數據表之上提供豐富的分析體驗。 您可以存取熟悉的 T-SQL 命令,這些命令可以定義和查詢資料物件,但無法操作來自 SQL 分析端點的數據,因為它是唯讀複本。

您可以在 SQL 分析端點中執行下列動作:

  • 使用 T-SQL 探索 Delta Lake 數據表。 每個數據表都會從您的 Azure Cosmos DB 資料庫對應至容器。
  • 建立無程式代碼查詢和檢視,並以可視化方式探索它們,而不需要撰寫一行程序代碼。
  • 在同一個工作區中聯結和查詢其他鏡像資料庫、倉儲和 Lakehouses 中的數據。

除了 Microsoft Fabric SQL 查詢編輯器,還有廣泛的工具生態系統。 這些工具包括 Visual Studio Code、 Azure Data StudioSQL Server Management Studio,甚至是 GitHub Copilot。 您可以從您選擇的工具,將分析和深入解析產生加總。

語意模型

默認語意模型是自動布建的Power BI語意模型。 這項功能可讓商務計量建立、共用及重複使用。 如需詳細資訊,請參閱 語意模型

近乎即時復寫的運作方式為何?

當您在 Azure Cosmos DB 資料庫上啟用鏡像時,在線事務處理 (OLTP) 數據上的插入、更新和刪除作業會持續復寫到 Fabric OneLake 以供分析取用。

連續 備份 功能是鏡像的必要條件。 您可以在 Azure Cosmos DB 帳戶上啟用 7 天或 30 天的連續備份。

注意

鏡像不會使用 Azure Cosmos DB 的分析存放區或變更摘要作為異動數據擷取來源。 您可以繼續使用這些功能,以及鏡像。

將 Azure Cosmos DB 數據復寫到 Fabric OneLake 可能需要幾分鐘的時間。 視數據的初始快照集或更新/刪除的頻率而定,在某些情況下,複寫可能需要較長的時間。 複寫不會影響您為交易式工作負載配置的要求單位(RU)。

鏡像預期的情況

在鏡像之前,您應該考慮幾個考慮和支援的案例。

設定考量

若要鏡像資料庫,它應該已在 Azure 中布建。 您必須在帳戶上啟用連續備份作為必要條件。

  • 您一次只能個別鏡像每個資料庫。 您可以選擇要鏡像的資料庫。
  • 您可以在相同的工作區內多次鏡像相同的資料庫。 最佳做法是,可以跨 Lakehouse、倉儲或其他鏡像資料庫重複使用單一資料庫複本。 您不應該將多個鏡像設定為相同的資料庫。
  • 您也可以跨不同的網狀架構工作區或租用戶鏡像相同的資料庫。
  • Azure Cosmos DB 容器的變更,例如新增容器和刪除現有的容器,會順暢地復寫至 Fabric。 例如,您可以開始鏡像沒有容器的空白資料庫,而鏡像會順暢地挑選稍後時間點新增的容器。

支援巢狀數據

巢狀數據會顯示為 SQL 分析端點數據表中的 JSON 字串。 您可以在 OPENJSONT-SQL 查詢或檢視中使用 、 CROSS APPLYOUTER APPLY ,選擇性地展開此資料。 如果您使用 Power Query,您也可以套用 函 ToJson 式來展開此數據。

注意

Fabric 的大小限制為 8 KB 的字串資料行。 如需詳細資訊,請參閱 數據倉儲限制

處理架構變更

鏡像會自動跨 Azure Cosmos DB 專案復寫屬性,並變更架構。 專案中探索到的任何新屬性會顯示為新的數據行,如果有任何,則會在 Fabric 中以 Null 表示。

如果您重新命名專案中的屬性,Fabric 資料表會同時保留舊數據行和新數據行。 舊的數據行會顯示 null,而新的數據行會顯示在重新命名作業之後複寫的任何專案的最新值。

如果您在 Azure Cosmos DB 專案中變更屬性的數據類型,則可以針對可轉換的相容數據類型支持變更。 如果數據類型與 Delta 中的轉換不相容,則會以 Null 值表示。

SQL 分析端點數據表會將 Delta 資料類型轉換成 T-SQL 資料類型。

重複的數據行名稱

Azure Cosmos DB 支援以 JSON 標準為基礎的不區分大小寫的數據行名稱。 鏡像支援這些重複的數據行名稱,方法是新增 _n 至數據行名稱,其中 n 會是數值。

例如,如果 Azure Cosmos DB 專案具有 和 AddressName 作為唯一屬性,Fabric 數據表就會有addressName對應的 addressName 和數據AddressName_1行。 如需詳細資訊,請參閱 複寫限制

安全性

源資料庫的 連線 是以 Azure Cosmos DB 帳戶的帳戶密鑰為基礎。 如果您輪替或重新產生密鑰,您必須更新連線,以確保複寫能夠運作。 如需詳細資訊,請參閱 連線

設定連線之後,其他 Fabric 使用者不會直接看到帳戶密鑰。 您可以限制誰可以存取在 Fabric 中建立的連線。 從鏡像資料庫中的數據總管或分析端點,不允許寫入 Azure Cosmos DB 資料庫。

鏡像目前不支援使用只讀帳戶密鑰、單一登錄 (SSO) 搭配 Microsoft Entra 識別碼和角色型存取控制或受控識別進行驗證。

將數據復寫到 Fabric OneLake 之後,您必須保護對此數據的存取。

數據保護功能

您可以在 Microsoft Fabric 的鏡像資料庫中設定細微的安全性。 如需詳細資訊,請參閱 Microsoft Fabric 中的細微許可權。

您可以將資料表上的數據行篩選和述詞型資料列篩選保護至 Microsoft Fabric 中的角色和使用者:

您也可以使用動態資料遮罩,從非系統管理員使用者遮罩敏感資料:

網路安全性

目前,鏡像不支援 OneLake 上的私人端點或客戶自控密鑰 (CMK)。 Azure Cosmos DB 帳戶不支援鏡像,其網路安全性設定比所有網路寬鬆、使用服務端點、使用私人端點、使用IP位址,或使用任何其他可能限制公用網路存取帳戶的設定。 Azure Cosmos DB 帳戶應該開放給所有網路,以使用鏡像。

災害復原和復寫延遲

在 Fabric 中,您可以將內容部署至 Fabric 租使用者主區域以外的區域數據中心。 如需詳細資訊,請參閱 多地理位置支援

針對具有主要寫入區域和多個讀取區域的 Azure Cosmos DB 帳戶,鏡像會選擇最接近網狀架構容量設定區域的 Azure Cosmos DB 讀取區域。 此選取項目有助於提供鏡像的低延遲複寫。

當您將 Azure Cosmos DB 帳戶切換至復原區域時,鏡像會自動再次選取最接近的 Azure Cosmos DB 區域。

注意

鏡像不支援具有多個寫入區域的帳戶。

復寫至 OneLake 的 Cosmos DB 數據必須設定為處理全區域中斷。 如需詳細資訊,請參閱 OneLake 中的災害復原。

使用鏡像探索您的數據

您可以直接檢視及存取 OneLake 中的鏡像數據。 您也可以順暢地存取鏡像數據,而不需要進一步的數據移動。

深入瞭解如何使用 ADLS Gen2 API 或 SDK、OneLake 檔案總管和 Azure 儲存體 總管來存取 OneLake。

您可以從 SQL Server Management Studio (SSMS) 等工具連線到 SQL 分析端點,或使用 Microsoft Open Database 連線 ivity (ODBC) 和 Java Database 連線 ivity (JDBC) 等驅動程式。 如需詳細資訊,請參閱 SQL 分析端點連線能力。

您也可以使用下列服務存取鏡像資料:

  • Azure Databricks、Azure HDInsight 或 Azure Synapse Analytics 等 Azure 服務
  • 使用數據工程和數據科學案例快捷方式的 Fabric Lakehouse
  • Fabric 工作區中的其他鏡像資料庫或倉儲

您也可以建置獎牌架構解決方案,清除和轉換登陸鏡像資料庫作為銅層的數據。 如需詳細資訊,請參閱 Fabric 中的獎章架構支援。

定價

在公開預覽期間,鏡像功能或將鏡像數據儲存在 Fabric 中目前不需要任何費用。 透過 SQL、Power BI 或 Spark 查詢數據的計算使用量仍會根據網狀架構容量收費。 如需詳細資訊,請參閱 常見問題:定價

如果您在網狀架構鏡像中使用數據總管,您會根據要求單位 (RU) 使用量來累積一般成本,以探索容器並查詢來源 Azure Cosmos DB 資料庫中的專案。 Azure Cosmos DB 連續備份功能是鏡像的必要條件:適用於連續備份的標準費用。 連續備份計費的鏡像不會產生額外費用。 如需詳細資訊,請參閱 Azure Cosmos DB 價格

後續步驟