Microsoft Fabric 中的鏡像 提供順暢的無 ETL 體驗,可將現有的 Azure Cosmos DB 資料與 Microsoft Fabric 中的其餘資料整合。 您的 Azure Cosmos DB 資料會以近乎即時的方式持續直接複寫到 Fabric OneLake,而不會對交易工作負載或耗用要求單位 (RU) 造成任何效能影響。
OneLake 中的資料會以開放原始碼差異格式儲存,並自動提供給 Fabric 上的所有分析引擎。
您可以使用內建的 Power BI 功能,在 DirectLake 模式中存取 OneLake 中的資料。 透過 Copilot Fabric 的增強功能,您可以使用生成式 AI 的強大功能來取得業務資料的重要見解。 除了 Power BI 之外,您還可以使用 T-SQL 來執行複雜的彙總查詢,或使用 Spark 進行資料探索。 您可以順暢地存取筆記本中的資料,並使用資料科學來建置機器學習模型。
這很重要
Azure Cosmos DB 的鏡像目前處於 預覽狀態。 預覽期間不支援生產工作負載。 目前僅支援適用於 NoSQL 的 Azure Cosmos DB 帳戶。
為什麼要在 Fabric 中使用鏡像?
使用 Fabric 中的鏡像,您不需要將來自多個供應商的不同服務拼湊在一起。 相反,您可以享受高度整合、端對端且易於使用的產品,該產品旨在簡化您的分析需求並專為開放性而構建。
如果您要在 Azure Cosmos DB 中尋找作業資料的 BI 報告或分析,鏡像會提供:
- 無 ETL、符合成本效益的近乎即時存取 Azure Cosmos DB 資料,而不會影響您的要求單位耗用量
- 輕鬆將各種來源的資料帶入 Fabric OneLake
- 具有 v 階的 Delta 表最佳化,可實現閃電般的讀取速度
- 與 Power BI 與 Direct Lake 的一鍵集成,以及 Copilot
- 通過連接各種來源的數據獲得豐富的業務洞察
- 更豐富的應用程式整合,可存取查詢和檢視
OneLake 數據以開放原始碼 Delta Lake 格式儲存,可讓您將它與 Microsoft 內部和外部的各種解決方案搭配使用。 此資料格式有助於更輕鬆地建置單一資料資產,以滿足您的分析需求。
內建哪些分析體驗?
鏡映資料庫是 Fabric Data Warehousing 中的項目,與 倉儲 和 SQL 分析端點不同。
每個鏡像 Azure Cosmos DB 專案都會建立下列專案,您可以在 Fabric 工作區中互動:
鏡像資料庫
鏡像資料庫會顯示複寫狀態,以及在 Fabric OneLake 中停止或啟動複寫的控制項。 您也可以使用 Azure Cosmos DB 資料總管,以唯讀模式檢視來源資料庫。 使用資料總管,您可以檢視來源 Azure Cosmos DB 資料庫中的容器,並進行查詢。 這些作業會取用來自 Azure Cosmos DB 帳戶的要求單位 (RU)。 來源資料庫的任何變更都會立即反映在 Fabric 的來源資料庫檢視中。 不允許從 Fabric 寫入來源資料庫,因為您只能檢視資料。
SQL 分析端點
每個鏡像資料庫都有一個自動產生的 SQL 分析端點,可在鏡像程式所建立的 OneLake 差異資料表之上提供豐富的分析體驗。 您可以存取熟悉的 T-SQL 命令,這些命令可以定義和查詢資料物件,但無法操作 SQL 分析端點的資料,因為它是唯讀複本。
您可以在 SQL 分析端點中執行下列動作:
- 使用 T-SQL 探索 Delta Lake 資料表。 每個資料表都會從 Azure Cosmos DB 資料庫對應至容器。
- 建立無程式碼查詢和視圖,並以視覺化方式探索它們,而無需編寫一行程式碼。
- 聯結和查詢相同工作區中其他鏡像資料庫、倉儲和 Lakehouse 中的資料。
- 您可以根據 SQL 查詢或視圖輕鬆地視覺化和建立 BI 報告。
除了 SQL 查詢編輯器之外,還有廣泛的工具生態系統。 這些工具包括 帶有 Visual Studio Code 的 mssql 擴展、 SQL Server Management Studio (SSMS),甚至 GitHub Copilot。 您可以從您選擇的工具增強分析和洞察生成。
語意模型
您可以在資料庫上建立 Power BI 語意模型,以允許建立、共用和重複使用商務計量。 如需詳細資訊,請參閱 建立 Power BI 語意模型。
近乎即時的複寫如何運作?
當您在 Azure Cosmos DB 資料庫上啟用鏡像時,線上交易處理 (OLTP) 資料的插入、更新和刪除作業會持續複寫到 Fabric OneLake 中,以供分析取用。
連續備份功能是鏡像的先決條件。 您可以在 Azure Cosmos DB 帳戶上啟用 7 天或 30 天連續備份。 如果您要啟用專門用於鏡像的連續備份,建議使用 7 天連續備份,因為它是免費的。
備註
鏡像不會使用 Azure Cosmos DB 的分析存放區或變更摘要作為變更資料擷取來源。 您可以繼續獨立使用這些功能,以及鏡像。
可能需要幾分鐘的時間才能將 Azure Cosmos DB 資料複寫到 Fabric OneLake。 根據資料的初始快照或更新/刪除的頻率,在某些情況下複寫也可能需要更長的時間。 複寫不會影響您配置給交易工作負載的要求單位 (RU)。
鏡像的預期內容
在鏡像之前,您應該考慮一些考量和支援的案例。
設定考量
若要鏡像資料庫,它應該已經在 Azure 中佈建。 您必須在帳戶上啟用連續備份,作為先決條件。
- 您一次只能個別鏡映每一個資料庫。 您可以選擇要鏡射的資料庫。
- 您可以在相同的工作區內多次鏡像相同的資料庫。 最佳做法是,單一資料庫複本可以在湖屋、倉儲或其他鏡像資料庫之間重複使用。 您不需要為相同的資料庫設定多個鏡像。
- 您也可以跨不同的 Fabric 工作區或租用戶鏡像相同的資料庫。
- 您可以選取要在資料庫內鏡像的容器。
- Azure Cosmos DB 容器的變更,例如新增容器和刪除現有容器,會順應複寫至 Fabric。 例如,您可以開始鏡像沒有容器的空白資料庫,而鏡像會順暢地挑選稍後時間點新增的容器。
支援巢狀資料
巢狀資料會在 SQL 分析端點資料表中顯示為 JSON 字串。 您可以在 OPENJSONT-SQL 查詢或檢視中使用 、 CROSS APPLY和 ,來 OUTER APPLY 選擇性地擴充此資料。 如果您使用 Power Query,您也可以套用函 ToJson 式來展開此資料。
透過自動結構描述推斷,巢狀資料可以平面 OPENJSON 化,而不需要明確定義巢狀結構描述。 這對於具有動態或不可預測巢狀結構描述的工作負載特別有用。 如需詳細資訊,請參閱 如何查詢巢狀資料。
備註
Fabric 對大小為 8 KB 的字串資料行有限制。 如需詳細資訊和我們目前的因應措施,請參閱 資料倉儲限制。
處理結構描述變更
鏡像會自動複寫跨 Azure Cosmos DB 專案的屬性,並進行結構描述變更。 在專案中探索到的任何新屬性都會顯示為新的資料行,而遺漏的屬性 (如果有的話) 會在 Fabric 中表示為 Null。
如果您重新命名專案中的屬性,Fabric 資料表會同時保留舊資料行和新資料行。 舊資料行會顯示 Null,而新資料行會針對重新命名作業之後複寫的任何專案顯示最新值。
如果您變更 Azure Cosmos DB 專案中屬性的資料類型,則可轉換的相容資料類型支援變更。 如果資料類型與 Delta 中的轉換不相容,則會以 Null 值表示。
SQL 分析端點資料表會將差異資料類型轉換成 T-SQL 資料類型。
重複的資料行名稱
Azure Cosmos DB 支援以 JSON 標準為基礎,不區分大小寫的資料行名稱。 鏡像會透過新增至 _n 資料行名稱來支援這些重複的資料行名稱,其中 n 會是數值。
例如,如果 Azure Cosmos DB 專案具有 addressName 和 AddressName 作為唯一屬性,則 Fabric 資料表具有對應 addressName 的 和 AddressName_1 資料行。 如需詳細資訊,請參閱 複寫限制。
支援 AI 工作負載
Azure Cosmos DB 鏡像支援使用向量搜尋和索引的帳戶,讓 AI 和機器學習工作負載充分利用 Microsoft Fabric 強大的分析功能,同時繼續利用 Azure Cosmos DB 的高效能向量功能。
如需詳細資訊,請探索 Cosmos DB 和 Fabric 資料科學和 AI 體驗的向量搜尋和索引檔。
安全性
您可以使用 Microsoft Entra ID 和角色型存取控制或帳戶層級金鑰連線到來源帳戶。
如果您使用金鑰並輪替或重新產生金鑰,則需要更新連線以確保複寫正常運作。 如需詳細資訊,請參閱 連線。 設定連線之後,其他 Fabric 使用者不會直接看到帳戶金鑰。 您可以限制誰有權存取在 Fabric 中建立的連線。 不允許從鏡像資料庫中的資料總管或分析端點寫入 Azure Cosmos DB 資料庫。 鏡像目前不支援使用唯讀帳戶金鑰進行驗證。
針對 Microsoft Entra ID 驗證,需要下列 RBAC 權限: Microsoft.DocumentDB/databaseAccounts/readMetadata & Microsoft.DocumentDB/databaseAccounts/readAnalytics。 如需詳細資訊,請參閱 資料平面角色型存取控制文件。
小提示
將資料複寫至 Fabric OneLake 之後,您也應該保護對此資料的存取。
資料保護功能
您可以在 Microsoft Fabric 的鏡像資料庫中設定精細安全性。 如需詳細資訊,請參閱 Microsoft Fabric 中的細微許可權。
您可以將資料表上的資料行篩選和述詞型資料列篩選保護至 Microsoft Fabric 中的角色和使用者:
您也可以使用動態資料遮罩來遮罩非管理員使用者的敏感資料:
網路安全性
目前,鏡像不支援 OneLake 上的私人端點或客戶自控金鑰 (CMK)。 Azure Cosmos DB 帳戶不支援鏡像,其網路安全性設定比 所有網路寬鬆程度低,使用服務端點、使用私人端點、使用 IP 位址,或使用任何其他可能限制公用網路存取帳戶的設定。 Azure Cosmos DB 帳戶應該開放給所有網路,才能使用鏡像。
災難復原和複寫延遲
在 Fabric 中,您可以將內容部署至 Fabric 租用戶主區域以外的區域中的資料中心。 如需詳細資訊,請參閱 多地理位置支援。
對於具有主要寫入區域和多個讀取區域的 Azure Cosmos DB 帳戶,鏡像會選擇最接近設定 Fabric 容量之區域的 Azure Cosmos DB 讀取區域。 此選項有助於為鏡像提供低延遲複寫。
當您將 Azure Cosmos DB 帳戶切換至復原區域時,鏡像會自動再次選取最接近的 Azure Cosmos DB 區域。
備註
鏡像不支援具有多個寫入區域的帳戶。
複寫至 OneLake 的 Cosmos DB 資料必須設定為處理全區域中斷。 如需詳細資訊,請參閱 OneLake 中的災害復原。
使用鏡像探索您的資料
您可以直接檢視和存取 OneLake 中的鏡像資料。 您也可以順暢地存取鏡像資料,而無需進一步移動資料。
深入瞭解如何使用 ADLS Gen2 API 或 SDK、 OneLake 檔案總管和 Azure 儲存體總管來存取 OneLake。
您可以從 SQL Server Management Studio (SSMS) 等工具連線到 SQL 分析端點,或使用 Microsoft Open Database Connectivity (ODBC) 和 Java Database Connectivity (JDBC) 等驅動程式。 如需詳細資訊,請參閱 SQL 分析端點連線。
您也可以使用以下服務存取鏡映資料:
- Azure 服務,例如 Azure Databricks、Azure HDInsight 或 Azure Synapse Analytics
- Fabric Lakehouse 使用資料工程和資料科學案例的捷徑
- Fabric 工作區中的其他鏡像資料庫或倉儲
您還可以構建獎章架構解決方案,清理和轉換登陸鏡像數據庫的數據作為青銅層。 如需詳細資訊,請參閱 Fabric 中的獎章架構支援。
Pricing
用來將 Cosmos DB 資料複寫至 Fabric OneLake 的 Fabric 計算是免費的。 OneLake 中的儲存體會根據容量大小免費。 如需詳細資訊,請參閱鏡 像的 OneLake 定價。 透過 SQL、Power BI 或 Spark 查詢資料的計算使用量仍會根據 Fabric 容量收費。
如果您在 Fabric 鏡像中使用資料總管,您會根據要求單位 (RU) 使用量來累積一般成本,以探索容器並查詢來源 Azure Cosmos DB 資料庫中的專案。 Azure Cosmos DB 持續備份功能是鏡像的必要條件:適用持續備份的標準費用。 連續備份計費的鏡像不會產生額外費用。 如需詳細資訊,請參閱 Azure Cosmos DB 價格。