什麼是 Microsoft Fabric 中的資料倉儲?
適用於:✅ Microsoft Fabric 中的 SQL 分析端點和倉儲
Microsoft Fabric 是 Microsoft Fabric 中的新一代資料倉儲解決方案。
以資料湖為中心的倉儲在企業級分散式處理引擎基礎上建置,可大規模實現業界領先的效能,同時將設定和管理需求降至最低。 Fabric 資料倉儲位於 Data Lake 中,且專為原生支援開放資料格式而設計,可在資料工程師與商務使用者之間實現無縫的共同作業,而不會影響安全性或治理。
便於使用的 SaaS 體驗還與 Power BI 緊密整合,以便輕鬆地分析和報告,融合資料湖和倉儲世界,並大幅簡化組織對其分析資產的投資。
資料倉儲客戶可受益於以下方面:
- 以 Delta-parquet 格式儲存的資料可讓 ACID 交易與其他 Fabric 工作負載互通,這意味著您無需多個資料複本。
- 跨資料庫查詢可使用多個資料來源,快速獲得零資料重複深入解析。
- 透過管線、資料流程、跨資料庫查詢或 COPY INTO 命令,輕鬆地大規模擷取、載入和轉換資料。
- 使用業界領先的分散式查詢處理引擎進行自主工作負載管理,意味著無需操作即可達到最佳效能。
- 近乎即時地擴展以符合商務需求。 儲存與計算分開。
- 使用便於取用且始終連線的語意模型來縮短深入解析時間,並且可與 Direct Lake 模式的 Power BI 整合。 報告始終具有最新的分析和報告資料。
- 針對任何技能層級建置,從公民開發者到 DBA 或資料工程師。
資料倉儲項目
Fabric 倉儲並非傳統的企業資料倉儲,而是支援兩個不同倉儲項目的資料湖倉儲:Fabric 構資料倉儲和 SQL 分析端點。 兩者均專為滿足客戶商務需求而建置,同時提供最佳效能、最大限度地降低成本,以及減少系統管理額外負荷。
Synapse 資料倉儲
在 Microsoft Fabric 工作區中,Synapse 資料倉儲或倉儲會在類型資料欄中標示為「倉儲」。 若您需要資料倉儲的完整功能和交易功能 (DDL 和 DML 查詢支援),這是專為您打造的快速且簡單的解決方案。
倉儲可採用任何一種支援的資料擷取方法填入,例如 COPY INTO、管線、資料流程或跨資料庫擷取選項,例如 CREATE TABLE AS SELECT (CTAS)、INSERT..SELECT 或 SELECT INTO。
若要開始使用 Warehouse,請參閱:
Lakehouse 的 SQL 分析端點
在 Microsoft Fabric 工作區中,每個 Lakehouse 都有自動產生的「SQL 分析端點」,可用於從 Lakehouse 的「資料湖」檢視 (支援資料工程和 Apache Spark) 轉換為相同 Lakehouse 的 "SQL" 檢視,以建立檢視、函數、預存程序,以及套用 SQL 安全性。
藉助 Lakehouse 的 SQL 分析端點,T-SQL 命令可定義及查詢資料物件,但無法操作或修改資料。 您可以在 SQL 分析端點中執行下列動作:
- 查詢在資料湖的 Delta Lake 資料夾中參考資料的資料表。
- 建立檢視、內嵌 TVF 和程序,以在 T-SQL 中封裝語意和商務邏輯。
- 管理物件的權限。
若要開始使用 SQL 分析端點,請參閱:
倉儲或資料湖
在決定使用倉儲還是 Lakehouse 時,請務必考慮資料管理和分析需求的特定需求和內容。 同樣重要的是,這並非單面決策!
如果商務需求變更,而且無論您從何處開始,倉儲和 Lakehouse 都會針對所有 T-SQL 查詢使用相同的強大 SQL 引擎,您隨時有機會在稍後新增一個或另一個。
以下列出了一些可協助您做出決策的一般指導方針:
若您需要具有開放式標準格式、無旋軸效能和最少設定的企業規模解決方案,請選擇資料倉儲。 資料倉儲最適合半結構化和結構化資料格式,同時適用於初學者和經驗豐富的資料專業人員,提供簡單且直覺化的體驗。
若您需要來自異質來源的大型非結構化資料存放庫、利用低成本物件儲存,以及想要使用 SPARK 作為主要開發工具,請選擇 Lakehouse。 做為「輕量型」資料倉儲,您一律可選擇使用 SQL 端點和 T-SQL 工具,在 Lakehouse 中傳遞報告和資料智慧案例。
如需更詳細的決策指引,請參閱 Microsoft Fabric 決策指南:在倉儲與 Lakehouse 間選擇。