分享方式:


Microsoft Fabric 倉儲中的維度模型化

適用於:✅ Microsoft Fabric 中的 SQL 分析端點和倉儲

本文是關於倉儲內維度模型化系列文章的第一篇。 它提供 Microsoft Fabric 中 Warehouse 的實際指引,這是支援許多 T-SQL 功能的體驗,例如在資料表中建立及管理資料。 因此,您可以完全控制建立維度模型資料表,並向其加載資料。

注意

在本文中,術語資料倉儲是指企業資料倉儲,可全面整合整個組織的重要資料。 相反,獨立術語倉儲是指 Fabric Warehouse,這是一種軟體即服務 (SaaS) 關聯式資料庫服務,可供您用來實作資料倉儲。 為了清楚起見,本文中將後者稱為 Fabric Warehouse

提示

如果您不熟悉維度模型化,請先查閱這一系列的文章。 其目的不是提供關於維度模型化設計的完整討論。 如需詳細資訊,請直接參考廣泛採用的已發佈內容,例如 The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (2013 年第 3 版),其作者為 Ralph Kimball 和其他人。

星狀結構描述設計

星型結構描述設計是關聯式資料倉儲採用的維度模型化設計技巧。 建議在建立 Fabric 倉儲時採用這種設計方法。 星型結構描述包含事實資料表維度資料表

  • 維度資料表描述與組織和分析需求相關的實體。 從廣義上講,它們代表您要模型化的內容。 這些內容可以是產品、人員、地點或任何其他概念,包括日期和時間。 如需詳細資訊和設計最佳做法,請參閱此系列中的維度資料表
  • 事實資料表儲存與觀察或事件關聯的度量。 它們可以儲存銷售訂單、庫存餘額、匯率、溫度讀數等等。 事實資料表包含維度索引鍵,以及可彙總的細微值。 如需詳細資訊和設計最佳做法,請參閱此系列中的事實資料表

星型結構描述設計已針對分析查詢工作負載最佳化。 因此,它被視為企業 Power BI 語意模型的先決條件。 分析查詢與篩選、分組、排序和摘要資料有關。 事實資料會在相關維度資料表的篩選和群組內容中彙總。

它之所以稱為星型結構描述,是因為事實資料表構成星星的中心,相關的維度資料表則構成星星的點。

圖表顯示銷售事實的星型結構描述圖例。共有五個維度,每個維度位於星星的一個點上。

星型結構描述通常包含多個事實資料表,因此有多個星星。

精心設計的星型結構描述帶來高效能 (關係型) 查詢,因為資料表聯結較少,而且取得有用索引的可能性較高。 此外,隨著資料倉儲設計的發展,星型結構描述通常需要很少的維護。 例如,在維度資料表中加入新的資料行以支援新屬性的分析是相對簡單的工作。 隨著資料倉儲範圍的擴大,也會增加新的事實和維度。

維度模型中的資料表都會透過擷取、轉換和載入 (ETL) 處理序定期 (可能每天) 更新和載入。 此處理序會將其資料與儲存作業資料的來源系統同步。 如需詳細資訊,請參閱此系列中的載入資料表

Power BI 的維度模型化

對於企業解決方案,建議將 Fabric 倉儲中的維度模型作為建立 PowerBI 語意模型的先決條件。 維度模型不僅支援語意模型,而且是其他體驗的資料來源,例如機器學習模型

不過,在特定情況下,這可能不是最佳方法。 例如,需要自由和敏捷度來快速行動且不需要相依於 IT 的自助分析員,可能會建立直接連線到來源資料的語意模型。 在這種情況下,維度模型化理論仍然適用。 該理論可協助分析員建立直覺且有效率的模型,且無需在資料倉儲中建立和載入維度模型。 取而代之的是,可以使用 Power Query 建立準維模型,定義連線及轉換來源資料的邏輯,以建立及載入語意模型表。 如需詳細資訊,請參閱了解星型結構描述及其對 Power BI 的重要性

重要

當您使用 Power Query 在語意模型中定義維度模型時,無法管理歷史變更,這可能需要準確分析過去資訊。 如果是需求,您應該建立資料倉儲,允許定期 ETL 處理序擷取並適當儲存維度變更。

規劃資料倉儲

您應該將建立資料倉儲和設計維度模型視為嚴肅且重要的工作。 這是因為資料倉儲是資料平台的核心元件。 其應構成一個堅實的基礎,以支援分析和報告,進而支援整個組織的決策。

為此,您的資料倉儲應努力儲存高品質、符合規範且記錄準確的資料,作為唯一的真相。 它應該以快速的效能提供可理解且可導覽的資料,並強制執行許可權,以確保正確的資料只能由正確的人存取。 努力設計具有彈性的資料倉儲,使其能夠隨著需求的發展而進行調整。

要確保資料倉儲實作成功,需進行良好的規劃。 如需策略性與戰術性考量的相關資訊,以及有助於 Fabric 和資料倉儲成功採用的動作項目,請參閱 MicrosoftFabric 採用藍圖

提示

建議迭代式地建置企業資料倉儲。 首先從最重要的主題領域開始,然後隨著時間的推移,根據優先級和資源,將資料倉儲擴展到其他主題領域。

在此系列中的下一篇文章中,了解維度資料表的指引和設計最佳做法。