共用方式為


Microsoft網狀架構倉儲中的維度模型

適用於: Microsoft Fabric 中的 SQL 分析端點和倉儲

本文是一系列關於倉儲內維度模型化的第一篇。 它提供 Microsoft Fabric 中倉儲的實際指引,這是支援許多 T-SQL 功能的體驗,例如在數據表中建立及管理數據。 因此,您可以完全控制建立維度模型數據表,並使用數據載入它們。

注意

在本文中,數據倉儲一詞 是指企業數據倉儲 ,可全面整合整個組織的重要數據。 相反地,獨立字詞 倉儲 是指網狀架構倉儲,這是一種軟體即服務 (SaaS) 關係資料庫供應專案,可供您用來實作數據倉儲。 為了清楚起見,本文中將後者稱為 網狀架構倉儲

提示

如果您不熟悉維度模型化,請考慮此系列文章是您的第一個步驟。 它的目的不是提供關於維度模型設計的完整討論。 如需詳細資訊,請參閱 Ralph Kimball 等廣泛採用的已發佈內容,例如 數據倉儲工具組:維度模型 化的最終指南(2013 年第 3 版,2013 年)。

星狀結構描述設計

星型架構 是關係型數據倉儲採用的維度模型化設計技術。 建立網狀架構倉儲時,建議採用的設計方法。 星型架構包含 事實數據表維度數據表

  • 維度數據表 描述與組織和分析需求相關的實體。 大致上,它們代表您建立模型的專案。 專案可以是產品、人員、地點或任何其他概念,包括日期和時間。 如需詳細資訊和設計最佳做法,請參閱 此系列中的維度數據表
  • 事實數據表 會儲存與觀察或事件相關聯的度量。 他們可以儲存銷售訂單、庫存餘額、匯率、溫度讀數等等。 事實數據表包含維度索引鍵,以及可匯總的細微值。 如需詳細資訊和設計最佳做法,請參閱 本系列中的事實數據表

星型架構設計已針對分析查詢工作負載進行優化。 因此,它被視為企業Power BI 語意模型的先決條件。 分析查詢與篩選、分組、排序和摘要數據有關。 事實數據會在相關維度數據表的篩選和群組內容中摘要。

它之所以稱為星型架構,是因為事實數據表會形成星形的中心,而相關的維度數據表則構成星形的點。

圖表顯示銷售事實的星型架構圖例。有五個維度,每個維度位於星形的某個點。

星型架構通常包含多個事實數據表,因此有多個星號。

設計完善的星型架構提供高效能(關係型)查詢,因為數據表聯結較少,而且有用索引的可能性較高。 此外,隨著數據倉儲設計的發展,星型架構通常需要低維護。 例如,將新數據行新增至維度數據表以支援新屬性的分析,是一項相對簡單的工作。 隨著數據倉儲範圍的發展,新增事實和維度。

每天,維度模型中的數據表會由擷取、轉換和載入 (ETL) 程式定期更新和載入。 此程式會將其數據與儲存作業數據的來源系統同步處理。 如需詳細資訊,請參閱 此系列中的載入數據表

Power BI 的維度模型

針對企業解決方案,網狀架構倉儲中的維度模型是建立PowerBI 語意模型的建議先決條件。 維度模型不僅支援語意模型,而且也是其他體驗的數據源,例如 機器學習模型

不過,在特定情況下,它可能不是最佳方法。 例如,需要自由和靈活度來快速行動且不需要相依於IT的自助分析師,可能會建立直接連線到源數據的語意模型。 在這種情況下,維度模型化理論仍然相關。 該理論可協助分析師建立直覺且有效率的模型,同時避免需要在數據倉儲中建立和載入維度模型。 相反地,您可以使用Power Query來建立准維度模型,其會定義要連線及轉換的邏輯,以建立及載入語意模型數據表。 如需詳細資訊,請參閱了解星型結構描述及其對 Power BI 的重要性

重要

當您使用Power Query 在語意模型中定義維度模型時,您無法 管理歷程記錄變更,這可能需要準確分析過去。 如果是需求,您應該建立數據倉儲,並允許定期 ETL 程式擷取並適當地儲存維度變更。

規劃數據倉儲

您應該將建立數據倉儲和維度模型的設計視為嚴肅且重要的工作。 這是因為數據倉儲是數據平臺的核心元件。 它應該形成一個堅實的基礎,可支援整個組織的分析和報告,因此做出決策。

為此,您的數據倉儲應努力將品質、一致性和歷史準確的數據儲存為單一 版本的事實。 它應該以快速的效能提供可理解和可導覽的數據,並強制執行許可權,讓正確的人員只能存取正確的數據。 努力設計數據倉儲以進行復原,讓它隨著需求的發展而進行調整。

數據倉儲的成功實作取決於良好的規劃。 如需策略性與戰術考慮的相關信息,以及導致成功採用 Fabric 和數據倉儲的動作專案,請參閱 Microsoft網狀架構採用藍圖

提示

建議您反覆建置企業數據倉儲。 首先先從最重要的主題區域開始,然後根據優先順序和資源,隨著時間推移,將數據倉儲與其他主題區域延伸。

在本系列中的下一篇文章中,了解維度數據表指引和設計最佳做法。