倉庫中的模型資料

已完成

沒有資料建模,每個 consumer 都必須自己找出哪些資料表彼此關聯,撰寫自己的彙整邏輯,並猜測欄位意義。 資料建模透過將結構、商業邏輯與文件直接嵌入倉庫,解決此問題。 在 Microsoft Fabric 倉庫中,你可以準備資料以提升清晰度,定義資料表間的關係,透過檢視和度量來標準化存取,並發布語意模型以供報告。 這些建模選擇影響每一個下游體驗,包括 T-SQL 查詢、Power BI 報告以及 AI 驅動的自然語言分析。

準備資料以供消費

在你定義關係或加入計算之前,你需要先清理消費者所看到的內容。 原始倉庫資料表通常包含預備表、代理金鑰欄位及內部旗標,這些都是用於 ETL 處理,而非分析用的。 這些物件在消費者瀏覽資料時會產生雜訊。 準備倉庫供消費,意味著只呈現相關內容並使其易於理解。

在模型檢視中,您可以採取幾項措施來改善消費者體驗:

  • 隱藏內部物件,例如暫存表、代理金鑰欄位,以及使欄位列表雜亂的ETL工件。
  • 將倉庫欄位的技術性或縮寫名稱變更為商務友好名稱。 例如,將名稱改為 。
  • 在表格和欄位中加入描述,讓消費者在不參考外部文件的情況下,也能理解資料所代表的意義。

這些步驟不僅僅關乎整潔。 Power BI 與 Fabric IQ 中的 Copilot 資料代理依賴資料表名稱、欄位名稱與描述來解讀自然語言問題並產生準確的 SQL 或 DAX。 如果欄位名稱為「客戶主要地址的地理區域」,則比沒有描述的欄位產生更自然的語言結果。

有了乾淨且命名良好的表格後,你就能定義這些表格之間的連結方式。

了解資料表之間的關係

關係是兩個資料表之間的邏輯連結,使得在這些資料表間進行篩選、分組與聚合。 在星型結構中,關係透過共用的鍵欄位將事實表與維度表連結起來。

例如,一個 同時存在於兩者 的欄位, 建立連結,讓客戶能依據區域、細部或帳戶類型等屬性分析銷售。

每種關係都有兩個重要的特性。

  • 兩個表格中行的對應關係由基數描述。 在星形模式中,事實與維度的關係通常是多對一,意即許多事實列對應到單一維度列。
  • 交叉濾波器方向 決定濾波器在表格間傳播的方向。 單一方向,即維度過濾事實表,是大多數星型結構設計的標準設定,因為它能保持濾波器的行為可預測且具效能。

若沒有定義關係,每個想要跨資料表合併資料的使用者都必須寫明確的 JOIN 邏輯。 關係透過僅需編碼一次連結來消除重複。 當你從倉庫建立語意模型時,這些關聯會幫助 Power BI、Copilot 和 Fabric IQ 的資料代理如何解讀資料。 例如,資料代理在將自然語言問題翻譯成SQL時,會利用關係來產生精確的連接。

注意

大多數資料倉儲使用量度建模。 可以建立關係來塑造 星型結構,這是分析的理想模型。 欲了解更多資訊,請參閱《Microsoft Fabric 模組中的設計維度模型》。

資料存取標準化以視圖與度量

現在你的資料表已經乾淨且連結,下一步就是給消費者可靠且一致的方式來查詢並根據這些資料進行計算。 若沒有標準化,每個團隊會自行撰寫連接邏輯、套用自己的過濾器,並定義自己的公式,導致結果相互衝突。

視圖 為 T-SQL 使用者提供這種一致性。 檢視封裝了連結邏輯、篩選條件和欄位選取,整合成一個可重複使用的查詢,使用者可如同參照資料表般地參考。 例如,一個結合事實表與維度表的視圖,篩選已完成的訂單,並只顯示分析人員所需欄位的資料,為每位 T-SQL 使用者提供可靠的起點。 視圖也作為報表的穩定資料來源。 與其直接針對可能變動的基底表建立報告,不如將報告指向能夠維持一致形狀的視圖。

度量 對 DAX 計算提供相同的一致性。 度量是一種可重複使用的 DAX 表達式,用來定義像是總數、平均值、比率或計數等計算方式。 你可以直接在倉庫模型檢視中選擇一個資料表並新增一個度量來建立度量。 例如,一個 Total Sales 測度將 SalesAmount 欄位的數據加總,確保每位使用者都使用相同的計算方式。

因為衡量定義與數據並存,它成為該指標的唯一真實來源。 當企業改變營收計算方式時,你只需在同一個地方更新指標,而不是追蹤每份包含自身公式的報告。

視圖與衡量指標共同涵蓋消費的兩端:視圖可標準化 T-SQL 使用者如何存取與查詢資料,而衡量指標可標準化商業計算在報告與儀表板中的呈現方式。

提示

DAX 公式與進階測度設計會在後續模組中深入介紹。 關於檢視與儲存程序,請參見前一單元關於查詢與資料轉換的部分。

建立 Power BI 報告的語意模型

有了準備好的表格、明確的關係,以及標準化的視圖與衡量標準,倉庫已準備好進行下游報告。 直接使用 T-SQL 查詢資料倉儲或透過第三方工具連接的團隊,可以按現有狀態使用資料倉儲模型。 然而,當你想建立互動式 Power BI 報告和儀表板時,建立語意模型是下一步。

從 Fabric 倉庫建立的語意模型使用 Direct Lake 模式。 與傳統匯入模式將資料複製到 Power BI 記憶體不同,Direct Lake 直接從 OneLake Parquet 檔案讀取資料。 這表示報表反映最新的倉儲資料,無需排程更新。 這也意味著你可以避免維護獨立資料副本的儲存和處理成本。

螢幕擷取畫面:Power BI 報表。

提示

語意模型設計與可擴展性模式在 《設計可擴展語意模型》中有更深入的介紹。 此單元專注於倉庫本身的資料建模。