倉庫中的模型資料

7 分鐘

沒有資料建模，每個 consumer 都必須自己找出哪些資料表彼此關聯，撰寫自己的彙整邏輯，並猜測欄位意義。資料建模透過將結構、商業邏輯與文件直接嵌入倉庫，解決此問題。在 Microsoft Fabric 倉庫中，您可以準備資料以提升清晰度，定義資料表間的關係，透過檢視和度量來標準化訪問，並發布語意模型以供報告。這些建模選擇影響每一個下游體驗，包括 T-SQL 查詢、Power BI 報告以及 AI 驅動的自然語言分析。

準備資料以供取用

在你定義關係或加入計算之前，你需要先清理消費者所看到的內容。原始倉庫資料表通常包含預備表、代理金鑰欄位及內部旗標，這些都是用於 ETL 處理，而非分析用的。這些物件在消費者瀏覽資料時會產生雜訊。準備倉庫供消費，意味著只呈現相關內容並使其易於理解。

在模型視圖中，您可以採取幾項措施來改善消費者的體驗：

隱藏內部物件，例如暫存表、代理金鑰欄位，以及使欄位列表雜亂的 ETL 工件。
當倉庫欄位名稱為技術性或縮寫時，欄位名稱應變更為商業友善名稱。例如，將名稱改為 CustRgnCustomer Region。
在表格和欄位中加入描述，讓消費者在不參考外部文件的情況下，也能理解資料所代表的意義。

這些步驟不僅僅關乎整潔。 Power BI 與 Fabric IQ 中的 Copilot 資料代理依賴資料表名稱、欄位名稱與描述來解讀自然語言問題並產生準確的 SQL 或 DAX。若欄位 Customer Region 名稱有像「客戶主要地址的地理區域」這樣的描述，會比 CustRgn 沒有描述的欄位產生更自然的語言結果。

有了乾淨且命名良好的表格後，你就能定義這些表格之間的連結方式。

了解資料表之間的關係

關係是兩個資料表之間的邏輯連結，使得在這些資料表間進行篩選、分組與聚合。在星型結構中，關係透過共用的鍵欄位將事實表與維度表連結起來。

例如，一個同時存在於 FactSales 和 DimCustomer 的 CustomerKey 欄位建立了連結，支持根據客戶屬性如區域、部門或帳戶類型分析銷售。

每種關係都有兩個重要的特性。

基數描述了兩個表格中行的對應關係。在星形模式中，事實與維度的關係通常是多對一，意即許多事實列對應到單一維度列。
交叉濾波器方向 決定濾波器在表格間傳播的方向。單一方向，即維度過濾事實表，是大多數星型結構設計的標準設定，因為它能保持濾波器的行為可預測且具效能。

若沒有定義關係，每個想要跨資料表合併資料的使用者都必須寫明確的 JOIN（連接）邏輯。關係透過僅需編碼一次連結來消除重複。當你從倉庫建立語意模型時，這些關聯會幫助 Power BI、Copilot 和 Fabric IQ 的資料代理如何解讀資料。例如，資料代理在將自然語言問題翻譯成SQL時，會利用關係來產生精確的連接。

注意

大多數資料倉儲使用量度建模。可以建立關係來塑造 星型結構，這是分析的理想模型。欲了解更多資訊，請參閱 Microsoft Fabric 模組中的「設計維度模型」。

標準化資料存取，透過視圖和指標

現在你的資料表已經乾淨且連結，下一步就是給消費者可靠且一致的方式來查詢並根據這些資料進行計算。若沒有標準化，每個團隊會自行撰寫連接邏輯、套用自己的過濾器，並定義自己的公式，導致結果相互衝突。

視圖為 T-SQL 使用者提供這種一致性。檢視會將聯結邏輯、篩選條件與資料行選取封裝成可重複使用的查詢，供取用者像使用資料表一樣加以參考。例如，結合事實表與維度表，篩選完成的訂單，並僅顯示分析師所需欄位的視圖，為每位 T-SQL 使用者提供一個可靠的起點。視圖也作為報表的穩定資料來源。與其直接針對可能變動的基底表建立報告，不如將報告指向能夠維持一致形狀的視圖。

度量對 DAX 計算提供相同的一致性。度量是一種可重複使用的 DAX 表達式，用來定義像是總數、平均值、比率或計數等計算方式。你可以直接在倉庫模型檢視中選擇一個資料表並新增一個度量來建立度量。例如，將 SalesAmount 資料行加總的 Total Sales 量值，可確保每位取用者都使用相同的計算方式。

因為衡量定義與數據並存，它成為該指標的唯一真實來源。當企業改變營收計算方式時，你只需在同一個地方更新指標，而不是追蹤每份包含自身公式的報告。

視圖與計量共同涵蓋消費的兩端：視圖標準化 T-SQL 使用者存取與查詢資料的方式，而計量標準化商業計算在報告與儀表板中的呈現方式。

提示

DAX 公式與進階測度設計會在後續模組中深入介紹。關於檢視與儲存程序，請參見前一單元關於查詢與資料轉換的部分。

建立 Power BI 報告的語意模型

有了準備好的表格、明確的關係，以及標準化的視圖與衡量標準，倉庫已準備好進行下游報告。直接使用 T-SQL 查詢資料倉儲或透過第三方工具連接的團隊，可以按現有狀態使用資料倉儲模型。然而，當你想建立互動式 Power BI 報告和儀表板時，建立語意模型是下一步。

從 Fabric 倉庫建立的語意模型使用 Direct Lake 模式。與傳統匯入模式將資料複製到 Power BI 記憶體不同，Direct Lake 直接從 OneLake Parquet 檔案讀取資料。這表示報表反映最新的倉儲資料，無需排程更新。這也代表你避免了維護獨立資料副本的儲存與處理負擔。

Power BI 報告的截圖。

提示

語意模型設計與可擴展性模式在《設計可擴展語意模型》中有更深入的介紹。此單元專注於倉庫本身的資料建模。

意見反應

此頁面對您有幫助嗎？