描述資料模型化的核心概念

已完成

分析模型可讓您建構資料以支援分析。 模型是以資料的相關資料表為基礎,並定義您想要分析或報告的數值 (稱為量值),以及您想要據以彙總這些數值的實體 (稱為維度)。 例如,模型可能包括包含銷售數值量值 (例如營收或數量),以及產品、客戶和時間之維度的資料表。 這可讓您跨一或多個維度彙總銷售量值 (例如,識別依客戶的總營收,或每月依產品的總銷售項目數)。 就概念而言,模型會形成多維度結構,其通常稱為 Cube,其中維度交集的任何點都代表那些維度的彙總量值。

A conceptual view of an analytical data model as a cube with dimensions for Product, Customer, and Time dimensions. A specific intersection point in the cube contains total revenue for a specific product sold to a specific customer in a specific month.

注意

雖然我們通常會將分析模型稱為 Cube,但可能有多於 (或少於) 三個維度,而我們不容易視覺化超過三個!

資料表與結構描述

維度資料表代表您要據以彙總數值量值的實體,例如產品或客戶。 每個實體都是以具有唯一索引鍵值的資料列來表示。 其餘資料行代表實體的屬性;例如,產品具有名稱和類別,而客戶具有地址和城市。 在大部分的分析模型中,通常會包括時間維度,以便彙總與一段時間內的事件相關聯的數值量值。

會由模型中各種維度所彙總的數值量值都會儲存在事實資料表中。 事實資料表中的每個資料列都代表具有與其相關聯之數值量值的已記錄事件。 例如,下面結構描述中的 Sales 資料表代表個別項目的銷售交易,並包括銷售數量和營收的數值。

A schema of Customer, Product, and Time dimension tables related to a Sales fact table

這種類型的結構描述 (其中事實資料表與一或多個維度資料表相關) 稱為星型結構描述 (想像有與單一事實資料表相關的維度有五個,在此情況下結構描述將會形成五芒星!)。 您也可以定義更複雜的架構,其中維度資料表與包含更多詳細資料的其他資料表相關 (例如,您可以在與Product資料表相關的個別Category資料表中代表產品類別的屬性,在此情況下,設計稱為雪花式架構。事實和維度資料表的架構可用來建立分析模型,其中會預先計算所有維度的量值匯總;讓分析和報告活動的效能比每次計算匯總更快。)

屬性階層

最後一個值得考慮的分析模型,是建立可讓您快速向上切入向下切入的屬性階層,以在階層式維度的不同層級上尋找彙總值。 例如,考慮我們到目前為止所討論之維度資料表中的屬性。 在 Product 資料表中,您可以形成階層,其中每個類別可能包括多個具名產品。 同樣地,在 Customer 資料表中,可以形成階層來代表每個城市中的多個具名客戶。 最後,在 Time 資料表中,您可以形成年、月和日的階層。 您可以針對階層的每個層級使用預先彙總的值來建置模型,讓您可以快速變更分析的範圍,例如依年度檢視總銷售額,然後向下切入以查看每月總銷售額的詳細明細。

A hiererchy defined for the Year, Month, and Day attributes in a Time dimension results in measures being aggregated for each level of the hierarchy

Microsoft Power BI 中的分析模型化

您可以使用 Power BI 從資料表定義分析模型,這可從一或多個資料來源匯入。 接著,您可以使用 Power BI Desktop 的 [模型] 索引標籤上的資料模型化介面來定義分析模型,方法是建立事實和維度資料表之間的關聯性、定義階層、設定資料表中欄位的資料類型和顯示格式,以及管理資料的其他屬性以協助定義豐富的分析模型。

The Model tab in Power BI Desktop