共用方式為


內容類型 (資料採礦)

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

在 Microsoft SQL Server SQL Server Analysis Services 中,您可以定義採礦結構中數據行的實體數據類型,以及模型中使用的數據行邏輯內容類型,

數據類型 決定當您建立採礦模型時,演算法如何處理這些數據行中的數據。 定義數據行的數據類型可提供資料行中數據類型的演算法資訊,以及如何處理數據。 SQL Server Analysis Services 中的每個數據類型都支援一或多個數據類型來進行數據採礦。

內容類型 描述數據行包含之內容的行為。 例如,如果數據行中的內容在特定間隔中重複,例如星期幾,您可以將該數據行的內容類型指定為週期性。

某些演算法需要特定數據類型和特定內容類型才能正確運作。 例如,Microsoft貝氏機率分類演算法無法使用連續數據行作為輸入,而且無法預測連續值。 某些內容類型,例如金鑰序列,只能由特定演算法使用。 如需演算法和每個支援的內容類型清單,請參閱 數據採礦演算法(Analysis Services - 資料採礦)

下列清單描述用於數據採礦的內容類型,並識別支援每個類型的數據類型。

離散

Discrete 表示數據行包含有限數目的值,且值之間沒有連續。 例如,性別數據行是典型的離散屬性數據行,其中數據代表特定類別數目。

離散屬性數據行中的值不能暗示順序,即使這些值是數值也一樣。 此外,即使用於離散數據行的值是數值,也無法計算分數值。 電話區域代碼是數值的離散數據的良好範例。

所有數據採礦數據類型都支援 Discrete 內容類型。

連續的

連續 表示數據行包含值,代表允許過渡值之小數位數上的數值數據。 不同於代表有限、可計算數據的離散數據行,連續數據行代表可調整的度量,而且數據可以包含無限數量的分數值。 溫度數據行是連續屬性數據行的範例。

當數據行包含連續數值數據,且您知道數據應該如何散發時,您可以藉由指定預期的值分佈來改善分析的正確性。 您可以在採礦結構的層級指定資料行分佈。 因此,此設定會套用至以 結構為基礎的所有模型,如需詳細資訊,請參閱 數據行散發(數據採礦)

下列資料類型支援 連續 內容類型:DateDoubleLong

離散化

離散化 是將連續數據集的值放入貯體中的程式,因此可能的值數目有限。 您只能離散化數值數據。

因此,離散化 內容類型表示數據行包含值,這些值代表衍生自連續數據行之值的群組或值區。 貯體會視為已排序和離散值。

您可以手動離散化數據,以確保您取得所需的貯體,或使用 SQL Server Analysis Services 中提供的離散化方法。 某些演算法會自動執行離散化。 如需詳細資訊,請參閱 變更採礦模型中數據行的離散化

下列數據類型支援 離散化 內容類型:DateDoubleLongText

鑰匙

索引鍵 內容類型表示數據行可唯一識別數據列。 在案例數據表中,索引鍵數據行通常是數值或文字標識碼。 您可以將內容類型設定為 索引鍵,表示數據行不應該用於分析,而只用於追蹤記錄。

巢狀數據表也有索引鍵,但巢狀數據表索引鍵的使用方式稍有不同。 如果數據行是您想要分析的屬性,您可以將內容類型設定為 巢狀數據表中的索引鍵。 巢狀數據表索引鍵中的值對於每個案例而言都必須是唯一的,但整個案例集可能會有重複的值。

例如,如果您要分析客戶購買的產品,您會在案例數據表中將 [CustomerID] 資料行的內容類型設定為索引鍵,並將 PurchaseProducts 數據行的內容類型再次設定為索引鍵。

注意

只有在您使用已定義為 Analysis Services 數據源檢視的外部數據源數據時,才能使用巢狀數據表。

下列資料類型支援此內容類型:DateDoubleLongText

索引鍵順序

索引鍵序列 內容類型只能在時序叢集模型中使用。 當您將內容類型設定為 索引鍵序列時,表示數據行包含代表事件序列的值。 這些值會排序,但不必相等距離。

下列資料類型支援此內容類型:DoubleLongTextDate

關鍵時間

關鍵時間 內容類型只能在時間序列模型中使用。 當您將內容類型設定為 索引鍵時間時,表示值會排序並代表時間刻度。

下列資料類型支援此內容類型:DoubleLongDate

桌子

數據表 內容類型表示數據行包含另一個數據表,其中包含一或多個數據行和一或多個數據列。 對於案例數據表中的任何特定數據列,此數據行可以包含多個值,與父案例記錄相關。 例如,如果主要案例數據表包含客戶清單,您可以有數個包含巢狀數據表的數據行,例如 ProductsPurchased 數據行,其中巢狀數據表列出過去客戶購買的產品,以及列出客戶利益的 Hobbies 數據行。

這個資料列的資料類型一律 Table

週期性

循環 內容類型表示數據行包含代表迴圈排序集的值。 例如,一周的編號天數是迴圈排序的集合,因為第一天遵循第七天。

循環數據行在內容類型方面會同時視為已排序和離散。

SQL Server Analysis Services 中的所有數據採礦數據類型都支援此內容類型。 不過,大部分演算法會將迴圈值視為離散值,而且不會執行特殊處理。

命令

已排序 內容類型也表示數據行包含定義順序或順序的值。 不過,在此內容類型中,用於排序的值並不表示集合中值之間的任何距離或大小關聯性。 例如,如果已排序的屬性數據行包含技能等級順序從一到五的資訊,則技能層級之間的距離沒有隱含的資訊;五的技能等級不一定比一個技能等級好五倍。

排序的屬性數據行會被視為內容類型的離散。

SQL Server Analysis Services 中的所有數據採礦數據類型都支援此內容類型。 不過,大部分演算法會將已排序的值視為離散值,而且不會執行特殊處理。

機要

除了與所有模型一起使用的上述內容類型之外,對於某些數據類型,您可以使用分類的數據行來定義內容類型。 如需分類資料列的詳細資訊,請參閱 分類資料列(資料採礦)

另請參閱

內容類型 (DMX)
資料類型 (資料採礦)
資料類型 (DMX)
變更採礦結構的屬性
採礦結構數據行