您可以在建立採礦結構時定義採礦結構中的數據行,方法是選擇外部數據的數據行,然後指定數據如何用於模型化。 因此,採礦結構數據行不僅僅是數據源的數據複本:它們會定義採礦模型使用來源的數據的方式。 您可以指派屬性,以決定如何離散化數據、描述數據值分佈方式的屬性
採礦結構數據行的設計是彈性且可延伸的,因為您用來建置採礦模型的每個演算法都可能會使用不同的數據行來解譯數據。 您可以使用單一的挖掘結構,並利用其中的欄位來自定義每個模型的數據,而不是每個模型都有一組獨立的數據。
定義採礦結構欄位
定義結構數據行的基本數據類型和內容類型是從您用來建立結構的數據源衍生而來。 您可以在採礦結構中變更這些設定,也可以設定模型旗標,並設定連續數據行的分佈。
採礦結構數據行的定義必須包含下列資訊:
標識碼:數據行的唯一名稱,通常與名稱相同。 建立採礦結構之後,將無法變更此採礦結構,而名稱則可以變更。
名稱:數據行的名稱或別名。
內容:列舉,描述數據是離散還是連續。
類型:表示一般數據類型的列舉。
分佈:描述預期值分佈的枚舉。 如果資料列是連續的,則會包含分佈。
模型旗標:列舉,指出如何處理遺漏值等等。 模型旗標也可以在採礦模型上定義,但模型旗標與結構數據行所使用的旗標不同。
系結:指定源數據的屬性。
第三方演算法也可能包含可在採礦結構數據行上定義的自定義屬性。
如需數據採礦結構和數據採礦模型的詳細資訊,請參閱採礦結構(Analysis Services - 數據採礦)。
相關內容
如需如何定義和使用採礦結構數據行的詳細資訊,請參閱下列主題。
| 主題 | 連結 |
|---|---|
| 描述用來定義採礦結構欄位的資料類型。 | 資料型態 (資料採礦) |
| 描述可用於採礦結構數據行中每個數據類型的內容類型。 內容類型相依於數據類型。 內容類型是在模型的層級指派,並決定模型如何使用欄位數據。 | 內容類型 (資料採礦) |
| 介紹巢狀資料表的概念,並說明如何將巢狀資料表新增至資料來源作為挖掘結構欄。 | 分類資料列 (資料採礦) |
| 列出並說明可以在採礦結構欄位中設定的分配屬性,以指定欄位中值的預期分佈。 | 欄位分布(資料探勘) |
| 說明離散化的概念(有時稱為 量化),並描述 Analysis Services 為離散化連續數值數據提供的方法。 | 離散化方法 (數據採礦) |
| 描述您可以在採礦結構數據行上設定的模型旗標。 | 模型旗標 (資料採礦) |
| 描述分類數據行,這是一種特殊的數據行類型,可用來將一個採礦結構數據行關聯到另一個數據行。 | 分類資料列 (資料採礦) |
| 瞭解如何新增和修改採礦結構欄位。 | 採礦結構任務和操作指南 |