建立時序群集採礦模型結構 (中繼資料採礦教學課程)
建立時序群集採礦模型的第一個步驟就是使用資料採礦精靈,根據 Microsoft 時序群集演算法來建立新的採礦結構和採礦模型。
您將會使用與購物籃分析相同的資料來源檢視,但是您會加入一個包含 sequence 識別碼的資料行。在此案例中,時序表示客戶將項目加入到購物籃的順序。
您也會加入某些資料行,這些資料行會在其中一個模型內使用,以根據人口統計資料來分組客戶。
若要建立時序群集結構和模型
在 Business Intelligence Development Studio 的 [方案總管] 中,以滑鼠右鍵按一下 [採礦結構],再選取 [新增採礦結構]。
在 [歡迎使用資料採礦精靈] 頁面上,按 [下一步]。
在 [選取定義方法] 頁面上,確認已選取 [從現有的關聯式資料庫或資料倉儲],再按 [下一步]。
在 [建立資料採礦結構] 頁面上,確認 [建立有採礦模型的採礦結構] 選項已選取。接下來,按一下 [您要使用哪一種資料採礦技術?] 選項的下拉式清單,然後選取 [Microsoft 時序群集]。然後按 [下一步]。
此時會出現 [選取資料來源檢視] 頁面。在 [可用的資料來源檢視] 底下選取 [Orders]。
Orders 是您用於購物籃分析案例的相同資料來源檢視。如果您尚未建立此資料來源檢視,請參閱<加入具有巢狀資料表的資料來源檢視 (中繼資料採礦教學課程)>。
按 [下一步]。
在 [指定資料表類型] 頁面上,選取 [vAssocSeqOrders] 資料表旁的 [案例] 核取方塊,然後選取 [vAssocSeqLineItems] 資料表旁的 [巢狀] 核取方塊。按 [下一步]。
[!附註]
如果您在選取 [案例] 或 [巢狀] 核取方塊時發生錯誤,可能是資料來源檢視中的聯結不正確。巢狀資料表 [vAssocSeqLineItems] 必須透過多對一聯結連接至案例資料表 [vAssocSeqOrders]。您可以用滑鼠右鍵按一下聯結線並反轉聯結的方向,藉以編輯關聯性。如需詳細資訊,請參閱<建立/編輯關聯性對話方塊 (Analysis Services - 多維度資料)>。
在 [指定定型資料] 頁面上,依照底下方式選取核取方塊,藉以選擇此模型中使用的資料行:
IncomeGroup:選取 [輸入] 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。您將會在第一個模型中使用它,然後在第二個模型中忽略它。
OrderNumber:選取 [索引鍵] 核取方塊。
此欄位將會當做案例資料表的識別碼或 Key 使用。一般來說,您絕對不應該使用案例資料表的索引鍵欄位當做輸入,因為此索引鍵包含對於群集沒什麼用處的唯一值。
Region:選取 [輸入] 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。您將會在第一個模型中使用它,然後在第二個模型中忽略它。
LineNumber:選取 [索引鍵] 和 [輸入] 核取方塊。
[LineNumber] 欄位將會當做巢狀資料表的識別碼或 Sequence Key 使用。巢狀資料表的索引鍵永遠都必須用於輸入。
Model:選取 [輸入] 和 [可預測] 核取方塊。
確認選擇正確無誤,然後按 [下一步]。
在 [指定資料行的內容和資料類型] 頁面上,確認此方格有包含下表所顯示的資料行、內容類型和資料類型,然後按 [下一步]。
資料表/資料行
內容類型
資料類型
IncomeGroup
Discrete
Text
OrderNumber
Key
Text
Region
Discrete
Text
vAssocSeqLineItems
Line Number
Key Sequence
Long
Model
Discrete
Text
在 [建立測試集] 頁面上,將 [測試資料的百分比] 變更為 20,然後按 [下一步]。
在 [正在完成精靈] 頁面的 [採礦結構名稱] 中,輸入 Sequence Clustering with Region。
在 [採礦模型名稱] 中,輸入 Sequence Clustering with Region。
核取 [允許使用鑽研] 方塊,然後按一下 [完成]。