建立時序群集採礦模型結構 (中繼資料採礦教學課程)
適用於: SQL Server 2016 Preview
建立時序群集採礦模型的第一個步驟就是使用資料採礦精靈,根據 Microsoft 時序群集演算法來建立新的採礦結構和採礦模型。
您會使用您用於購物籃分析的相同資料來源檢視,但您將加入包含資料行 順序 識別項。 在此案例中,時序表示客戶將項目加入到購物籃的順序。
您也會加入某些資料行,這些資料行會在其中一個模型內使用,以根據人口統計資料來分組客戶。
若要建立時序群集結構和模型
在 [方案總管] 中 SQL Server Data Tools (SSDT), ,以滑鼠右鍵按一下 採礦結構 ,然後選取 新的採礦結構。
在 [歡迎使用資料採礦精靈] 頁面上,按 [下一步]。
在 選取定義方法 頁面上,確認 從現有的關聯式資料庫或資料倉儲 已選取,然後按一下 [ 下一步。
在 建立資料採礦結構 頁面上,確認選項 建立採礦結構與採礦模型 已選取。 接下來,按一下下拉式清單選項時, 您想要使用哪一種資料採礦技術?, ,然後選取 Microsoft 時序群集。 按一下 [下一步]。
選取資料來源檢視 ] 頁面隨即出現。 在 可用的資料來源檢視, ,請選取 訂單。
Orders 是您用於購物籃分析案例的相同資料來源檢視。 如果您尚未建立這個資料來源檢視,請參閱 加入具有巢狀資料表 #40; 中繼資料採礦教學課程 ) 資料來源檢視。
按一下 [下一步]。
在 指定資料表類型 頁面上,選取 案例 旁的核取方塊 vAssocSeqOrders 資料表,然後選取 巢狀 旁的核取方塊 vAssocSeqLineItems 資料表。 按一下 [下一步]。
注意
如果發生錯誤,當您選取 案例 或 巢狀 核取方塊,它可能是資料來源檢視中的聯結不正確。 巢狀的資料表 vAssocSeqLineItems, ,必須連接至案例資料表、 vAssocSeqOrders 多對一聯結。 您可以用滑鼠右鍵按一下聯結線並反轉聯結的方向,藉以編輯關聯性。 如需詳細資訊,請參閱 建立或編輯關聯性對話方塊 & #40。Analysis Services-多維度資料 )。在 指定培訓資料 頁面上,選擇使用的資料行在模型中,選取核取方塊,如下所示︰
IncomeGroup選取 輸入 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。
OrderNumber選取 金鑰 核取方塊。
這個欄位將案例資料表中,用做為識別碼或 金鑰。 一般來說,您絕對不應該使用案例資料表的索引鍵欄位當做輸入,因為此索引鍵包含對於群集沒什麼用處的唯一值。
區域選取 輸入 核取方塊。
這個資料行包含有關您可用於群集之客戶的有趣資訊。 您將會在第一個模型中使用它,然後在第二個模型中忽略它。
LineNumber選取 金鑰 和 輸入 核取方塊。
LineNumber 欄位會當做識別碼使用巢狀資料表,或 時序索引鍵。 巢狀資料表的索引鍵永遠都必須用於輸入。
模型選取 輸入 和 可預測 核取方塊。
確認選取項目都正確無誤,然後按一下 [ 下一步。
在 指定資料行的內容和資料類型 頁面上,確認此方格包含資料行、 內容類型和下表所示的資料類型,然後按一下 下一步。
資料表/資料行 內容類型 資料類型 IncomeGroup Discrete Text OrderNumber 索引鍵 Text Region Discrete Text vAssocSeqLineItems Line Number Key Sequence 長整數 模型 Discrete Text 在 建立測試集 頁面上,變更 測試資料的百分比 為 20,然後按 [ 下一步。
在 正在完成精靈 ] 頁面上,針對 採礦結構名稱, ,型別 時序群集與區域。
如 採礦模型名稱, ,型別 時序群集與區域。
檢查 允許使用鑽研 方塊,然後再按一下 完成。