建立購物籃結構和模型 (中繼資料採礦教學課程)
現在您已經建立了資料來源檢視,接著要使用資料採礦精靈建立新的採礦結構。 在這項工作中,您將根據 Microsoft 關聯分析演算法建立一個採礦結構和一個採礦模型。
[!附註]
如果出現 vAssocSeqLineItems 無法當做巢狀資料表使用的錯誤訊息,請返回本課程的上一個工作,並且務必從 vAssocSeqLineItems 資料表 (多方) 拖曳至 vAssocSeqOrders 資料表 (一方),藉以建立多對一聯結。 您也可以用滑鼠右鍵按一下聯結線,編輯資料表之間的關聯性。
若要建立關聯採礦結構
在 SQL Server Data Tools (SSDT) 的 [方案總管] 中,以滑鼠右鍵按一下 [採礦結構],然後選取 [新增採礦結構],即可開啟資料採礦精靈。
在 [歡迎使用資料採礦精靈] 頁面上,按 [下一步]。
在 [選取定義方法] 頁面上,確認已選取 [從現有的關聯式資料庫或資料倉儲],再按 [下一步]。
在 [建立資料採礦結構] 頁面的 [您要使用哪一種資料採礦技術] 底下,從清單中選取 [Microsoft 關聯規則],再按 [下一步]。 此時會出現 [選取資料來源檢視] 頁面。
在 [可用的資料來源檢視] 底下,選取 [Orders],然後按 [下一步]。
在 [指定資料表類型] 頁面上,於 vAssocSeqLineItems 資料表的資料列中選取 [巢狀] 核取方塊,並且在 vAssocSeqOrders 巢狀資料表的資料列中選取 [案例] 核取方塊。 按 [下一步]。
在 [指定定型資料] 頁面上,清除已核取的所有方塊。 選取 OrderNumber 旁的 [Key] 核取方塊,藉此設定案例資料表 vAssocSeqOrders 的索引鍵。
由於購物籃分析的目的是要判斷哪些產品包含在單一交易內,因此您不需要使用 [CustomerKey] 欄位。
選取 Model 旁的 [Key] 核取方塊,藉此設定巢狀資料表 vAssocSeqLineItems 的索引鍵。 當您進行此動作時,同時會自動選取 [輸入] 核取方塊。 此外,也請為 [Model] 選取 [可預測] 核取方塊。
在購物籃模型中,您不在意購物籃中的產品順序,因此不應加入 [LineNumber] 做為巢狀資料表的索引鍵。 只有在時序很重要的模型中,才使用 [LineNumber] 做為索引鍵。 您將在第 4 課建立一個使用 Microsoft 時序群集演算法的模型。
選取 IncomeGroup 和 Region 左邊的核取方塊,但不要選取其他任何選項。 檢查最左邊的資料行時,會將資料行加入到結構中供您日後參考,但是不會用於模型中。 您的選擇應該如下所示:
按 [下一步]。
在 [指定資料行的內容和資料類型] 頁面上,檢閱選項 (應如下表所示),然後按 [下一步]。
資料行
內容類型
資料類型
IncomeGroup
Discrete
Text
Order Number
Key
Text
Region
Discrete
Text
vAssocSeqLineItems
Model
Key
Text
在 [建立測試集] 頁面上,[測試資料的百分比] 選項的預設值為 30。 將此值變更為 0。 按 [下一步]。
[!附註]
Analysis Services 會提供不同的圖表來測量模型精確度。 不過,有些圖表類型 (例如增益圖和交叉驗證報告),是專為分類和估計而設計。 這些方法不支援用於關聯式預測。
在 [正在完成精靈] 頁面的 [採礦結構名稱] 中,輸入 [關聯]。
在 [採礦模型名稱] 中輸入關聯。
選取 [允許使用鑽研] 選項,然後按一下 [完成]。
此時會開啟資料採礦設計師來顯示您剛建立的 [關聯] 採礦結構。