共用方式為


建立時序群集採礦模型結構 (元數據採礦教學課程)

建立時序群集採礦模型的第一個步驟是使用數據採礦精靈,根據Microsoft時序群集演算法建立新的採礦結構和採礦模型。

您將使用與購物籃分析相同的數據來源檢視,但會新增一個包含 sequence 標識符的欄。 在此情境中,順序表示客戶將商品新增至購物籃的順序。

您也會新增一些用於其中一個模型的數據行,以依人口統計將客戶分組。

建立時序叢集結構和模型

  1. 在 SQL Server Data Tools (SSDT) 的方案總管中,以滑鼠右鍵按兩下 [採礦結構 ],然後選取 [ 新增採礦結構]。

  2. 在 [ 歡迎使用數據採礦精靈] 頁面上,按 [下一步]。

  3. 在 [ 選取定義方法] 頁面上,確認已選取 [從現有的關係資料庫或數據倉儲 ],然後按 [ 下一步]。

  4. 在 [ 建立數據採礦結構] 頁面上,確認已選取 [ 使用採礦模型建立採礦結構 ] 選項。 接下來,點選下拉清單:您想使用哪種資料探勘技術?,然後選取 Microsoft 序列叢集。 按 [下一步]。

    [ 選取數據源檢視 ] 頁面隨即出現。 在 [可用的數據源檢視] 下,選取 Orders

    訂單與您用於購物籃案例的數據源檢視相同。 如果您尚未建立此數據源檢視,請參閱使用巢狀數據表新增數據源檢視(元數據採礦教學課程)。

  5. [下一步]。

  6. 在 [指定數據表類型] 頁面上,選取 vAssocSeqOrders 數據表旁的 [案例] 複選框,然後選取 vAssocSeqLineItems 數據表旁的 [巢狀] 複選框。 按 [下一步]。

    備註

    如果您選取案例巢狀複選框時發生錯誤,可能是資料來源檢視中的聯結不正確。 巢狀數據表 vAssocSeqLineItems 必須透過多對一聯結連接到案例數據表 vAssocSeqOrders 。 您可以用滑鼠右鍵按兩下聯結線,然後反轉聯結的方向來編輯關聯性。 如需詳細資訊,請參閱建立或編輯關聯性對話框 (Analysis Services - 多維度數據)。

  7. 在 [ 指定定型數據 ] 頁面上,選取複選框以選擇要在模型中使用的數據行,如下所示:

    • IncomeGroup 選擇 輸入 複選框。

      此數據列包含可供您用於叢集之客戶的相關有趣資訊。 您會在第一個模型中使用它,然後在第二個模型中加以忽略。

    • OrderNumber選取Key複選框。

      此欄位將作為案例資料表的識別碼,或 Key。 一般而言,您絕對不應該使用案例數據表的索引鍵字段做為輸入,因為索引鍵包含對叢集而言沒有用處的唯一值。

    • 地區 選取 [ 輸入 ] 複選框。

      此數據列包含可供您用於叢集之客戶的相關有趣資訊。 您會在第一個模型中使用它,然後在第二個模型中加以忽略。

    • LineNumber 選取 Key[輸入] 複選框。

      LineNumber 字段將做為巢狀資料表的識別碼,或 Sequence Key。 巢狀數據表的索引鍵必須一律用於輸入。

    • 模型 選取「輸入」和「可預測」複選框。

    確認選取專案正確無誤,然後按 [ 下一步]。

  8. 在 [ 指定數據行的內容和數據類型 ] 頁面上,確認方格包含下表所示的數據行、內容類型和數據類型,然後按 [ 下一步]。

    表格/欄位 內容類型 數據類型
    收入群組 離散 文字
    訂單編號 鑰匙 文字
    區域 離散 文字
    vAssocSeqLineItems
    行號 鍵序列
    型號 離散 文字
  9. 在 [ 建立測試集] 頁面上,將 測試的數據百分比 變更為 20,然後按 [ 下一步]。

  10. [完成精靈] 頁面上,針對 [採礦結構名稱],輸入 Sequence Clustering with Region

  11. 針對 [採礦模型名稱],輸入 Sequence Clustering with Region

  12. 核取 [允許鑽研] 的方塊,然後按一下 [完成]。

課程中的下一個工作

處理時序群集模型

另請參閱

數據採礦設計工具
Microsoft時序群集演算法