共用方式為


建立預測 (基本數據採礦教學課程)

在您測試採礦模型的精確度並決定對結果感到滿意之後,您就可以在數據採礦設計師的 [ 採礦模型預測 ] 索引標籤上使用 [預測查詢產生器] 來產生預測。

預測查詢產生器有三個檢視。 透過 [設計 ] 和 [ 查詢 ] 檢視,您可以建置並檢查查詢。 然後,您可以在 [結果 ] 檢視中執行查詢並檢視結果。

所有預測查詢都會使用 DMX,這是數據採礦延伸模組 (DMX) 語言的簡稱。 DMX 的語法類似 T-SQL,但用於對數據採礦對象的查詢。 雖然 DMX 語法並不複雜,但使用類似此語法的查詢產生器,或 Office 的 SQL Server 數據採礦 Add-Ins 中的查詢產生器,可讓您更輕鬆地選取輸入和建置表達式,因此強烈建議您瞭解基本概念。

建立查詢

建立預測查詢的第一個步驟是選取採礦模型和輸入數據表。

選取模型和輸入數據表

  1. 在 [數據採礦設計師] 的 [ 採礦模型預測 ] 索引卷標上,按兩下 [ 採礦模型 ] 方塊中的 [ 選取模型]。

  2. [選取採礦模型] 對話框中,瀏覽樹狀結構至 [目標郵件] 結構,展開結構,選取 TM_Decision_Tree,然後按一下 [確定]

  3. 在 [ 選取輸入數據表] 方塊中,按兩下 [ 選取案例數據表]。

  4. 在 [ 選取數據表] 對話方塊的 [ 數據源 ] 清單中,選取數據源檢視 Adventure Works DW 多維度 2012。

  5. [數據表/檢視名稱] 中,選取 [ProspectiveBuyer ][dbo] 數據表,然後按兩下 [ 確定]。

    數據表 ProspectiveBuyer 最類似於 vTargetMail 案例數據表。

對應列

選取輸入數據表之後,預測查詢產生器會根據數據行的名稱,在採礦模型與輸入數據表之間建立預設對應。 結構中的至少一個數據行必須符合外部數據中的數據行。

這很重要

您用來判斷模型精確度的數據必須包含一個欄位,可對應至可預測的欄位。 如果這類數據行不存在,您可以建立一個具有空白值的數據行,但其數據類型必須與可預測的數據行相同。

將輸入對應至模型

  1. 以滑鼠右鍵按兩下將 [採礦模型] 視窗連接到 [ 選取輸入資料表 ] 視窗的線條,然後選取 [ 修改連接]。

    請注意,並非每個欄位都有對應的映射。 我們將為數個數據表欄新增對應。 我們也會根據目前的日期數據行產生新的出生日期數據行,讓數據行更符合。

  2. 表格欄位 下,點擊 Bike Buyer 單元格,然後從下拉式清單中選取 ProspectiveBuyer.Unknown。

    將可預測的欄位 [Bike Buyer] 映射到輸入表格的欄位。

  3. 按一下 [確定]

  4. [方案總管] 中,以滑鼠右鍵按兩下 [目標郵寄 ] 資料源檢視,然後選取 [ 檢視設計工具]。

  5. 以滑鼠右鍵點擊資料表ProspectiveBuyer,然後選擇新增具名計算

  6. 在 [ 建立具名計算 ] 對話框中,針對 [ 資料行名稱] 輸入 calcAge

  7. [描述] 中,輸入 [根據出生日期計算年齡]。

  8. 在 [ 表達式] 方塊中,輸入 DATEDIFF(YYYY,[BirthDate],getdate()) ,然後按兩下 [ 確定]。

    由於輸入數據表沒有對應至模型中的 Age 資料行,因此您可以使用此運算式,從輸入數據表的 BirthDate 數據行計算客戶年齡。 由於 Age 被識別為預測自行車購買最有影響力的數據行,因此它必須同時存在於模型和輸入數據表中。

  9. 在 [數據採礦設計師] 中,選取 [ 採礦模型預測 ] 索引標籤,然後重新開啟 [ 修改連接 ] 視窗。

  10. [數據表數據行] 下,按兩下 [年齡] 單元格,然後從下拉式清單中選取 [ProspectiveBuyer.calcAge]。

    警告

    如果您沒有在清單中看到資料行,您可能必須重新整理設計工具中載入的數據源檢視定義。 若要這樣做,請從 [ 檔案] 選單選取 [ 全部儲存],然後在設計工具中關閉並重新開啟專案。

  11. 按一下 [確定]

設計預測查詢

  1. [採礦模型預測] 索引卷標工具列上的第一個按鈕是 [切換至設計視圖]/[切換至結果檢視]/[切換至查詢檢視] 按鈕。 按下此按鈕上的向下箭號,然後選取 [ 設計]。

  2. 在 [ 採礦模型預測 ] 索引卷標的方格中,按兩下 [來源 ] 數據行中第一個空白數據列中的儲存格,然後選取 [ 預測函數]。

  3. 在 [ 預測函數 ] 的 [ 欄位 ] 欄中,選取 PredictProbability

    在相同列的 [別名] 欄位中,輸入 結果的機率

  4. 從上方的 [採礦模型] 視窗中,選取 [Bike Buyer] 並拖曳至 Criteria/Argument 單元格。

    當您放手時,[TM_Decision_Tree]。[Bike Buyer] 會出現在 Criteria/Argument 單元格中。

    這會指定函式 PredictProbability 的目標數據行。 如需函式的詳細資訊,請參閱 數據採礦延伸模組 (DMX) 函式參考

  5. 按一下 來源 資料列中的下一個空白資料行,然後選取 TM_Decision_Tree 採礦模型。

  6. TM_Decision_Tree資料列的欄位欄,選擇Bike Buyer

  7. TM_Decision_Tree 列中的 Criteria/Argument 欄中,輸入 =1

  8. 按一下 來源 欄中的下一個空白列,然後選取 ProspectiveBuyer 資料表

  9. ProspectiveBuyer 行的 字段 列中,選取 ProspectiveBuyerKey

    這會將唯一標識符新增至預測查詢,讓您可以識別誰是和誰不太可能購買自行車。

  10. 將五個數據列新增至方格。 針對每個數據列,選取 [ProspectiveBuyer] 數據表 作為 [來源 ],然後在 [欄位 ] 資料格中新增下列數據行:

    • calcAge

    • 姓氏

    • 名字

    • 地址欄位1

    • 地址欄位2

最後,執行查詢並瀏覽結果。

預測查詢產生器也包含下列控制項:

  • 顯示 複選框

    可讓您從查詢中移除子句,而不需要從設計工具中刪除子句。 當您使用複雜的查詢並想要保留語法,而不需要複製 DMX 並貼到視窗中時,這非常有用。

  • 群組

    在選取行的開頭插入左括弧,或在目前行尾插入右括弧。

  • AND/OR

    在目前函式或欄位之後,立即插入 AND 運算子或 OR 運算符。

若要執行查詢並檢視結果

  1. 在 [ 採礦模型預測 ] 索引標籤中,選取 [結果] 按鈕。

  2. 執行查詢並顯示結果之後,您可以檢閱結果。

    [ 資料挖掘模型預測 ] 選項卡會顯示可能購買自行車的潛在客戶的連絡資訊。 結果機率欄位表示預測正確的機率。 您可以使用這些結果來判斷要以郵件鎖定哪些潛在客戶。

  3. 此時,您可以儲存結果。 您有三個選項:

    • 以滑鼠右鍵按下結果中的數據列,然後選取 [ 複製 ] 將該值 (和數據行標題) 儲存至剪貼簿。

    • 以滑鼠右鍵按兩下結果中的任何資料列,然後選取 [ 全部複製 ] 將整個結果集,包括數據行標題複製到剪貼簿。

    • 按兩下 [儲存查詢結果 ],將結果直接儲存至資料庫,如下所示:

      1. 在 [ 儲存數據採礦查詢結果 ] 對話框中,選取數據源,或定義新的數據源。

      2. 輸入將包含查詢結果的數據表名稱。

      3. 使用 [ 新增至 DSV] 選項來建立數據表,並將它新增至現有的數據源檢視。 如果您想要保留模型的所有相關數據表,例如定型數據、預測源數據,以及在同一個數據源檢視中查詢結果,這會很有用。

      4. 使用選項 [如果存在覆寫],即可使用最新的結果來更新現有的數據表。

        如果您已將任何數據行新增至預測查詢、變更預測查詢中任何數據行的名稱或數據類型,或在目的地數據表上執行任何 ALTER 語句,則必須使用 選項來覆寫數據表。

        此外,如果多個數據行具有相同的名稱(例如,預設數據行名稱 Expression),您必須為具有重複名稱的數據行建立別名,或在設計工具嘗試將結果儲存至 SQL Server 時引發錯誤。 原因是 SQL Server 不允許多個數據行具有相同的名稱。

        如需詳細資訊,請參閱儲存數據採礦查詢結果對話框(採礦模型預測檢視)。

課程中的下一個工作

在結構化資料上使用深入分析(基礎資料探勘教學)

另請參閱

使用預測查詢產生器建立預測查詢