測試篩選過的模型 (基本資料採礦教學課程)
現在您判斷出 TM_Decision_Tree 模型最為正確,您應該在 Adventure Works Cycles 目標郵寄活動的內容下評估此模型。行銷部門想要知道自行車的男性買主與女性買主之間是否有特性上的差異。這項資訊將會幫助他們決定要使用哪些雜誌來登廣告,以及使用哪些產品當做郵寄活動的特色產品。
在這一課,我們將會建立一個依性別篩選的模型。然後,您可以輕鬆地建立該模型的副本,並且單獨將篩選條件變更為根據不同的性別產生新的模型。
如需有關篩選的詳細資訊,請參閱<建立採礦模型的篩選 (Analysis Services - 資料採礦)>。
使用篩選
篩選可讓您輕鬆地根據資料子集來建立模型。篩選只會套用到模型中,而且不會變更基礎資料來源。如需有關套用篩選到巢狀資料表的詳細資訊,請參閱<中繼資料採礦教學課程 (Analysis Services - 資料採礦)>。
篩選案例資料表
首先,您將會建立 TM_Decision_Tree 模型的副本。
若要複製決策樹模型
在 Business Intelligence Development Studio 的 [方案總管] 中,選取 [ASDataMining2008]。
按一下 [採礦模型] 索引標籤。
以滑鼠右鍵按一下 TM_Decision_Tree 模型,然後選取 [新增採礦模型]。
在 [模型名稱] 欄位中,輸入 TM_Decision_Tree_Male。
按一下 [確定]。
接下來,建立一個篩選來選取此模型的客戶 (根據客戶的性別)。
若要建立採礦模型的案例篩選
以滑鼠右鍵按一下 TM_Decision_Tree_Male 採礦模型,即可開啟快速鍵功能表。
-或-
選取此模型。在 [採礦模型] 功能表上,選取 [設定模型篩選器]。
在 [模型篩選器] 對話方塊的 [採礦結構資料行] 文字方塊中,按一下方格中的上方資料列。
下拉式清單只會顯示該資料表中的資料行名稱。
在 [採礦結構資料行] 文字方塊中,選取 [性別]。
文字方塊左側的圖示會變更,指出選取的項目是資料表或資料行。
按一下 [運算子] 文字方塊,然後從清單中選取等於 (=) 運算子。
按一下 [值] 文字方塊,然後輸入 M。
在方格中,按一下下一個資料列。
按一下 [確定],關閉模型篩選器。
篩選器會顯示在 [屬性] 視窗中。另外,您也可以從 [屬性] 視窗啟動 [模型篩選器] 對話方塊。
重複上述步驟,但是這次將模型命名為 TM_Decision_Tree_Female,並在 [值] 文字方塊中輸入 F。
此時在 [採礦模型] 索引標籤中會出現兩個新的模型。
處理篩選過的模型
模型要等到部署及處理之後,才可以使用。如需有關處理模型的詳細資訊,請參閱<處理目標郵寄結構中的模型 (基本資料採礦教學課程)>。
若要處理篩選過的模型
以滑鼠右鍵按一下 TM_Decision_Tree_Male 模型,然後選取 [處理採礦結構和所有模型]。
按一下 [執行],即可處理新的模型。
在處理完成之後,請按一下兩個處理視窗中的 [關閉]。
評估結果
檢視結果,並評估篩選過之模型的正確性,就像之前三個模型的處理方式一樣。如需詳細資訊,請參閱:
若要探索篩選過的模型
在 [資料採礦設計師] 中,選取 [採礦模型檢視器] 索引標籤。
在 [採礦模型] 方塊中,選取 TM_Decision_Tree_Male。
將 [顯示層級] 滑動到 3。
將 [背景] 值變更為 1。
將游標放在標示為 [全部] 的節點上方,以查看自行車買主數與非自行車買主數。
針對 TM_Decision_Tree_Female 重複步驟 1-5。
瀏覽 TM_Decision_Tree 的結果及篩選性別的模型。與所有自行車買主相較之下,男性和女性自行車買主與未篩選的自行車買主具有一些共同的特性,但是這三種買主也有一些有趣的差異。這是非常有用的資訊,可供 Adventure Works Cycles 用來開發他們的行銷活動。
若要測試篩選過之模型的增益
在 Business Intelligence Development Studio 的資料採礦設計師中,切換到 [採礦精確度圖表] 索引標籤,然後選取 [輸入選擇] 索引標籤。
在 [選取要用於精確度圖表的資料集] 群組方塊中,選取 [使用採礦結構測試案例] 選項。
在資料採礦設計師的 [輸入選擇] 索引標籤上,於 [選取可預測的採礦模型資料行,以顯示在增益圖中] 底下選取 [同步處理預測資料行和值] 的核取方塊。
在 [可預測資料行名稱] 資料行中,確認已針對每一個模型選取 [Bike Buyer]。
在 [顯示] 資料行中,選取每一個方法。
在 [預測值] 資料行中,選取 [1]。
選取 [增益圖] 索引標籤可顯示增益圖。
您現在會注意到有三個決策樹模型提供了隨機猜測模型的重大升級,其效果也優於群集模型和貝氏機率分類模型。