Microsoft 決策樹演算法會預測哪些欄位會影響購買自行車的決策,這是基於訓練集中其他欄位的內容。
決策樹選項卡
在 [ 判定樹 ] 索引標籤上,您可以檢視數據集中每個可預測屬性的判定樹。
在此情況下,模型只會預測一個欄位 Bike Buyer,因此只有一個樹狀結構可供檢視。 如果有更多樹木,您可以使用 樹 方塊來選擇另一棵樹。
當您在判定樹查看器中檢視 TM_Decision_Tree 模型時,您可以在圖表左側看到最重要的屬性。 「最重要」表示這些屬性對結果的影響最大。 樹狀結構中越靠下(越靠圖表右邊)的屬性影響較小。
在此範例中,年齡是預測自行車購買的最重要因素。 模型會依年齡將客戶分組,然後顯示每個年齡群組的下一個更重要屬性。 例如,在34到40歲的客戶群組中,擁有的汽車數目是年齡後最強的預測值。
在 [決策樹] 選項卡中探索模型
選取資料採礦設計師中的 [採礦模型查看器] 索引標籤。
根據預設,設計工具會開啟結構的第一個模型,此時為
TM_Decision_Tree。使用放大鏡按鈕來調整樹形圖顯示的大小。
根據預設,Microsoft樹檢視器只會顯示樹狀結構的前三個層級。 如果樹狀結構包含少於三個層級,查看器只會顯示現有的層級。 您可以使用 [顯示層級 ] 滑桿或 [預設擴充 ] 列表來檢視更多層級。
將幻燈片放映層級移動到第四列。
將 Background 值變更為
1。藉由變更 背景 設定,您可以快速查看每個節點中具有 [Bike Buyer] 目標值的
1案例數目。 請記住,在此特定案例中,每個案例都代表客戶。 值1表示客戶先前已購買自行車;值 0 表示客戶尚未購買自行車。 節點底紋越暗,具有目標值的節點中案例百分比越高。將游標放在標示為 [全部] 的節點上方。 工具提示會顯示下列資訊:
案例總數
非自行車購買者案例數目
自行車購買者案例數目
遺漏 [Bike Buyer] 值的案例數目
或者,將游標放在樹狀結構中的任何節點上方,以查看從之前節點到達該節點所需的條件。 您也可以在 採礦圖例中檢視相同的資訊。
點擊 Age >=34 和 < 41 的節點。 直方圖顯示為節點上的細橫條,並代表在此年齡範圍內客戶的分佈,他們曾經(粉紅色)和未曾(藍色)購買過自行車。 "系統顯示,年齡在34至40歲之間、擁有一輛或沒有車輛的客戶很可能會購買自行車。" 進一步瞭解,如果客戶實際年齡為38至40歲,購買自行車的可能性會增加。
由於您在建立結構和模型時已啟用鑽取,因此您可以從模型案例和資料挖掘結構擷取詳細資訊,包括資料挖掘模型中未包含的欄位(例如 emailAddress、FirstName)。
如需詳細資訊,請參閱鑽研查詢(數據採礦)。
鑽研案例數據
右鍵單擊節點,然後選取鑽研接著選取僅模型欄。
每個定型案例的詳細數據都會以電子表格格式顯示。 這些詳細數據來自您在建置採礦結構時選取為案例數據表的 vTargetMail 檢視。
右鍵點選節點,然後選擇 [ 鑽研 ],接著選擇 [模型] 和 [結構數據行]。
相同的電子表格會顯示附加至結尾的結構數據行。
相依性網路索引標籤
[ 相依性網络 ] 索引卷標會顯示導致採礦模型預測能力的屬性之間的關聯性。 相依性網路查看器強化了我們的發現,即年齡和地區是預測自行車購買的重要因素。
在「相依性網路」標籤中探索模型
點擊
Bike Buyer節點以識別相依性。相依性網路的中心節點 ,
Bike Buyer代表採礦模型中的可預測屬性。 圖表會強調顯示對預測屬性產生影響的任何連接節點。調整 [所有連結] 滑桿,以識別最具影響力的屬性。
當您拖曳滑桿時,對 [Bike Buyer] 欄位影響力弱的屬性會從圖形中移除。 藉由調整滑桿,您可以發現年齡和區域是預測某人是否為自行車購買者的最大因素。
相關工作
請參閱這些主題,以使用其他類型的模型來探索數據。
課程中的下一個工作
另請參閱
資料挖掘模型檢視器任務與操作指南
判定樹索引標籤 (採礦模型查看器)
相依性網路索引標籤 (採礦模型查看器)
使用Microsoft樹檢視器流覽模型