共用方式為


探索判定樹模型 (基本數據採礦教學課程)

Microsoft 決策樹演算法會預測哪些欄位會影響購買自行車的決策,這是基於訓練集中其他欄位的內容。

決策樹選項卡

在 [ 判定樹 ] 索引標籤上,您可以檢視數據集中每個可預測屬性的判定樹。

在此情況下,模型只會預測一個欄位 Bike Buyer,因此只有一個樹狀結構可供檢視。 如果有更多樹木,您可以使用 方塊來選擇另一棵樹。

當您在判定樹查看器中檢視 TM_Decision_Tree 模型時,您可以在圖表左側看到最重要的屬性。 「最重要」表示這些屬性對結果的影響最大。 樹狀結構中越靠下(越靠圖表右邊)的屬性影響較小。

在此範例中,年齡是預測自行車購買的最重要因素。 模型會依年齡將客戶分組,然後顯示每個年齡群組的下一個更重要屬性。 例如,在34到40歲的客戶群組中,擁有的汽車數目是年齡後最強的預測值。

在 [決策樹] 選項卡中探索模型

  1. 選取資料採礦設計師中的 [採礦模型查看器] 索引標籤。

    根據預設,設計工具會開啟結構的第一個模型,此時為 TM_Decision_Tree

  2. 使用放大鏡按鈕來調整樹形圖顯示的大小。

    根據預設,Microsoft樹檢視器只會顯示樹狀結構的前三個層級。 如果樹狀結構包含少於三個層級,查看器只會顯示現有的層級。 您可以使用 [顯示層級 ] 滑桿或 [預設擴充 ] 列表來檢視更多層級。

  3. 將幻燈片放映層級移動到第四列。

  4. Background 值變更為 1

    藉由變更 背景 設定,您可以快速查看每個節點中具有 [Bike Buyer] 目標值的 1 案例數目。 請記住,在此特定案例中,每個案例都代表客戶。 值 1 表示客戶先前已購買自行車;值 0 表示客戶尚未購買自行車。 節點底紋越暗,具有目標值的節點中案例百分比越高。

  5. 將游標放在標示為 [全部] 的節點上方。 工具提示會顯示下列資訊:

    • 案例總數

    • 非自行車購買者案例數目

    • 自行車購買者案例數目

    • 遺漏 [Bike Buyer] 值的案例數目

    或者,將游標放在樹狀結構中的任何節點上方,以查看從之前節點到達該節點所需的條件。 您也可以在 採礦圖例中檢視相同的資訊。

  6. 點擊 Age >=34 和 < 41 的節點。 直方圖顯示為節點上的細橫條,並代表在此年齡範圍內客戶的分佈,他們曾經(粉紅色)和未曾(藍色)購買過自行車。 "系統顯示,年齡在34至40歲之間、擁有一輛或沒有車輛的客戶很可能會購買自行車。" 進一步瞭解,如果客戶實際年齡為38至40歲,購買自行車的可能性會增加。

由於您在建立結構和模型時已啟用鑽取,因此您可以從模型案例和資料挖掘結構擷取詳細資訊,包括資料挖掘模型中未包含的欄位(例如 emailAddress、FirstName)。

如需詳細資訊,請參閱鑽研查詢(數據採礦)。

鑽研案例數據

  1. 右鍵單擊節點,然後選取鑽研接著選取僅模型欄

    每個定型案例的詳細數據都會以電子表格格式顯示。 這些詳細數據來自您在建置採礦結構時選取為案例數據表的 vTargetMail 檢視。

  2. 右鍵點選節點,然後選擇 [ 鑽研 ],接著選擇 [模型] 和 [結構數據行]

    相同的電子表格會顯示附加至結尾的結構數據行。

相依性網路索引標籤

[ 相依性網络 ] 索引卷標會顯示導致採礦模型預測能力的屬性之間的關聯性。 相依性網路查看器強化了我們的發現,即年齡和地區是預測自行車購買的重要因素。

在「相依性網路」標籤中探索模型
  1. 點擊 Bike Buyer 節點以識別相依性。

    相依性網路的中心節點 , Bike Buyer代表採礦模型中的可預測屬性。 圖表會強調顯示對預測屬性產生影響的任何連接節點。

  2. 調整 [所有連結] 滑桿,以識別最具影響力的屬性。

    當您拖曳滑桿時,對 [Bike Buyer] 欄位影響力弱的屬性會從圖形中移除。 藉由調整滑桿,您可以發現年齡和區域是預測某人是否為自行車購買者的最大因素。

請參閱這些主題,以使用其他類型的模型來探索數據。

課程中的下一個工作

探索叢集模型 (基本數據採礦教學課程)

另請參閱

資料挖掘模型檢視器任務與操作指南
判定樹索引標籤 (採礦模型查看器)
相依性網路索引標籤 (採礦模型查看器)
使用Microsoft樹檢視器流覽模型