共用方式為


使用增益圖測試精確度 (基本資料採礦教學課程)

在數據採礦設計師的 [ 採礦精確度圖表 ] 索引卷標上,您可以計算每個模型進行預測的程度,並直接比較每個模型的結果與其他模型的結果。 這個比較方法稱為 增益圖。 一般而言,採礦模型的預測精確度是以增益或分類精確度來測量。 在本教學課程中,我們只會使用提升圖。

在本主題中,您將執行下列工作:

選擇輸入數據

測試採礦模型精確度的第一個步驟是選取要用於測試的數據源。 您將測試模型對測試數據執行得有多好,然後搭配外部數據使用。

若要選取數據集

  1. 切換至 SQL Server Data Tools 中資料探勘設計師中的 探勘準確度圖表 標籤,然後選取 輸入選擇 標籤。

  2. 在 [ 選取要用於精確度圖表的數據集 ] 群組方塊中,選取 [使用採礦結構測試案例]。 這是您在建立資料探勘結構時所保留的測試數據。

    如需其他選項的詳細資訊,請參閱 選擇精確度圖表類型和設定圖表選項

設定精確度圖表參數

若要建立精確度圖表,您必須定義三件事:

  • 您應該在精確度圖表中包含哪些模型?

  • 您要測量哪一個可預測屬性? 有些模型可能有多個目標,但每個圖表一次只能測量一個結果。

    若要在精確度圖表中使用某一欄作為可預測的欄名稱,該欄必須具有PredictPredict Only的使用類型。 此外,目標資料行的內容類型必須是 DiscreteDiscretized。 換句話說,您無法使用增益圖來測量連續數值輸出的精確度。

  • 您要測量模型的一般精確度,或預測特定值的正確性(例如 [Bike Buyer] = 'Yes')

產生提升圖

  1. 在資料採礦設計工具的 輸入選擇 索引標籤上,於 選擇要在增益圖中顯示的可預測的採礦模型欄位 下,選取 同步預測欄位和值 的複選框。

  2. 在 [ 可預測數據行名稱 ] 數據行中,確認已為每個模型選取 Bike Buyer

  3. 在 [ 顯示 ] 數據行中,選取每個模型。

    根據預設,會選取採礦結構中的所有模型。 您可以決定不包含模型,但在本教學課程中,所有模型都會保持選取狀態。

  4. 在 [ 預測值] 數據行中,選取 [1]。 針對具有相同可預測數據行的每個模型,會自動填入相同的值。

  5. 選取 提升圖 索引標籤。

    當您按下索引標籤時,會執行預測查詢來取得測試數據的預測,並將結果與已知值進行比較。 結果已繪製在圖形上。

    如果您使用 [預測值 ] 選項指定特定目標結果,增益圖會繪製隨機猜測的結果和理想模型的結果。

    • 隨機猜測線顯示模型在不使用任何數據進行預測的情況下,其準確性:也就是兩種結果各佔50%。 增益圖幫助您可視化模型相較於隨機猜測的效能優勢。

    • 理想的模型行代表精確度的上限。 如果你的模型總是正確預測,它會顯示你可以達到的最大潛在利益。

    您建立的採礦模型通常介於這兩個極端之間。 隨機猜測的任何改進都會被視為 增益

  6. 使用圖例找出代表理想模型和隨機猜測模型的彩色線條。

    TM_Decision_Tree您會發現模型提供最大的增益,優於群集和貝氏機率分類模型。

如需深入了解與此處建立的提昇圖類似之提昇圖,請參閱提昇圖(Analysis Services - 數據採礦)。

課程中的下一個工作

測試篩選模型 (基本數據採礦教學課程)

另請參閱

增益圖 (Analysis Services - 數據採礦)
增益圖索引標籤 (採礦精確度圖表檢視)