使用增益圖測試精確度（基本資料採礦教學課程）

在數據採礦設計師的 [ 採礦精確度圖表 ] 索引卷標上，您可以計算每個模型進行預測的程度，並直接比較每個模型的結果與其他模型的結果。這個比較方法稱為 增益圖。一般而言，採礦模型的預測精確度是以增益或分類精確度來測量。在本教學課程中，我們只會使用提升圖。

在本主題中，您將執行下列工作：

選擇輸入數據
設定精確度圖表參數

選擇輸入數據

測試採礦模型精確度的第一個步驟是選取要用於測試的數據源。您將測試模型對測試數據執行得有多好，然後搭配外部數據使用。

若要選取數據集

切換至 SQL Server Data Tools 中資料探勘設計師中的 探勘準確度圖表 標籤，然後選取 輸入選擇 標籤。
在 [ 選取要用於精確度圖表的數據集 ] 群組方塊中，選取 [使用採礦結構測試案例]。這是您在建立資料探勘結構時所保留的測試數據。

如需其他選項的詳細資訊，請參閱選擇精確度圖表類型和設定圖表選項。

設定精確度圖表參數

若要建立精確度圖表，您必須定義三件事：

您應該在精確度圖表中包含哪些模型？
您要測量哪一個可預測屬性？有些模型可能有多個目標，但每個圖表一次只能測量一個結果。

若要在精確度圖表中使用某一欄作為可預測的欄名稱，該欄必須具有Predict或Predict Only的使用類型。此外，目標資料行的內容類型必須是 Discrete 或 Discretized。換句話說，您無法使用增益圖來測量連續數值輸出的精確度。
您要測量模型的一般精確度，或預測特定值的正確性（例如 [Bike Buyer] = 'Yes'）

產生提升圖

在資料採礦設計工具的 輸入選擇 索引標籤上，於 選擇要在增益圖中顯示的可預測的採礦模型欄位 下，選取 同步預測欄位和值 的複選框。
在 [ 可預測數據行名稱 ] 數據行中，確認已為每個模型選取 Bike Buyer 。
在 [ 顯示 ] 數據行中，選取每個模型。

根據預設，會選取採礦結構中的所有模型。您可以決定不包含模型，但在本教學課程中，所有模型都會保持選取狀態。
在 [ 預測值] 數據行中，選取 [1]。針對具有相同可預測數據行的每個模型，會自動填入相同的值。
選取 提升圖 索引標籤。

當您按下索引標籤時，會執行預測查詢來取得測試數據的預測，並將結果與已知值進行比較。結果已繪製在圖形上。

如果您使用 [預測值 ] 選項指定特定目標結果，增益圖會繪製隨機猜測的結果和理想模型的結果。
- 隨機猜測線顯示模型在不使用任何數據進行預測的情況下，其準確性：也就是兩種結果各佔50%。增益圖幫助您可視化模型相較於隨機猜測的效能優勢。
- 理想的模型行代表精確度的上限。如果你的模型總是正確預測，它會顯示你可以達到的最大潛在利益。
您建立的採礦模型通常介於這兩個極端之間。隨機猜測的任何改進都會被視為增益。
使用圖例找出代表理想模型和隨機猜測模型的彩色線條。

TM_Decision_Tree您會發現模型提供最大的增益，優於群集和貝氏機率分類模型。

如需深入了解與此處建立的提昇圖類似之提昇圖，請參閱提昇圖（Analysis Services - 數據採礦）。

課程中的下一個工作

測試篩選模型（基本數據採礦教學課程）

另請參閱

增益圖（Analysis Services - 數據採礦）
增益圖索引標籤（採礦精確度圖表檢視）

Last updated on 2017-03-06

使用增益圖測試精確度 （基本資料採礦教學課程）