在數據採礦設計師的 [ 採礦精確度圖表 ] 索引卷標上,您可以計算每個模型進行預測的程度,並直接比較每個模型的結果與其他模型的結果。 這個比較方法稱為 增益圖。 一般而言,採礦模型的預測精確度是以增益或分類精確度來測量。 在本教學課程中,我們只會使用提升圖。
在本主題中,您將執行下列工作:
選擇輸入數據
測試採礦模型精確度的第一個步驟是選取要用於測試的數據源。 您將測試模型對測試數據執行得有多好,然後搭配外部數據使用。
若要選取數據集
切換至 SQL Server Data Tools 中資料探勘設計師中的 探勘準確度圖表 標籤,然後選取 輸入選擇 標籤。
在 [ 選取要用於精確度圖表的數據集 ] 群組方塊中,選取 [使用採礦結構測試案例]。 這是您在建立資料探勘結構時所保留的測試數據。
如需其他選項的詳細資訊,請參閱 選擇精確度圖表類型和設定圖表選項。
設定精確度圖表參數
若要建立精確度圖表,您必須定義三件事:
您應該在精確度圖表中包含哪些模型?
您要測量哪一個可預測屬性? 有些模型可能有多個目標,但每個圖表一次只能測量一個結果。
若要在精確度圖表中使用某一欄作為可預測的欄名稱,該欄必須具有
Predict或Predict Only的使用類型。 此外,目標資料行的內容類型必須是Discrete或Discretized。 換句話說,您無法使用增益圖來測量連續數值輸出的精確度。您要測量模型的一般精確度,或預測特定值的正確性(例如 [Bike Buyer] = 'Yes')
產生提升圖
在資料採礦設計工具的 輸入選擇 索引標籤上,於 選擇要在增益圖中顯示的可預測的採礦模型欄位 下,選取 同步預測欄位和值 的複選框。
在 [ 可預測數據行名稱 ] 數據行中,確認已為每個模型選取 Bike Buyer 。
在 [ 顯示 ] 數據行中,選取每個模型。
根據預設,會選取採礦結構中的所有模型。 您可以決定不包含模型,但在本教學課程中,所有模型都會保持選取狀態。
在 [ 預測值] 數據行中,選取 [1]。 針對具有相同可預測數據行的每個模型,會自動填入相同的值。
選取 提升圖 索引標籤。
當您按下索引標籤時,會執行預測查詢來取得測試數據的預測,並將結果與已知值進行比較。 結果已繪製在圖形上。
如果您使用 [預測值 ] 選項指定特定目標結果,增益圖會繪製隨機猜測的結果和理想模型的結果。
隨機猜測線顯示模型在不使用任何數據進行預測的情況下,其準確性:也就是兩種結果各佔50%。 增益圖幫助您可視化模型相較於隨機猜測的效能優勢。
理想的模型行代表精確度的上限。 如果你的模型總是正確預測,它會顯示你可以達到的最大潛在利益。
您建立的採礦模型通常介於這兩個極端之間。 隨機猜測的任何改進都會被視為 增益。
使用圖例找出代表理想模型和隨機猜測模型的彩色線條。
TM_Decision_Tree您會發現模型提供最大的增益,優於群集和貝氏機率分類模型。
如需深入了解與此處建立的提昇圖類似之提昇圖,請參閱提昇圖(Analysis Services - 數據採礦)。