使用增益圖測試精確度 (基本資料採礦教學課程)
在資料採礦設計師的 [採礦精確度圖表] 索引標籤上,您可以計算出每個模型執行預測的效果有多好,並直接對照其他模型的結果來比較每一個模型的結果。這種比較方法稱為「增益圖」(Lift Chart)。一般來說,採礦模型的預測精確度是由「增益」(Lift) 或分類精確度所衡量。在此教學課程中,我們只會使用增益圖。如需有關增益圖和其他精確度圖表的詳細資訊,請參閱<圖表模型精確度的工具 (Analysis Services - 資料採礦)>。
本主題中,您將會執行下列工作:
選擇輸入資料
選取模型、可預測資料行及值
選擇輸入資料
若要測試採礦模型的精確度,第一個步驟就是要選取您將用於測試的資料來源。您將會對照測試資料來測試模型的執行效果,然後搭配外部資料來使用模型。
若要選取資料集
在 Business Intelligence Development Studio 的資料採礦設計師中,切換到 [採礦精確度圖表] 索引標籤,然後選取 [輸入選擇] 索引標籤。
在 [選取要用於精確度圖表的資料集] 群組方塊中,選取 [使用採礦結構測試案例] 來測試模型,其方式是使用您在建立採礦結構時擱置在一旁的測試資料。
如需有關其他選項的詳細資訊,請參閱<測量採礦模型精確度 (Analysis Services - 資料採礦)>。
選取模型、可預測資料行及值
下一個步驟是選取您想要加入增益圖中的模型、比較模型時所對照的可預測資料行,以及要預測的值。
[!附註]
[可預測資料行名稱] 清單中的採礦模型資料行限制為使用類型設定為 Predict 或 Predict Only 而且內容類型為 Discrete 或 Discretized 的資料行。
若要顯示模型的增益
在資料採礦設計師的 [輸入選擇] 索引標籤上,於 [選取可預測的採礦模型資料行,以顯示在增益圖中] 底下選取 [同步處理預測資料行和值] 的核取方塊。
在 [可預測資料行名稱] 資料行中,確認已針對每一個模型選取 [Bike Buyer]。
在 [顯示] 資料行中,選取每一個方法。
依預設,會選取採礦結構中所有的模型。您可以決定不加入某個模型,但在本教學課程中,則是維持選取所有模型。
在 [預測值] 資料行中,選取 [1]。系統會針對具有相同可預測資料行的每個模型,自動填入相同的值。
選取 [增益圖] 索引標籤可顯示增益圖。
當您按一下這個索引標籤時,系統會在伺服器和資料庫上,執行採礦結構和輸入資料表的預測查詢。結果會繪製在圖形上。
當您輸入 [預測值] 時,增益圖會繪製隨機猜測模型及理想的模型。您所建立的採礦模型將會介於這兩個極端之間,亦即介於隨機猜測與理想或完美預測之間。任何能改進隨機猜測的結果就稱為「增益」(Lift)。
使用圖例可找出代表理想的模型與隨機猜測模型的有色線條。
您將會注意到 TM_Decision_Tree 模型會提供最大的增益,其效果優於群集模型和貝氏機率分類模型。
如需類似於本課程所建立之增益圖的深入說明,請參閱<增益圖 (Analysis Services - 資料採礦)>。