分類矩陣 (Analysis Services - 數據採礦)
適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
分類矩陣 藉由判斷預測值是否符合實際值,將模型的所有案例排序為類別。 接著會計算每個類別中的所有案例,並將總計顯示在矩陣中。 分類矩陣是評估統計模型的標準工具,有時稱為 混淆矩陣。
當您選擇 [分類矩陣] 選項時所建立的圖表會比較您指定之每個預測狀態的實際值與預測值。 矩陣中的數據列代表模型的預測值,而數據行則代表實際值。 分析中使用的類別是 誤判為真、真、誤判,為真負數
分類矩陣是評估預測結果的重要工具,因為它可讓您輕鬆瞭解並考慮錯誤預測的影響。 藉由檢視此矩陣中每個數據格中的數量和百分比,您可以快速查看模型準確預測的頻率。
本節說明如何建立分類矩陣,以及如何解譯結果。
了解分類矩陣
請考慮您在基本數據採礦教學課程中建立的模型。 [TM_DecisionTree] 模型可用來協助建立目標郵寄活動,並可用來預測哪些客戶最有可能購買自行車。 若要測試此模型的預期效用,您可以使用數據集,已知結果屬性 [Bike Buyer]的值。 一般而言,您會使用您在建立用於定型模型的採礦結構時所保留的測試數據集。
只有兩個可能的結果:是(客戶可能購買自行車),沒有(客戶可能不會購買自行車)。 因此,產生的分類矩陣相對簡單。
解譯結果
下表顯示TM_DecisionTree模型的分類矩陣。 請記住,對於這個可預測的屬性,0 表示 No 和 1 表示是。
預測 | 0 (實際) | 1 (實際) |
---|---|---|
0 | 362 | 144 |
1 | 121 | 373 |
包含值 362 的第一個結果儲存格表示值 0
該儲存格正下方的儲存格包含值 121,會告訴您 誤判數,或模型預測某人在實際未購買自行車時會購買自行車的次數。
包含值 144 的儲存格表示值 1 的 誤判數目。 因為 1 表示客戶確實購買自行車,所以此統計數據會告訴您,在 144 種情況下,模型預測某人實際上不會購買自行車。
最後,包含值 373 的儲存格表示目標值為 1 的真真數。 換句話說,在 373 種情況下,模型正確地預測有人會購買自行車。
藉由加總對角相鄰儲存格中的值,您可以判斷模型的整體精確度。 一對角線會告訴您準確預測的總數,另一個對角線則告訴您錯誤的預測總數。
使用多個可預測值
[Bike Buyer] 案例特別容易解譯,因為只有兩個可能的值。 當可預測屬性有多個可能的值時,分類矩陣會為每個可能的實際值加入新的數據行,然後計算每個預測值的相符項目數目。 下表顯示不同模型的結果,其中三個值 (0, 1, 2) 是可能的。
預測 | 0 (實際) | 1 (實際) | 2 (實際) |
---|---|---|---|
0 | 111 | 3 | 5 |
1 | 2 | 123 | 17 |
2 | 19 | 0 | 20 |
雖然新增更多數據行會讓報表看起來更為複雜,但當您想要評估進行錯誤預測的累積成本時,其他詳細數據可能會非常有用。 若要在對角線上建立加總,或比較不同數據列組合的結果,您可以按兩下 [分類 矩陣] 索引卷標中提供的 [複製] 按鈕,然後將報表貼到Excel中。 或者,您可以使用支援 SQL Server 2005 (9.x) 和更新版本的 Sql Server 2005(9.x) 和更新版本的用戶端,直接在 Excel 中建立分類報表,其中包含計數和百分比。 如需詳細資訊,請參閱 SQL Server 數據採礦。
分類矩陣的限制
分類矩陣只能與離散的可預測屬性搭配使用。
雖然您可以在 採礦精確度圖表 設計工具的 [輸入選取] 索引標籤上選取模型時新增多個模型,但 分類矩陣 索引卷標會顯示每個模型的個別矩陣。
相關內容
下列主題包含如何建置和使用分類矩陣和其他圖表的詳細資訊。
主題 | 連結 |
---|---|
說明相關的圖表類型。 |
增益圖 (Analysis Services - 數據採礦) 收益圖 (Analysis Services - 數據採礦) 散佈圖 (Analysis Services - 數據採礦) |
描述採礦模型和採礦結構的交叉驗證用法。 | 交叉驗證 (Analysis Services - 數據採礦) |
說明建立增益圖和其他精確度圖表的步驟。 | 測試和驗證工作和操作說明 (資料採礦) |