交叉驗證公式

發行項
07/05/2024

適用於： SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦，現在已在 SQL Server 2022 Analysis Services 中停止。檔不會更新為已淘汰和已停止的功能。若要深入瞭解，請參閱 Analysis Services 回溯相容性。

當您產生交叉驗證報告時，它會根據採礦模型的類型（也就是用來建立模型的演算法）、可預測屬性的數據類型，以及可預測的屬性值，包含每個模型的精確度量值。

本節列出交叉驗證報表中使用的量值，並描述計算方法。

如需依模型類型的精確度量值明細，請參閱交叉驗證報告中量值。

用於交叉驗證量值的公式

注意

重要事項： 每個目標屬性都會計算這些精確度量值。針對每個屬性，您可以指定或省略目標值。如果資料集中的案例沒有目標屬性的任何值，此案例會被視為具有稱為 遺漏值的特殊值。計算特定目標屬性的精確度量值時，不會計算遺漏值的數據列。請注意，由於會個別計算每個屬性的分數，如果目標屬性的值存在，但其他屬性遺漏，則不會影響目標屬性的分數。

量	適用於	實現
真	離散屬性，已指定值	符合這些條件的案例計數：案例包含目標值。模型預測該案例包含目標值。
true 負數	離散屬性，已指定值	符合這些條件的案例計數： Case 不包含目標值。模型預測該案例不包含目標值。
誤判	離散屬性，已指定值	符合這些條件的案例計數：實際值等於目標值。模型預測該案例包含目標值。
誤判	離散屬性，已指定值	符合這些條件的案例計數：實際值不等於目標值。模型預測該案例不包含目標值。
通過/失敗	離散屬性，沒有指定的目標	符合這些條件的案例計數：如果具有最高機率的預測狀態與輸入狀態相同，且機率大於狀態臨界值的值，則傳遞。否則，會失敗。
增益	離散屬性。您可以指定目標值，但並非必要。	目標屬性值之所有數據列的平均記錄可能性，其中每個案例的記錄可能性都會計算為Log（ActualProbability/MarginalProbability）。若要計算平均值，記錄可能性值的總和會除以輸入數據集中的數據列數目，排除目標屬性遺漏值的數據列。增益可以是負值或正值。正值表示優於隨機猜測的有效模型。
記錄分數	離散屬性。您可以指定目標值，但並非必要。	每個案例的實際機率記錄、加總，然後除以輸入數據集中的數據列數目，並排除目標屬性遺漏值的數據列。因為機率是以小數點表示，因此記錄分數一律為負數。接近 0 的分數是更好的分數。
案例可能性	簇	所有案例的叢集可能性分數總和，除以分割區中的案例數目，排除目標屬性遺漏值的數據列。
平均絕對誤差	連續屬性	分割區中所有案例的絕對錯誤總和，除以分割區中的案例數目。
根平均平方誤差	連續屬性	分割區平均平方誤差的平方根。
根平均平方誤差	離散屬性。您可以指定目標值，但並非必要。	機率分數補碼平方平方的平方根，除以分割區中的案例數目，不包括目標屬性遺漏值的數據列。
根平均平方誤差	離散屬性，沒有指定的目標。	機率分數補碼之平方平方的平方根，除以分割區中的案例數目，不包括目標屬性遺漏值的案例。

另請參閱

測試和驗證（資料採礦）
交叉驗證（Analysis Services - 數據採礦）

共用方式為

交叉驗證公式

用於交叉驗證量值的公式

另請參閱

意見反應

其他資源