交叉驗證公式
適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
當您產生交叉驗證報告時,它會根據採礦模型的類型(也就是用來建立模型的演算法)、可預測屬性的數據類型,以及可預測的屬性值,包含每個模型的精確度量值。
本節列出交叉驗證報表中使用的量值,並描述計算方法。
如需依模型類型的精確度量值明細,請參閱交叉驗證報告中 量值。
用於交叉驗證量值的公式
注意
重要事項: 每個目標屬性都會計算這些精確度量值。 針對每個屬性,您可以指定或省略目標值。 如果資料集中的案例沒有目標屬性的任何值,此案例會被視為具有稱為 遺漏值的特殊值。 計算特定目標屬性的精確度量值時,不會計算遺漏值的數據列。 請注意,由於會個別計算每個屬性的分數,如果目標屬性的值存在,但其他屬性遺漏,則不會影響目標屬性的分數。
量 | 適用於 | 實現 |
---|---|---|
真 | 離散屬性,已指定值 | 符合這些條件的案例計數: 案例包含目標值。 模型預測該案例包含目標值。 |
true 負數 | 離散屬性,已指定值 | 符合這些條件的案例計數: Case 不包含目標值。 模型預測該案例不包含目標值。 |
誤判 | 離散屬性,已指定值 | 符合這些條件的案例計數: 實際值等於目標值。 模型預測該案例包含目標值。 |
誤判 | 離散屬性,已指定值 | 符合這些條件的案例計數: 實際值不等於目標值。 模型預測該案例不包含目標值。 |
通過/失敗 | 離散屬性,沒有指定的目標 | 符合這些條件的案例計數: 如果具有最高機率的預測狀態與輸入狀態相同,且機率大於 狀態臨界值的值,則傳遞。 否則,會失敗。 |
增益 | 離散屬性。 您可以指定目標值,但並非必要。 | 目標屬性值之所有數據列的平均記錄可能性,其中每個案例的記錄可能性都會計算為Log(ActualProbability/MarginalProbability)。 若要計算平均值,記錄可能性值的總和會除以輸入數據集中的數據列數目,排除目標屬性遺漏值的數據列。 增益可以是負值或正值。 正值表示優於隨機猜測的有效模型。 |
記錄分數 | 離散屬性。 您可以指定目標值,但並非必要。 | 每個案例的實際機率記錄、加總,然後除以輸入數據集中的數據列數目,並排除目標屬性遺漏值的數據列。 因為機率是以小數點表示,因此記錄分數一律為負數。 接近 0 的分數是更好的分數。 |
案例可能性 | 簇 | 所有案例的叢集可能性分數總和,除以分割區中的案例數目,排除目標屬性遺漏值的數據列。 |
平均絕對誤差 | 連續屬性 | 分割區中所有案例的絕對錯誤總和,除以分割區中的案例數目。 |
根平均平方誤差 | 連續屬性 | 分割區平均平方誤差的平方根。 |
根平均平方誤差 | 離散屬性。 您可以指定目標值,但並非必要。 | 機率分數補碼平方平方的平方根,除以分割區中的案例數目,不包括目標屬性遺漏值的數據列。 |
根平均平方誤差 | 離散屬性,沒有指定的目標。 | 機率分數補碼之平方平方的平方根,除以分割區中的案例數目,不包括目標屬性遺漏值的案例。 |