共用方式為


交叉驗證公式

適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性

當您產生交叉驗證報告時,它會根據採礦模型的類型(也就是用來建立模型的演算法)、可預測屬性的數據類型,以及可預測的屬性值,包含每個模型的精確度量值。

本節列出交叉驗證報表中使用的量值,並描述計算方法。

如需依模型類型的精確度量值明細,請參閱交叉驗證報告中 量值

用於交叉驗證量值的公式

注意

重要事項: 每個目標屬性都會計算這些精確度量值。 針對每個屬性,您可以指定或省略目標值。 如果資料集中的案例沒有目標屬性的任何值,此案例會被視為具有稱為 遺漏值的特殊值。 計算特定目標屬性的精確度量值時,不會計算遺漏值的數據列。 請注意,由於會個別計算每個屬性的分數,如果目標屬性的值存在,但其他屬性遺漏,則不會影響目標屬性的分數。

適用於 實現
離散屬性,已指定值 符合這些條件的案例計數:

案例包含目標值。

模型預測該案例包含目標值。
true 負數 離散屬性,已指定值 符合這些條件的案例計數:

Case 不包含目標值。

模型預測該案例不包含目標值。
誤判 離散屬性,已指定值 符合這些條件的案例計數:

實際值等於目標值。

模型預測該案例包含目標值。
誤判 離散屬性,已指定值 符合這些條件的案例計數:

實際值不等於目標值。

模型預測該案例不包含目標值。
通過/失敗 離散屬性,沒有指定的目標 符合這些條件的案例計數:

如果具有最高機率的預測狀態與輸入狀態相同,且機率大於 狀態臨界值的值,則傳遞

否則,會失敗。
增益 離散屬性。 您可以指定目標值,但並非必要。 目標屬性值之所有數據列的平均記錄可能性,其中每個案例的記錄可能性都會計算為Log(ActualProbability/MarginalProbability)。 若要計算平均值,記錄可能性值的總和會除以輸入數據集中的數據列數目,排除目標屬性遺漏值的數據列。

增益可以是負值或正值。 正值表示優於隨機猜測的有效模型。
記錄分數 離散屬性。 您可以指定目標值,但並非必要。 每個案例的實際機率記錄、加總,然後除以輸入數據集中的數據列數目,並排除目標屬性遺漏值的數據列。

因為機率是以小數點表示,因此記錄分數一律為負數。 接近 0 的分數是更好的分數。
案例可能性 所有案例的叢集可能性分數總和,除以分割區中的案例數目,排除目標屬性遺漏值的數據列。
平均絕對誤差 連續屬性 分割區中所有案例的絕對錯誤總和,除以分割區中的案例數目。
根平均平方誤差 連續屬性 分割區平均平方誤差的平方根。
根平均平方誤差 離散屬性。 您可以指定目標值,但並非必要。 機率分數補碼平方平方的平方根,除以分割區中的案例數目,不包括目標屬性遺漏值的數據列。
根平均平方誤差 離散屬性,沒有指定的目標。 機率分數補碼之平方平方的平方根,除以分割區中的案例數目,不包括目標屬性遺漏值的案例。

另請參閱

測試和驗證 (資料採礦)
交叉驗證 (Analysis Services - 數據採礦)