通过


交叉验证公式

适用于: SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中弃用了数据挖掘,现已在 SQL Server 2022 Analysis Services 中停止使用。 文档不会更新为已弃用和已停用的功能。 若要了解详细信息,请参阅 Analysis Services 向后兼容性

生成交叉验证报表时,它包含每个模型的准确性度量值,具体取决于挖掘模型的类型(即用于创建模型的算法)、可预测属性的数据类型以及可预测属性值(如果有)。

本部分列出了交叉验证报表中使用的度量值,并介绍了计算方法。

有关按模型类型划分的准确性度量值的细分,请参阅 交叉验证报告中的度量值

用于交叉验证度量值的公式

注释

重要: 对于每个目标属性,计算这些准确性指标。 对于每个属性,可以指定或省略目标值。 如果数据集中的事例没有目标属性的任何值,则事例被视为具有名为 缺失值的特殊值。 计算特定目标属性的准确性度量值时,不计算缺失值的行。 请注意,由于为每个属性单独计算分数,如果目标属性存在值但其他属性缺失,则不会影响目标属性的分数。

Measure 应用到 Implementation
真正例 指定离散属性、值 满足以下条件的情况数量:

事例包含目标值。

模型预测该事例包含目标值。
真负 指定离散属性、值 满足以下条件的案例数:

情况不包含目标值。

模型预测该案例不包含目标值。
假正 离散属性,值已指定 满足这些条件的案例数量:

实际值等于目标值。

模型预测该事例包含目标值。
假阴性 离散属性和其值已被指定 满足这些条件的案例计数:

实际值不等于目标值。

模型预测该案例不包含目标值。
通过/失败 离散属性,未指定目标 满足以下条件的案例的计数:

如果具有最高概率的预测状态与输入状态相同,并且概率大于 状态阈值的值,则传递。

否则,将失败。
电梯 离散属性。 可以指定目标值,但不是必需的。 具有目标属性值的所有行的平均日志可能性,其中每个事例的日志可能性计算为 Log(ActualProbability/MarginalProbability)。 若要计算平均值,日志可能性值的总和除以输入数据集中的行数,不包括目标属性缺少值的行。

提升可以是负值或正值。 正值表示一个优于随机猜测的有效模型。
日志分数 离散属性。 可以指定目标值,但不是必需的。 每个事例的实际概率的日志,求和,然后除以输入数据集中的行数,不包括目标属性缺失值的行。

由于概率表示为十进制分数,因此日志分数始终为负数。 接近 0 的分数是更好的分数。
案例可能性 集群 所有事例的分类可能性分数的总和,除以分区中的事例数,不包括包含目标属性缺失值的行。
平均绝对误差 连续属性 分区中所有事例的绝对误差总和,除以分区中的事例数。
根平均平方误差 连续属性 分区的平均平方误差的平方根。
均方根误差 离散属性。 可以指定目标值,但不是必需的。 概率分数补数的平方的平方根,除以分区中的事例数,不包括目标属性缺失值的行。
均方根误差 离散属性,未指定目标。 概率分数补数的平方的平方根,除以分区中的事例数,不包括目标属性缺失值的事例。

另请参阅

测试和验证 (数据挖掘)
交叉验证 (Analysis Services - 数据挖掘)