适用于:
SQL Server 2019 及更早版本的 Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中弃用了数据挖掘,现已在 SQL Server 2022 Analysis Services 中停止使用。 文档不会更新为已弃用和已停用的功能。 若要了解详细信息,请参阅 Analysis Services 向后兼容性。
生成交叉验证报表时,它包含每个模型的准确性度量值,具体取决于挖掘模型的类型(即用于创建模型的算法)、可预测属性的数据类型以及可预测属性值(如果有)。
本部分列出了交叉验证报表中使用的度量值,并介绍了计算方法。
有关按模型类型划分的准确性度量值的细分,请参阅 交叉验证报告中的度量值。
用于交叉验证度量值的公式
注释
重要: 对于每个目标属性,计算这些准确性指标。 对于每个属性,可以指定或省略目标值。 如果数据集中的事例没有目标属性的任何值,则事例被视为具有名为 缺失值的特殊值。 计算特定目标属性的准确性度量值时,不计算缺失值的行。 请注意,由于为每个属性单独计算分数,如果目标属性存在值但其他属性缺失,则不会影响目标属性的分数。
| Measure | 应用到 | Implementation |
|---|---|---|
| 真正例 | 指定离散属性、值 | 满足以下条件的情况数量: 事例包含目标值。 模型预测该事例包含目标值。 |
| 真负 | 指定离散属性、值 | 满足以下条件的案例数: 情况不包含目标值。 模型预测该案例不包含目标值。 |
| 假正 | 离散属性,值已指定 | 满足这些条件的案例数量: 实际值等于目标值。 模型预测该事例包含目标值。 |
| 假阴性 | 离散属性和其值已被指定 | 满足这些条件的案例计数: 实际值不等于目标值。 模型预测该案例不包含目标值。 |
| 通过/失败 | 离散属性,未指定目标 | 满足以下条件的案例的计数: 如果具有最高概率的预测状态与输入状态相同,并且概率大于 状态阈值的值,则传递。 否则,将失败。 |
| 电梯 | 离散属性。 可以指定目标值,但不是必需的。 | 具有目标属性值的所有行的平均日志可能性,其中每个事例的日志可能性计算为 Log(ActualProbability/MarginalProbability)。 若要计算平均值,日志可能性值的总和除以输入数据集中的行数,不包括目标属性缺少值的行。 提升可以是负值或正值。 正值表示一个优于随机猜测的有效模型。 |
| 日志分数 | 离散属性。 可以指定目标值,但不是必需的。 | 每个事例的实际概率的日志,求和,然后除以输入数据集中的行数,不包括目标属性缺失值的行。 由于概率表示为十进制分数,因此日志分数始终为负数。 接近 0 的分数是更好的分数。 |
| 案例可能性 | 集群 | 所有事例的分类可能性分数的总和,除以分区中的事例数,不包括包含目标属性缺失值的行。 |
| 平均绝对误差 | 连续属性 | 分区中所有事例的绝对误差总和,除以分区中的事例数。 |
| 根平均平方误差 | 连续属性 | 分区的平均平方误差的平方根。 |
| 均方根误差 | 离散属性。 可以指定目标值,但不是必需的。 | 概率分数补数的平方的平方根,除以分区中的事例数,不包括目标属性缺失值的行。 |
| 均方根误差 | 离散属性,未指定目标。 | 概率分数补数的平方的平方根,除以分区中的事例数,不包括目标属性缺失值的事例。 |