模型准确性图表工具(Analysis Services - 数据挖掘)

**“挖掘准确性图表”**选项卡(可在 SQL Server Management Studio 和 Business Intelligence Development Studio 中访问)提供了多个用于验证挖掘模型的工具:

  • “提升图”、“利润图”和“散点图”都可以在**“提升图”选项卡中查看。使用“输入选择”选项卡选择模型并设置选项,然后单击“提升图”选项卡并从“图表类型”**列表中选择所需的图表类型。如果模型表示线性回归,则会自动显示散点图。

  • “分类矩阵”(有时也称为“混淆表”)可在**“输入选择”选项卡中配置,然后显示在“分类矩阵”**选项卡中。

  • “交叉验证”报表可以在**“挖掘准确性图表”选项卡的“交叉验证”**选项卡中进行配置和查看。

    注意注意

    “挖掘准确性图表”选项卡不能用于时序模型。

提升图

提升图根据测试数据集中存在的可预测列的已知值绘制从该测试数据集进行的预测查询的结果。该图表显示挖掘模型的结果,同时还显示理想模型将产生的结果以及随机推测结果的表示。对随机线的任何改进均称为“提升”。模型演示的提升越多,模型也就越有效。在提升图中只能比较包含可预测离散属性的挖掘模型。

可以通过使用**“输入选择”选项卡配置目标模型并选择测试数据集来创建提升图。然后,单击“提升图”**选项卡查看完成的图表。

有关详细信息,请参阅:提升图(Analysis Services - 数据挖掘)“挖掘准确性图表”选项卡的操作指南主题模型准确性图表工具(Analysis Services - 数据挖掘)

利润图

利润图是提升图的变体,该图整合有关使用模型所生成预测的企业成本的信息。输入与成本相关的事实数据(如发送邮件的费用)后,Analysis Services 将显示一条显示模型所提供提升的曲线,并且还计算使用模型时的投资回报。

可以通过使用**“输入选择”选项卡配置目标模型并选择测试数据集来创建利润图。然后,单击“提升图”选项卡并从“图表类型”列表中选择“利润图”。随即会自动打开“利润图设置”对话框。配置完利润图特有的参数后,“挖掘准确性图表”**选项卡中显示的图表会自动改为显示每单位的利润和亏损。

有关详细信息,请参阅:利润图(Analysis Services - 数据挖掘), “利润图设置”对话框(“挖掘准确性图表”视图)

散点图

散点图通过将每个事例的实际值与预测值进行比较来图示预测连续属性的模型的准确性。只要可预测属性具有连续值,就可以生成散点图,而不是提升图。

如果模型支持所需的可预测列和输入列,则可以在数据挖掘设计器的**“挖掘准确性图表”选项卡上创建散点图。首先,使用“输入选择”选项卡配置目标模型并选择测试数据集。然后,单击“提升图”选项卡。“挖掘准确性图表”**选项卡中显示的图表会自动改为显示呈现输入值和预测值之间的线性关系的图形。

有关详细信息,请参阅:散点图(Analysis Services - 数据挖掘)

分类矩阵

分类矩阵是另一种检查结构中挖掘模型创建预测的准确度的方法。若要生成分类矩阵,Analysis Services 需要使用测试数据集中的实际值来统计好预测和坏预测的数目。该矩阵是一个重要的工具,因为它不仅可显示模型正确预测某个值的频率,而且还显示模型预测错的值。分类矩阵显示每个可预测属性的真正、假正、真负和假负的实际计数。

可以在数据挖掘设计器的**“挖掘准确性图表”选项卡中创建分类矩阵。首先,使用“输入选择”选项卡配置目标模型并选择测试数据集。然后,单击“分类矩阵”**选项卡。随即自动显示该图表,无需再进行任何其他配置。

有关详细信息,请参阅:分类矩阵(Analysis Services - 数据挖掘)“挖掘准确性图表”选项卡的操作指南主题模型准确性图表工具(Analysis Services - 数据挖掘)

交叉验证报表

交叉验证是一种高级数据挖掘技术,有助于度量模型的有效性。创建交叉验证报表时,Analysis Services 将数据集划分为多个交叉部分,在子集上自动创建多个模型并将其定型,然后计算所有模型的准确性。通过查看生成的统计信息,您可以评估模型在不同数据集之间的通用化程度或确定结构上哪个模型的性能最佳。

可以在数据挖掘设计器的**“挖掘准确性图表”选项卡中创建交叉验证报表,方法是:选择一个模型或结构,然后使用“交叉验证”**选项卡来设置折叠数、目标属性等选项。

有关详细信息,请参阅:交叉验证(Analysis Services – 数据挖掘), 交叉验证报表(Analysis Services - 数据挖掘)