散点图(Analysis Services - 数据挖掘)

如果选择除时序模型以外的任何包含连续可预测属性的模型,则**“提升图”**选项卡中会自动显示“散点图”。散点图以图形方式对照显示数据中的实际值与模型预测的值。其沿 X 轴显示实际值,沿 Y 轴显示预测值。该图还显示一条显示完美预测的线,在这条线上预测值和实际值完全匹配。某个点与该条理想 45 度角线的距离指示进行的预测的准确程度。

本节讲述如何创建散点图以及如何解释相关结果。

注意注意

只有包含连续可预测属性的挖掘模型才可在散点图中查看。

应用场景

例如,考虑下面这个模型:Adventure Works Cycles 公司的市场部根据其在促销电子邮件中发送的链接的点击数来预测日销售额。由于点击数和销售额均为连续数值,因此,可以以图形方式将点击数显示为独立变量,将销售额显示为依赖变量。这样,图中的直线显示预期线性关系,而散布在该直线周围的点显示实际数据偏离预期值的程度。一目了然,该分析指出一组结果与某个特定输入相关联的紧密程度,以及所生成的模型与理想模型之间有多大差异

了解散点图

下面的关系图显示散点图的一个示例,该图是为刚刚说明的应用场景而创建的。

线性回归的散点图示例

将鼠标悬停在散布在该直线周围的任一点上方即可在工具提示中查看预测值和实际值。散点图没有**“挖掘图例”**,但该图表本身包含一个显示与该模型关联的分数的图例。有关解释该分数的详细信息,请参阅线性回归模型的挖掘模型内容(Analysis Services - 数据挖掘)

可以将该图表的可视表示复制到剪贴板,但无法复制基础数据或公式。如果希望查看对应于此条线的回归公式,则可以对该模型创建内容查询。有关详细信息,请参阅查询线性回归模型(Analysis Services - 数据挖掘)

创建散点图

若要创建散点图,请按照以下步骤操作:

  1. 在数据挖掘设计器的**“挖掘准确性图表”中,单击“输入选择”**选项卡。

  2. 在**“输入选择”**选项卡中,选择一个要评估的模型。该模型必须包含一个连续数值数据类型的可预测属性。

  3. 选择该可预测属性。

  4. 选择评估中要使用的数据集。

  5. 还可对该数据集应用筛选器。

  6. 单击**“提升图”**选项卡,自动生成散点图报表。

有关适用于所有图表类型的分步过程,请参阅如何为挖掘模型创建准确性图表