浏览预测模型(数据挖掘中级教程)

既然您已经生成了预测挖掘模型,就可以使用数据挖掘设计器的**“挖掘模型查看器”选项卡来浏览结果。 Microsoft 时序查看器包含两个选项卡:“图表”“模型”**。

此外,您可以对所有模型使用 Microsoft 一般内容树查看器。 每个视图都显示时序模型中稍有不同的信息概览。

  • “图表”选项卡

  • “模型”选项卡

  • Microsoft 一般内容查看器

“图表”选项卡

Microsoft 时序查看器的**“图表”**选项卡以图形方式显示各个序列,包括历史数据和预测。 时序图中的每条线都代表产品、区域和可预测属性的一种唯一组合。

该查看器右侧的图例列出根据下拉列表中的所选内容提供的时序。 您可以选中和清除图例中的复选框,以便控制图形中显示的时序。

还可以更改显示选项,例如用于每个时序的颜色或是否在图表中的点显示值。

选择时序

  1. 单击**“挖掘模型查看器”选项卡的“图表”**选项卡(如果它不可见)。

  2. 单击图表视图右侧的下拉列表,选中所有复选框。 单击“确定”。

    图表现在应包含 24 条不同的序列线。

  3. 在图表右侧的复选框中取消选中相应的框,以临时隐藏基于 Amount 的所有序列线。

    然后,取消选中与 R750 和 R250 自行车有关的复选框。

    现在,图表仅包含以下 6 条序列线,因此您可以更方便地比较 M200 和 T1000 自行车的趋势。

    • M200 Europe: Quantity

    • M200 North America:Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

预测 M200 和 T1000 数量的序列

在此查看器中显示的图表包括历史数据和预测数据。 预测数据带有底纹,以便与历史数据区分开。 为了方便比较不同的序列,您还可以更改与图形中每条线关联的颜色。 有关详细信息,请参阅更改数据挖掘查看器中使用的颜色

从趋势线可以看出:所有区域的总销售额在普遍增长,并且每 12 个月(在 12 月)出现一次峰值。 通过图表,您还可以发现 T1000 自行车数据的开始时间比其他产品序列数据的开始时间晚得多。 这是因为这是一个较新的产品,但由于此序列基于的数据要少得多,预测的准确性可能相对较低。

默认情况下,将为每个时序显示以虚线表示的五个预测步骤。 您可以更改此值以查看更多或更少的预测。 还可以通过向图表添加误差线来以图形方式查看预测的标准偏差。

更改“图表”视图中的预测和显示选项

  1. 试着逐渐更改**“预测步骤”**的值,将其从 5 增加到 10,再减至 6

    如果历史数据具有较大波动,则随着您增大预测次数,波动会重复出现甚至被放大。 此时您可能需要进行一些研究,了解历史数据出现较大增长的原因,然后决定是否接受这些结果,尝试在源数据中进行某种更正,或是对模型应用某种平滑处理。

  2. 选中**“显示偏差”**复选框。

    此选项显示每个预测值的预估误差。

  3. 请注意 X 轴的刻度。 历史和预测数据的更改始终表示为百分比,但实际值将被自动调整,以便所有值都能显示在图形中。 因此,在比较模型时务须小心,不要仅依赖于可见值。 若要获取精确值或是预测的百分比增长和预测值,请将鼠标悬停在虚线或实线上方,或单击这些线以查看**“挖掘图例”**中的值。

    提示:如果未显示**“挖掘图例”,请切换到“模型”视图,右键单击任意节点,然后选择“显示图例”**。

通过观察这些趋势,您会担心某些序列缺少数据,并想知道是否可以通过按模型(或者可能按地区)计算销售额的平均值来获取更可靠的预测。 本教程后面的课程中将探讨这种方法。

返回页首

“模型”选项卡

通过数据挖掘设计器中的 Microsoft 时序查看器的**“模型”**选项卡,您能够以树形图的方式查看预测模型。

首先请注意,由于您的数据描述三个不同地区(欧洲、北美和太平洋地区)多个产品系列销售情况的两个不同的度量值(“金额”和“数量”),您所构建的模型实际包含 24 个不同的树,每个树表示由不同的地区、产品和可预测属性组合而成的销售模式的一个模型。

通过从**“模型”选项卡上的“树”**下拉列表中选择一个序列,您可以选择要查看的产品系列、地区和销售量度的组合。

那么,您可以从查看树形模型中学习到什么? 让我们通过比较两个模型来举例说明,一个模型具有多个树级别,另一个模型只有一个节点。

  • 当树形图包含单个节点时,这表示在模型中发现的趋势基本上随时间发生同质变化。 您可以使用这一单个节点(标为**“全部”**)来查看描述输入变量和结果之间关系的公式。

  • 如果某一时序的树形图包含多个分支,这表示检测到的时序太过复杂,无法表示为单个公式。 于是,树形图可能包含多个分支,每个分支标记有导致树“拆分”的条件。 当树拆分时,每个分支表示不同的时间段,这些时间段内的趋势可描述为单个公式。

    例如,如果通过观察图表发现销售量在九月的某个时间开始激增,且一直持续到年底假期,那么您可以切换到**“模型”**视图,查看趋势发生变化的确切日期。 树中表示为“九月前”和“九月后”的分支将包含不同的公式:一个公式用算术方法描述截至拆分时的销售趋势,另一个公式描述从九月开始一直到年底假期的销售趋势。

浏览时序模型的决策树

  1. 在该查看器的**“模型”选项卡的“树”**列表中,选择 T1000 Europe: Amount 序列。

    单击标为**“全部”**的节点。

    对于**“全部”**节点,显示的工具提示包括诸如整个序列中事例的数目、从数据分析派生的时序公式等信息。

  2. 如果未显示**“挖掘图例”,请右键单击该节点,然后选择“显示图例”**。

    **“挖掘图例”**提供的信息大多与工具提示信息相同。 如有任何自变量为离散变量,您还会看到一个直方图,其中显示变量在节点中的分布。

  3. 现在选择其他要查看的时序。 使用该查看器的**“模型”选项卡的“树”**列表,选择 M200 North America: Amount 序列。

    树图形现在包含一个**“全部”**节点和两个子节点。 通过观察子节点上的标签,您可以发现趋势线在哪一点上发生了变化。

    对于每个子节点,**“挖掘图例”**中的描述还包括每个树分支中的事例计数。

下面的列表描述了树查看器中的其他一些功能:

  • 您可以使用**“背景”控件更改图表中表示的变量。 默认情况下,较暗的节点包含更多的事例,因为“背景”的值设置为“总体”。 若只是查看节点中包含的事例数,请将鼠标悬停在节点上方并查看出现的工具提示,或单击该节点并查看“节点图例”**窗口中的数值。

  • 还可以在工具提示中(或通过单击该节点)查看该节点的回归公式。 如果创建了混合模型,则会看到两个公式:一个用于 ARTXP(在叶节点中),一个用于 ARIMA(在树的根节点中)。

  • 节点中使用多个小菱形来表示连续数值。 菱形所在的条形中会显示属性的范围。 菱形在节点均值处居中显示,其宽度表示该节点处属性的方差。

返回页首

(可选)一般内容树查看器

除了时序的自定义查看器外,Analysis Services 还提供了**“Microsoft** 一般内容树查看器”,可用于所有数据挖掘模型。 此查看器具有以下优点:

  • Microsoft 时序查看器:此视图合并了两种算法的结果。 尽管您可以分别查看每个序列,但您无法确定每种算法的结果是如何合并的。 此外,在此视图中,工具提示和挖掘图例只显示最重要的统计数据。

  • 一般内容树查看器:使您能够同时浏览和查看模型中使用的所有数据序列;如果创建了混合模型,同一个图形中可同时显示 ARIMA 树和 ARTXP 树。

    您可以使用此查看器获取两种算法的所有统计数据以及这些值的分布。

    对于要深入了解 ARIMA 和 ARTXP 分析结果的数据挖掘专家级用户,推荐使用此查看器。

在一般内容查看器中查看特定数据序列的详细信息

  1. 在**“挖掘模型查看器”选项卡中,从“查看器”下拉列表中选择“Microsoft 一般内容树查看器”**。

  2. 在**“节点标题”**窗格中,单击最顶部的“(全部)”节点。

  3. 在**“节点详细信息”**窗格中,查看 ATTRIBUTE_NAME 的值。

    此值会显示该节点中包含哪个序列或产品和区域的哪个组合。 在 AdventureWorks 示例中,最顶部的节点是 M200 Europe 序列的节点。

  4. 在**“节点标题”**窗格中,定位到具有子节点的第一个节点上。

    如果某个序列节点有子级,则 Microsoft 时序查看器的**“模型”**选项卡上出现的树视图也将有一个分支结构。

  5. 展开该节点,然后单击某个子节点。

    架构的 NODE_DESCRIPTION 列包含导致树拆分的条件。

  6. 在**“节点标题”**窗格中,单击最顶部的 ARIMA 节点,然后展开该节点直到所有子节点全部显示。

  7. 在**“节点详细信息”**窗格中,查看 ATTRIBUTE_NAME 的值。

    此值会指出该节点中包含哪个时序。 ARIMA 部分中最顶部的节点应该与(“全部”)部分中最顶部的节点相匹配。 在 AdventureWorks 示例中,该节点包含序列 M200 Europe 的 ARIMA 分析。

有关详细信息,请参阅时序模型的挖掘模型内容(Analysis Services - 数据挖掘)

返回页首

课程中的下一个任务

创建时序预测(数据挖掘中级教程)

请参阅

参考

Microsoft 时序算法技术参考

概念

时序模型查询示例