探索预测模型(中间数据挖掘教程)

生成预测挖掘模型后,可以使用数据挖掘设计器的 “挖掘模型查看器 ”选项卡浏览结果。 Microsoft时序查看器包含两个选项卡: 图表模型

此外,可以将Microsoft泛型树查看器用于所有模型。 每个视图在时序模型中显示信息略有不同。

“图表”选项卡

Microsoft时序查看器的 “图表 ”选项卡以图形方式显示每个系列,包括历史数据和预测。 时序图中的每个行都表示产品、区域和可预测属性的唯一组合。

查看器右侧的图例根据下拉列表中的选定内容列出可用的时序。 可以选择并清除图例中的复选框,以控制图形中显示的时序。

还可以更改显示选项,例如用于每个时间序列的颜色,或者值是否在图表中的某些点上显示。

选择时序

  1. 单击“挖掘模型查看器”选项卡的“图表”选项卡(如果它不可见)。

  2. 单击图表视图右侧的下拉列表,然后选择所有复选框。 单击 “确定”

    图表现在应包含 24 条不同的系列线。

  3. 在图表右侧的复选框中,清除框以暂时隐藏基于 Amount 的所有序列的线条。

    现在,清除与 R750 和 R250 自行车相关的复选框。

    图表现在只包含以下六条系列线,以便您可以更轻松地比较 M200 和 T1000 自行车的趋势。

    • M200 欧洲:数量

    • M200 北美:数量

    • M200 Pacific:数量

    • T1000 欧洲:数量

    • T1000 北美:数量

    • T1000 Pacific: Quantity

预测 M200 和 T1000 数量系列,

此查看器中显示的图表包括历史数据和预测数据。 预测数据被着色,以将其与历史数据区分开来。 若要更轻松地比较不同的系列,还可以更改与图形中每一行关联的颜色。 有关详细信息,请参阅 更改数据挖掘查看器中使用的颜色

从趋势线来看,可以看到所有区域的总销售额普遍增加,12 月每 12 个月达到峰值。 从图表中,还可以看到 T1000 自行车的数据比其他产品系列的数据晚得多。 这是因为它是一个较新的产品,但由于此系列基于的数据要少得多,因此预测可能不准确。

默认情况下,每个时序显示五个预测步骤,显示为虚线。 可以更改此值以查看更多或更少的预测。 还可以通过将误差线添加到图表来以图形方式查看预测的标准偏差。

更改图表视图中的预测和显示选项

  1. 尝试逐步更改 预测步骤 的值,将其从 5 增加到 10,然后返回 6

    当历史数据具有较大的波动时,随着预测数量的增加,波动往往重复甚至放大。 此时可能需要进行一些研究,以了解历史数据大幅增长的原因,然后决定是否接受这些结果,在源数据中寻求某种更正,或在模型中应用某种平滑。

  2. 选中“ 显示偏差 ”复选框。

    此选项显示每个预测值的估计错误。

  3. 请注意 X 轴的刻度。 对历史数据和预测数据所做的更改始终以百分比表示,但实际值会自动调整,以将所有值拟合到图形上。 因此,在比较模型时需要小心,而不依赖视觉对象。 若要获取确切值或预测的百分比增加和值,请将鼠标悬停在虚线或实线上,或单击这些线条以查看 挖掘图例中的值。

    提示:如果 挖掘图例 不可见,请切换到 模型 视图,右键单击任意节点,然后选择“ 显示图例”。

从查看这些趋势来看,你担心某些系列的数据不足,并想知道你是否可以通过按模型平均销售或按区域平均销售额获得更可靠的预测。 本教程后面的课程将探讨此方法。

返回顶部

“模型”选项卡

数据挖掘设计器中Microsoft时序查看器的 “模型 ”选项卡使你能够以树形图的形式查看预测模型。

首先,请注意,由于你的数据描述了三个不同区域(欧洲、北美和太平洋)中多个生产线(T1000 等)销售的两种不同的度量值(金额和数量),因此你生成的模型实际上包含 24 种不同的树,每个树表示不同区域、产品组合的销售模式的模型。 和可预测属性。

可以通过从“模型”选项卡上的“树”下拉列表中选择一个系列来选择要查看的生产线、区域和销售指标的组合。

那么,你可以从将模型作为树查看中学到什么? 例如,让我们比较两个模型,一个模型在树中具有多个级别,一个模型具有一个节点。

  • 当树形图包含单个节点时,这意味着模型中发现的趋势在一段时间内大多是同质的。 可以使用此标记为 “全部”的单个节点来查看描述输入变量与结果之间的关系的公式。

  • 当时序的树形图具有多个分支时,这意味着检测到的时序太复杂,无法表示为单个公式。 相反,树图可能包含多个分支,每个分支都标有导致树 拆分的条件。 当树拆分时,每个分支表示不同的时间段,其中趋势可以描述为单个公式。

    例如,如果查看图表图,并看到从 9 月某个时候开始的销售额突然跃升,并持续到年终假期,则可以切换到 模型 视图以查看趋势更改的确切日期。 树中表示“9月前”和“9月之后”的分支将包含不同的公式:一个公式以数学方式描述到拆分的销售趋势,另一个公式描述 9 月至年底假期的销售趋势。

探索时序模型的决策树

  1. 在查看器的“模型”选项卡上的“”列表中,选择“T1000 欧洲:金额”系列。

    单击标记为 “全部”的节点。

    对于所有节点,出现的工具提示信息包括整个序列中的案例数量,以及从数据分析中得出的时序方程。

  2. 如果 挖掘图例 不可见,请右键单击节点并选择“ 显示图例”。

    挖掘图例提供的信息与工具提示中的信息大致相同。 如果任一独立变量是离散的,则还会看到一个直方图,该直方图显示节点中变量的分布。

  3. 现在,选择要查看的其他时序。 使用查看器的“模型”选项卡上的“树”列表,选择“M200 北美:数量”系列。

    树图现在包含一个 “所有 ”节点和两个子节点。 通过查看子节点上的标签,可以了解趋势线的更改点。

    对于每个子节点,树的每个分支中的案例数量也在 挖掘图例 中进行了说明。

以下列表描述了树查看器中的一些其他功能:

  • 可以使用 背景 控件更改图表中表示的变量。 默认情况下,较暗的节点包含更多案例,因为 背景 值设置为 人口。 若要查看节点中有多少事例,请在节点上暂停鼠标并查看出现的工具提示,或单击节点并在 “节点图例 ”窗口中查看数字。

  • 也可以在工具提示中或通过单击节点来查看节点的回归公式。 如果已创建混合模型,可以看到两个公式,一个用于 ARTXP(在叶节点中),另一个用于 ARIMA(在树的根节点中)。

  • 小钻石用于表示连续数字的节点。 属性的范围显示在菱形所在的条上。 菱形以节点的平均值为中心,菱形的宽度表示该节点的属性的方差。

返回顶部

(可选)泛型内容树查看器

除了时序的自定义查看器外,Analysis Services 还提供 MicrosoftGeneric 内容树查看器 ,用于所有数据挖掘模型。 此查看器提供一些优势:

  • Microsoft时序查看器:此视图合并两种算法的结果。 虽然可以单独查看每个序列,但无法确定如何组合每个算法的结果。 此外,在此视图中,工具提示和数据挖掘图例仅显示最重要的统计信息。

  • 泛型内容树查看器:允许浏览和查看一次在模型中使用的所有数据系列,如果已创建混合模型,ARIMA 和 ARTXP 树将显示在同一图形中。

    可以使用此查看器从这两种算法以及值的分布中获取所有统计信息。

    建议数据挖掘领域的专家用户了解更多关于 ARIMA 和 ARTXP 分析的内容。

查看泛型内容查看器中特定数据系列的详细信息

  1. “挖掘模型查看器”选项卡中,从查看器下拉列表中选择Microsoft一般内容树查看器

  2. “节点标题 ”窗格中,单击最顶部的(全部)节点。

  3. “节点详细信息 ”窗格中,查看ATTRIBUTE_NAME的值。

    此值显示此节点中包含哪个系列或产品和区域的组合。 在 AdventureWorks 示例中,位于最顶层的节点是欧洲的 M200 系列。

  4. “节点标题 ”窗格中,找到具有子节点的第一个节点。

    如果序列节点具有子级,则显示在Microsoft时序查看器的 “模型 ”选项卡上的树视图也将具有分支结构。

  5. 展开节点并单击其中一个子节点。

    架构的NODE_DESCRIPTION列包含导致树拆分的条件。

  6. “节点标题 ”窗格中,单击最顶层的 ARIMA 节点,然后展开节点,直到所有子节点都可见。

  7. “节点详细信息 ”窗格中,查看ATTRIBUTE_NAME的值。

    此值指示此节点中包含哪个时序。 ARIMA 节中最顶层的节点应与 (All) 节中最顶层的节点匹配。 在 AdventureWorks 示例中,此节点包含系列 M200 Europe 的 ARIMA 分析。

有关详细信息,请参阅时序模型的挖掘模型内容(Analysis Services - 数据挖掘)。

返回顶部

课程中的下一个任务

创建时序预测 (中间数据挖掘教程)

另请参阅

时序模型查询示例
Microsoft时序算法技术参考