第 4 课:使用 DMX 创建时序预测

在本课和下一课中,你将使用 DMX) (数据挖掘扩展插件,根据你在 第 1 课:创建时序挖掘模型和挖掘结构 以及 第 2 课:将挖掘模型添加到时序挖掘结构中创建的时序模型创建不同类型的预测。

使用时序模型,可以通过许多选项来进行预测:

  • 使用挖掘模型中现有的模式和数据

  • 使用挖掘模型中的现有模式但提供新数据

  • 在模型中添加新数据或者更新模型。

下面概述了进行这些类型的预测所需的语法:

默认的序列预测
使用 PredictTimeSeries (DMX) 从已训练的挖掘模型返回指定数量的预测。

有关示例,请参阅 PredictTimeSeries (DMX) 时序模型查询示例

EXTEND_MODEL_CASES
PredictTimeSeries (DMX) 与 EXTEND_MODEL_CASES 参数结合使用,以添加新数据、扩展序列,并根据更新的挖掘模型创建预测。

本教程包含有关如何使用 EXTEND_MODEL_CASES 的示例。

REPLACE_MODEL_CASES
使用 PredictTimeSeries (具有 REPLACE_MODEL_CASES 参数的 DMX) ,将原始数据替换为新的数据系列,然后基于将挖掘模型中的模式应用于新数据系列来创建预测。

有关如何使用 REPLACE_MODEL_CASES 的示例,请参阅 第 2 课:生成预测方案 (中间数据挖掘教程)

课程任务

在本课中,你将执行以下任务:

  • 创建一个查询,基于现有数据获得默认预测。

在下一课中,您将执行下列相关任务:

  • 创建一个查询,提供新数据并获得更新的预测。

除了使用 DMX 手动创建查询外,还可以使用 SQL Server Data Tools (SSDT) 中的预测查询生成器来创建预测。

简单的时序预测查询

第一步是结合使用 SELECT FROM 语句和 PredictTimeSeries 函数来创建时序预测。 时序模型支持一种简化的预测创建语法:您不必提供任何输入,而只需指定要创建的预测数。 下面是将您使用的语句的一般示例:

SELECT <select list>   
FROM [<mining model name>]   
WHERE [<criteria>]  

选择列表可以包含模型中的列,例如要为其创建预测的产品系列的名称,也可以包含预测函数,例如 Lag (DMX) PredictTimeSeries (DMX) ,它们专用于时序挖掘模型。

创建简单的时序预测查询

  1. “对象资源管理器”中,右键单击 Analysis Services 实例,指向“新建查询”,然后单击“DMX”。

    将打开查询编辑器,其中包含一个新的空白查询。

  2. 将该语句的一般示例复制到空白查询中。

  3. <select list>   
    

    替换为:

    [Forecasting_MIXED].[ModelRegion],  
    PredictTimeSeries([Forecasting_MIXED].[Quantity],6) AS PredictQty,  
    PredictTimeSeries ([Forecasting_MIXED].[Amount],6) AS PredictAmt  
    

    第一行从挖掘模型中检索用来标识序列的值。

    第二行和第三行使用 PredictTimeSeries 函数。 每一行都预测一个不同的属性([Quantity][Amount])。 可预测属性名称后面的数字指定要预测的时间步长量。

    AS 子句用于为每个预测函数返回的列提供名称。 如果您不提供别名,则默认情况下将返回这两列,标签为 Expression

  4. [<mining model>]   
    

    替换为:

    [Forecasting_MIXED]  
    
  5. WHERE [criteria>]   
    

    替换为:

    WHERE [ModelRegion] = 'M200 Europe' OR  
    [ModelRegion] = 'M200 Pacific'  
    

    现在,完整的语句应该如下所示:

    SELECT  
    [Forecasting_MIXED].[ModelRegion],  
    PredictTimeSeries([Forecasting_MIXED].[Quantity],6) AS PredictQty,  
    PredictTimeSeries ([Forecasting_MIXED].[Amount],6) AS PredictAmt  
    FROM   
    [Forecasting_MIXED]  
    WHERE [ModelRegion] = 'M200 Europe' OR  
    [ModelRegion] = 'M200 Pacific'  
    
  6. 在“ 文件 ”菜单上,单击“ 将 DMXQuery1.dmx 另存为”。

  7. 在“ 另存为 ”对话框中,浏览到相应的文件夹,并将文件 SimpleTimeSeriesPrediction.dmx命名为 。

  8. 在工具栏上,单击“ 执行 ”按钮。

    该查询将针对在 WHERE 子句中指定的产品和地区的每个组合(共两个组合)返回 6 个预测。

在下一课中,您将创建一个为模型提供新数据的查询,并将该预测的结果与刚创建的预测进行比较。

课程中的下一个任务

第 5 课:扩展时序模型

另请参阅

PredictTimeSeries (DMX)
Lag (DMX)
时序模型查询示例
第 2 课:生成预测方案(数据挖掘中级教程)