比较预测模型的预测(数据挖掘中级教程)
在本教程前面步骤中,已经创建了以下三个模型:
区域和型号的每个组合的预测,只基于单个型号和区域的数据。
在全球范围对所有型号的预测,基于聚合数据。
在北美区域对 M200 型号的预测,基于聚合模型。
在最后这个任务中,您将比较每个型号的预测,了解使用通用模型如何影响结果。
比较预测结果
您对原始挖掘模型的结果分析揭示在某些区域和型号系列上出现较大的差异。M200 型号的趋势线特别高,而 T1000 型号的趋势线较低且相对平坦。
可以通过将结果和原始数据导出到 Microsoft Excel 中来创建包括所有预测的图表。Microsoft Excel 提供了更加复杂的工具,可对多个数据序列进行绘图和管理。下图显示了 M200 产品型号的趋势线,并将第一个挖掘模型的预测与使用聚合挖掘模型的预测进行比较。
从前面的图中您可以看到,聚合挖掘模型在使得各个数据系列中的波动尽量最小的同时保持整体趋势。下表提供了用于创建图表的部分数据序列,可以进行比较。
序列和挖掘模型 |
7/25/2008 |
8/25/2008 |
9/25/2008 |
10/25/2008 |
11/25/2008 |
---|---|---|---|---|---|
M200 Europe — 聚合 |
143 |
126 |
115 |
119 |
94 |
M200 Europe — 特定 |
121 |
142 |
152 |
149 |
154 |
M200 North America — 聚合 |
208 |
150 |
149 |
151 |
172 |
M200 North America — 特定 |
163 |
178 |
156 |
173 |
203 |
M200 Pacific — 聚合 |
89 |
80 |
71 |
77 |
57 |
M200 Pacific — 特定 |
46 |
44 |
42 |
42 |
38 |
T1000 Europe — 聚合 |
65 |
51 |
54 |
53 |
48 |
T1000 Europe — 特定 |
42 |
41 |
43 |
42 |
43 |
T1000 North America — 聚合 |
103 |
84 |
79 |
85 |
68 |
T1000 North America — 特定 |
82 |
78 |
78 |
83 |
83 |
T1000 Pacific — 聚合 |
68 |
52 |
48 |
56 |
44 |
T1000 Pacific — 特定 |
38 |
39 |
37 |
38 |
36 |
结论
您已经学习了如何创建可用于预测的时序模型,以及可以应用于不同数据序列的通用模型。