比较预测模型的预测(数据挖掘中级教程)

在本教程前面步骤中,已经创建了以下三个模型:

  • 区域和型号的每个组合的预测,只基于单个型号和区域的数据。

  • 在全球范围对所有型号的预测,基于聚合数据。

  • 在北美区域对 M200 型号的预测,基于聚合模型。

在最后这个任务中,您将比较每个型号的预测,了解使用通用模型如何影响结果。

比较预测结果

您对原始挖掘模型的结果分析揭示在某些区域和型号系列上出现较大的差异。M200 型号的趋势线特别高,而 T1000 型号的趋势线较低且相对平坦。

预测 M200 和 T1000 数量的序列预测 M200 和 T1000 数量的序列

可以通过将结果和原始数据导出到 Microsoft Excel 中来创建包括所有预测的图表。Microsoft Excel 提供了更加复杂的工具,可对多个数据序列进行绘图和管理。下图显示了 M200 产品型号的趋势线,并将第一个挖掘模型的预测与使用聚合挖掘模型的预测进行比较。

用于比较预测的 Excel 图表用于比较预测的 Excel 图表

从前面的图中您可以看到,聚合挖掘模型在使得各个数据系列中的波动尽量最小的同时保持整体趋势。下表提供了用于创建图表的部分数据序列,可以进行比较。

序列和挖掘模型

7/25/2008

8/25/2008

9/25/2008

10/25/2008

11/25/2008

M200 Europe — 聚合

143

126

115

119

94

M200 Europe — 特定

121

142

152

149

154

M200 North America — 聚合

208

150

149

151

172

M200 North America — 特定

163

178

156

173

203

M200 Pacific — 聚合

89

80

71

77

57

M200 Pacific — 特定

46

44

42

42

38

T1000 Europe — 聚合

65

51

54

53

48

T1000 Europe — 特定

42

41

43

42

43

T1000 North America — 聚合

103

84

79

85

68

T1000 North America — 特定

82

78

78

83

83

T1000 Pacific — 聚合

68

52

48

56

44

T1000 Pacific — 特定

38

39

37

38

36

结论

您已经学习了如何创建可用于预测的时序模型,以及可以应用于不同数据序列的通用模型。