Поделиться через


Сравнение прогнозов моделей прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

В предыдущих шагах этого занятия были созданы три следующие модели:

  • прогнозы для каждого сочетания региона и модели, основанные только на данных по конкретной модели и региону;

  • глобальные прогнозы для всех моделей, основанные на статистических данных;

  • прогнозы для модели M200 в Североамериканском регионе, основанные на статической модели.

В этой последней задаче будет выполнено сравнение прогнозов для каждой модели, чтобы оценить, как использование обобщенных моделей влияет на результаты.

Сравнение результатов прогнозов

Анализ результатов исходной модели интеллектуального анализа данных показал значительный разрыв между некоторыми регионами и линейками моделей. Линия тренда для модели M200 имела значительный подъем, в то время как линии трендов для модели T1000 снижались и были достаточно пологими.

Ряд, прогнозирующий количество M200 и T1000Ряд, прогнозирующий количество M200 и T1000

Можно создать диаграмму, которая включает в себя все прогнозы, путем экспортирования результатов и исходных данных в приложение Microsoft Excel, которое предоставляет больше сложных средств для вывода графиков и работы с несколькими рядами данных. На следующей диаграмме показаны линии трендов только для моделей продуктов M200 и выполнено сравнение прогнозов первой модели интеллектуального анализа данных с прогнозами, полученными с использованием статической модели.

Диаграмма Excel сравнения прогнозовДиаграмма Excel сравнения прогнозов

Из предыдущей диаграммы можно сделать вывод, что агрегированная модель интеллектуального анализа данных сохраняет общие тренды, сглаживая при этом колебания отдельных рядов данных. С целью упрощения сравнения в следующей таблице содержится часть рядов данных, используемых для создания диаграммы.

Ряды и модели интеллектуального анализа данных

7/25/2008

8/25/2008

9/25/2008

10/25/2008

11/25/2008

Агрегированные данные по модели M200 в Европе

143

126

115

119

94

Конкретные данные по модели M200 в Европе

121

142

152

149

154

Статистические данные по модели M200 в Северной Америке

208

150

149

151

172

Индивидуальные данные по модели M200 в Северной Америке

163

178

156

173

203

Статистические данные по модели M200 в Тихоокеанском регионе

89

80

71

77

57

Индивидуальные данные по модели M200 в Тихоокеанском регионе

46

44

42

42

38

Статистические данные по модели T1000 в Европе

65

51

54

53

48

Индивидуальные данные по модели T1000 в Европе

42

41

43

42

43

Статистические данные по модели T1000 в Северной Америке

103

84

79

85

68

Индивидуальные данные по модели T1000 в Северной Америке

82

78

78

83

83

Статистические данные по модели T1000 в Тихоокеанском регионе

68

52

48

56

44

Индивидуальные данные по модели T1000 в Тихоокеанском регионе

38

39

37

38

36

Заключение

Было изучено создание модели временных рядов, которая может использоваться для прогнозирования, и обобщенной модели, которая может применяться к различным рядам данных.