Сравнение прогнозов моделей прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)
В предыдущих шагах этого занятия были созданы три следующие модели:
прогнозы для каждого сочетания региона и модели, основанные только на данных по конкретной модели и региону;
глобальные прогнозы для всех моделей, основанные на статистических данных;
прогнозы для модели M200 в Североамериканском регионе, основанные на статической модели.
В этой последней задаче будет выполнено сравнение прогнозов для каждой модели, чтобы оценить, как использование обобщенных моделей влияет на результаты.
Сравнение результатов прогнозов
Анализ результатов исходной модели интеллектуального анализа данных показал значительный разрыв между некоторыми регионами и линейками моделей. Линия тренда для модели M200 имела значительный подъем, в то время как линии трендов для модели T1000 снижались и были достаточно пологими.
Можно создать диаграмму, которая включает в себя все прогнозы, путем экспортирования результатов и исходных данных в приложение Microsoft Excel, которое предоставляет больше сложных средств для вывода графиков и работы с несколькими рядами данных. На следующей диаграмме показаны линии трендов только для моделей продуктов M200 и выполнено сравнение прогнозов первой модели интеллектуального анализа данных с прогнозами, полученными с использованием статической модели.
Из предыдущей диаграммы можно сделать вывод, что агрегированная модель интеллектуального анализа данных сохраняет общие тренды, сглаживая при этом колебания отдельных рядов данных. С целью упрощения сравнения в следующей таблице содержится часть рядов данных, используемых для создания диаграммы.
Ряды и модели интеллектуального анализа данных |
7/25/2008 |
8/25/2008 |
9/25/2008 |
10/25/2008 |
11/25/2008 |
---|---|---|---|---|---|
Агрегированные данные по модели M200 в Европе |
143 |
126 |
115 |
119 |
94 |
Конкретные данные по модели M200 в Европе |
121 |
142 |
152 |
149 |
154 |
Статистические данные по модели M200 в Северной Америке |
208 |
150 |
149 |
151 |
172 |
Индивидуальные данные по модели M200 в Северной Америке |
163 |
178 |
156 |
173 |
203 |
Статистические данные по модели M200 в Тихоокеанском регионе |
89 |
80 |
71 |
77 |
57 |
Индивидуальные данные по модели M200 в Тихоокеанском регионе |
46 |
44 |
42 |
42 |
38 |
Статистические данные по модели T1000 в Европе |
65 |
51 |
54 |
53 |
48 |
Индивидуальные данные по модели T1000 в Европе |
42 |
41 |
43 |
42 |
43 |
Статистические данные по модели T1000 в Северной Америке |
103 |
84 |
79 |
85 |
68 |
Индивидуальные данные по модели T1000 в Северной Америке |
82 |
78 |
78 |
83 |
83 |
Статистические данные по модели T1000 в Тихоокеанском регионе |
68 |
52 |
48 |
56 |
44 |
Индивидуальные данные по модели T1000 в Тихоокеанском регионе |
38 |
39 |
37 |
38 |
36 |
Заключение
Было изучено создание модели временных рядов, которая может использоваться для прогнозирования, и обобщенной модели, которая может применяться к различным рядам данных.