Поделиться через


Сравнение прогнозов моделей прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

 

Применимо к: SQL Server 2016 Preview

В предыдущих шагах этого учебника было создано несколько моделей временных рядов:

  • прогнозы для каждого сочетания региона и модели, основанные только на данных по конкретной модели и региону;

  • прогнозы для каждого региона на основе обновленных данных.

  • глобальные прогнозы для всех моделей, основанные на статистических данных;

  • прогнозы для модели M200 в Североамериканском регионе, основанные на статической модели.

Чтобы резюмировать функции для прогнозов временных рядов, будут рассмотрены изменения, показывающие, как параметры расширения или замены данных повлияли на результаты прогнозов.

EXTEND_MODEL_CASES

REPLACE_MODEL_CASES

Сравнение исходных результатов с результатами после добавления данных

Чтобы увидеть, как обновление модели с помощью новых данных повлияло на результаты, рассмотрим данные по серии продукта М200 в Тихоокеанском регионе. Помните, что ряд исходных данных закончился в июне 2004 г., а новые данные были получены за июль, август и сентябрь.

  • Первый столбец содержит новые добавленные данные.

  • Второй столбец содержит прогноз на июль и далее на основе рядов исходных данных.

  • Третий столбец содержит прогноз на основе расширенных данных.

M200 Pacific Обновленные данные по фактическим продажам Прогноз до добавления данных Расширенный прогноз
7-25-2008 65 32 65
8-25-2008 54 37 54
9-25-2008 61 32 61
10-25-2008 Нет данных 36 32
11-25-2008 Нет данных 31 41
12-25-2008 Нет данных 34 32

Обратите внимание, что прогноз с использованием расширенных данных (показаны полужирным шрифтом) в точности повторяет точки фактических данных. Это намеренное повторение. Если есть точки фактических данных, прогнозирующий запрос возвращает фактические значения, а новые значения прогноза появляются только после того, как точки фактических данных закончились.

В целом, этот алгоритм взвешивает изменения в новых данных более основательно, чем данные в начале модели. Однако в данном случае новые цифры по продажам представляют собой прирост 20–30 % относительно предыдущего периода, поэтому это привело лишь к незначительному повышению запланированных продаж, после чего линия прогнозируемого тренда снова уходит вниз, что соответствует тренду по месяцам до получения новых данных.

Сравнение исходных результатов с результатами перекрестного прогнозирования

Следует помнить, что исходная модель интеллектуального анализа данных показала значительные отличия между регионами и линейками продукции. Например, был показан очень сильный тренд продаж для модели M200, тогда как продажи модели T1000 были относительно низки для всех регионов. Более того, некоторые ряды не имели достаточного количества данных. Ряды были прерывистыми, т. е. имели разные начальные точки.

Прогнозируемые серии количества M200 и T1000

Каким же образом изменились прогнозы после того, как они были основаны на общей модели, которая основывалась на продажах во всем мире, а не на исходных наборах данных? Чтобы убедиться, что не были потеряны какие-либо данные и что прогнозы являются точными, можно сохранить результаты в таблицу, присоединить таблицу прогнозов к таблице исторических данных, а затем создать график двух наборов исторических данных и прогнозов.

Следующая диаграмма основывается на одной линейке продукции M200. График сравнивает прогноз исходной модели интеллектуального анализа данных с прогнозом с помощью агрегированной модели интеллектуального анализа данных.

Диаграмма Excel сравнения прогнозов

Из этой диаграммы можно сделать вывод, что агрегированная модель интеллектуального анализа данных сохраняет общий диапазон и тренды в значениях, сглаживая при этом колебания отдельных рядов данных.

Заключение

Было изучено создание и настройка модели временных рядов, которая может быть использована для прогнозирования.

Было изучено обновление моделей временных рядов без их повторной обработки, путем добавления новых данных и создания прогнозов с помощью параметра EXTEND_MODEL_CASES.

Было изучено создание моделей, которые можно использовать для перекрестного прогнозирования, используя параметр REPLACE_MODEL_CASES и применяя модель к другому ряду данных.

См. также:

Учебник по интеллектуальному анализу данных — средний ( Службы Analysis Services — Интеллектуальный анализ данных )
Примеры запросов моделей временных рядов