Поделиться через


Настройка и обработка модели прогнозирования (учебник по интеллектуальному анализу данных — средний уровень)

Алгоритм временных рядов (Майкрософт) предоставляет параметры, которые влияют на способ создания модели и методы анализа временных данных. С помощью этих свойств можно управлять методами прогнозирования, применяемыми моделью интеллектуального анализа данных.

Для этой задачи учебника в параметрах будет сделано следующее изменение.

  • Будет скорректировано значение параметра PERIODICITY_HINT для модели Прогнозирование. В этом параметре алгоритму передаются сведения о том, как часто повторяются данные. Данные в хранилище AdventureWorks DW2008 упорядочены помесячно с периодичностью на уровне года. Поэтому в качестве значения параметра PERIODICITY_HINT следует указать 12, что означает повторение шаблона через каждые 12 значений.

Будут просмотрены настройки двух важных параметров, которые были представлены в SQL Server 2008 как часть улучшений алгоритма временных рядов (Майкрософт).

  • Параметр FORECAST_METHOD управляет оптимизацией алгоритма временных рядов для краткосрочных или долгосрочных прогнозов. По умолчанию параметр FORECAST_METHOD имеет значение MIXED. Это означает, что два разных алгоритма прогнозирования объединены и сбалансированы для выполнения как краткосрочных, так и долгосрочных прогнозов.

  • Параметр PREDICTION_SMOOTHING управляет соотношением краткосрочных и долгосрочных прогнозов. По умолчанию он имеет параметр 0,5, что обычно обеспечивает наилучший баланс для общей точности.

После выполнения изменений будет выполнена обработка модели.

Изменение параметров алгоритма

  1. На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши Прогнозирование и выберите команду Задать параметры алгоритма.

  2. В строке PERIODICITY_HINT диалогового окна Параметры алгоритма щелкните столбец Значение, затем введите {12}, включая фигурные скобки.

  3. Убедитесь, что текстовое поле Значение в строке FORECAST_METHOD пусто или равно MIXED. Если задано иное значение, введите MIXED, чтобы снова установить параметр по умолчанию.

  4. Убедитесь, что текстовое поле Значение в строке PREDICTION_SMOOTHING пусто или равно 0,5. Если задано иное значение, щелкните Значение и введите 0,5, чтобы снова установить для параметра значение по умолчанию.

    ПримечаниеПримечание

    Параметр PREDICTION_SMOOTHING доступен только в версии SQL Server Enterprise. Поэтому нельзя просмотреть или изменить значение параметра PREDICTION_SMOOTHING в версии SQL Server Standard. Тем не менее, поведение по умолчанию такое же.

  5. Нажмите ОК.

Обработка модели прогнозирования

  1. В меню Модель интеллектуального анализа данных среды BI Development Studio выберите команду Обработать структуру интеллектуального анализа данных и все модели.

  2. Когда отобразится предупреждение с запросом на построение проекта с последующим его развертыванием, нажмите кнопку Да.

  3. В диалоговом окне Обработка структуры интеллектуального анализа данных — Прогнозирование нажмите кнопку Выполнить.

    Будет открыто диалоговое окно Ход обработки, в котором отображаются сведения о ходе обработки модели. Обработка модели может занять некоторое время.

  4. После успешного завершения обработки нажмите кнопку Закрыть, чтобы выйти из диалогового окна Ход обработки.

  5. Затем нажмите кнопку Закрыть в диалоговом окне Обработка структуры интеллектуального анализа данных — Прогнозирование.

Обработка отсутствующих данных (необязательно)

Во многих случаях данные продаж могут иметь пробелы, заполненные нулями, или склад может не выполнить отчет к сроку, в результате чего в конце ряда останется пустая ячейка. В таких случаях службы Analysis Services не будут обрабатывать модель и выдадут следующую ошибку.

«Ошибка (интеллектуальный анализ данных): Временные метки не синхронизированы, начиная с ряда <имя ряда> модели интеллектуального анализа данных <имя модели>. Все временные ряды должны завершаться в одной временной метке и не могут иметь произвольно отсутствующие точки данных. Задание в качестве значения параметра MISSING_VALUE_SUBSTITUTION "PREVIOUS" или численной константы автоматически исправляет отсутствующие точки данных, где это возможно».

Чтобы избежать этой ошибки, можно задать, чтобы службы Analysis Services автоматически предоставляли новые значения для заполнения промежутков с помощью следующих методов.

  • Использование среднего значения. Среднее значение вычисляется с помощью всех действительных значений в одном ряде данных.

  • Использование предыдущего значения. Несколько ячеек с отсутствующими данными можно заполнить предыдущими значениями, но нельзя заполнить начальные значения.

  • Использование предоставляемого постоянного значения.

Заполнение промежутков средними значениями

  1. На вкладке Модели интеллектуального анализа данных щелкните правой кнопкой мыши столбец Прогнозирование и выберите команду Задать параметры алгоритма.

  2. В строке MISSING_VALUE_SUBSTITUTION диалогового окна Параметры алгоритма щелкните столбец Значение, затем введите Среднее.