Поделиться через


Урок 1: Создание модели анализа временных рядов и структуры анализа данных

На этом уроке вы создадите модель анализа данных, которая позволит прогнозировать значения во времени на основе исторических данных. При создании модели базовая структура создается автоматически и может использоваться в качестве основы для дополнительных моделей интеллектуального анализа данных.

В этом уроке предполагается, что вы знакомы с моделями прогнозирования и требованиями алгоритма временных рядов Майкрософт. Дополнительные сведения см. в статье "Алгоритм временных рядов Майкрософт".

Инструкция CREATE MINING MODEL

Чтобы создать модель интеллектуального анализа данных напрямую и автоматически создать базовую структуру интеллектуального анализа данных, используйте инструкцию CREATE MINING MODEL (DMX). Код в инструкции можно разбить на следующие части:

  • Именование модели

  • Определение метки времени

  • Определение столбца опционального ключа ряда

  • Определение прогнозируемого атрибута или атрибутов

Ниже приведен универсальный пример инструкции CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

Первая строка кода определяет имя модели интеллектуального анализа данных:

CREATE MINING MODEL [Mining Model Name]  

Службы Analysis Services автоматически создают имя базовой структуры, добавляя "_structure" к имени модели, гарантируя, что имя структуры уникально от имени модели. Сведения об именовании объекта в DMX см. в разделе "Идентификаторы" (DMX).

Следующая строка кода определяет ключевой столбец модели анализа данных, которая в случае модели временного ряда однозначно идентифицирует шаг времени в исходных данных. Шаг времени определяется ключевыми KEY TIME словами после имени столбца и типов данных. Если модель временных рядов имеет отдельный ключ серии, он определяется с помощью ключевого KEY слова.

<key columns>  

Следующая строка кода используется для определения столбцов в модели, прогнозируемой. В одной модели интеллектуального анализа данных можно использовать несколько прогнозируемых атрибутов. При наличии нескольких прогнозируемых атрибутов алгоритм временных рядов Майкрософт создает отдельный анализ для каждой серии:

<predictable attribute columns>  

Задачи урока

В этом занятии будут выполняться следующие задачи:

  • Создание пустого запроса

  • Измените запрос для создания модели анализа данных

  • Выполнение запроса

Создание запроса

Первым шагом является подключение к экземпляру служб Analysis Services и создание нового запроса dmX в SQL Server Management Studio.

Создание DMX-запроса в SQL Server Management Studio

  1. Откройте SQL Server Management Studio.

  2. В диалоговом окне "Подключение к серверу" для типа сервера выберите Программы анализа данных. В поле Имя сервера введите LocalHost или имя экземпляра Служб Analysis Services, к которому требуется подключиться для этого занятия. Нажмите кнопку "Подключить".

  3. В Обозревателе объектов щелкните правой кнопкой мыши на экземпляре служб Analysis Services, наведите указатель на Новый запрос и щелкните DMX.

    Откроется редактор запросов и содержит новый пустой запрос.

Изменение запроса

Следующий шаг — изменить инструкцию CREATE MINING MODEL для создания модели прогнозирования и её базовой структуры.

Настройка и модификация инструкции CREATE MINING MODEL

  1. В редакторе запросов скопируйте универсальный пример инструкции CREATE MINING MODEL в пустой запрос.

  2. Замените следующее:

    [mining model name]   
    

    с:

    [Forecasting_MIXED]  
    
  3. Замените следующее:

    <key columns>  
    

    с:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    Ключевое TIME KEY слово указывает, что столбец ReportingDate содержит значения шага времени, используемые для упорядочивания значений. Этапы времени могут быть датами и временем, целыми числами или любым упорядоченным типом данных, если значения уникальны и данные отсортированы.

    Ключевые слова TEXT и KEY указывают, что столбец ModelRegion содержит дополнительный ключ серии. У вас может быть только один ключ серии, а значения в столбце должны отличаться.

  4. Замените следующее:

    < predictable attribute columns> )  
    

    с:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Замените следующее:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    с:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Параметр алгоритма = AUTO_DETECT_PERIODICITY 0,8 указывает, что алгоритм должен обнаруживать циклы в данных. Установка этого значения ближе к 1 способствует обнаружению множества шаблонов, но может замедлить обработку.

    Параметр FORECAST_METHODалгоритма указывает, нужно ли анализировать данные с помощью ARTXP, ARIMA или сочетания обоих.

    Ключевое слово, WITH DRILLTHROUGHукажите, что вы хотите просмотреть подробную статистику в исходных данных после завершения модели. Это предложение необходимо добавить, если вы хотите просмотреть модель с помощью средства просмотра временных рядов Майкрософт. Это не обязательно для прогнозирования.

    Теперь полное заявление должно быть следующим:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
    
  6. В меню "Файл" нажмите кнопку "Сохранить DMXQuery1.dmx As".

  7. В диалоговом окне "Сохранить как" перейдите в соответствующую папку и назовите файл Forecasting_MIXED.dmx.

Выполнение запроса

Последний шаг — выполнить запрос. После создания и сохранения запроса необходимо выполнить его для создания модели интеллектуального анализа данных и ее структуры интеллектуального анализа данных на сервере. Дополнительные сведения о выполнении запросов в редакторе запросов см. в редакторе запросов ядра СУБД (SQL Server Management Studio).

Выполнение запроса

  • В редакторе запросов на панели инструментов нажмите кнопку "Выполнить".

    Состояние запроса отображается на вкладке "Сообщения " в нижней части редактора запросов после завершения выполнения инструкции. Сообщения должны отображаться:

    Executing the query   
    Execution complete  
    

    Новая структура с именем Forecasting_MIXED_Structure теперь существует на сервере вместе с соответствующей моделью интеллектуального анализа данных Forecasting_MIXED.

На следующем уроке вы добавите модель майнинга в структуру майнинга Forecasting_MIXED, которую вы только что создали.

Следующее занятие

Урок 2. Добавление моделей анализа в структуру анализа временных рядов

См. также

Содержимое модели анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных)
Технический справочник по алгоритму временных рядов Майкрософт