Поделиться через


Занятие 1. Создание модели интеллектуального анализа данных временных рядов и структуры интеллектуального анализа данных

На этом занятии будет создана модель интеллектуального анализа данных, с помощью которой можно спрогнозировать значения во времени на основании исторических данных. После создания модели автоматически будет создана базовая структура, которую можно использовать в качестве основы для дополнительных моделей интеллектуального анализа данных.

На этом занятии предполагается, что вы знакомы с моделями прогнозирования и требованиями алгоритма временных рядов (Майкрософт). Дополнительные сведения см. в разделе Алгоритм временных рядов (Майкрософт).

Инструкция CREATE MINING MODEL

Инструкция CREATE MINING MODEL (расширения интеллектуального анализа данных) используется для непосредственного создания модели интеллектуального анализа данных и автоматического формирования базовой структуры интеллектуального анализа данных. Код инструкции можно разбить на следующие части:

  • присвоение имени модели;

  • определение временной метки;

  • определение необязательного ключевого столбца ряда;

  • определение прогнозируемого атрибута или атрибутов.

В следующем фрагменте показан стандартный пример инструкции CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]
(
   <key columns>,
   <predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH

Первая строчка кода определяет имя модели интеллектуального анализа данных:

CREATE MINING MODEL [Mining Model Name]

Службы Analysis Services автоматически формируют имя базовой структуры путем добавления строки «_structure» к имени модели, что гарантирует несовпадение имени структуры и модели. Дополнительные сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе Идентификаторы (расширения интеллектуального анализа данных).

В следующей строке кода задается ключевой столбец модели интеллектуального анализа данных, который в случае с моделью временных рядов уникально определяет временной этап в исходных данных. Временной этап I определен с помощью ключевых слов KEY TIME после имени столбца и типов данных. Если модель временных рядов имеет отдельный ключ ряда, она определяется с помощью ключевого слова KEY.

<key columns>

Следующая строка кода используется для определения столбцов в прогнозируемой модели. Отдельная модель интеллектуального анализа данных может иметь несколько прогнозируемых атрибутов. В таком случае алгоритм временных рядов (Майкрософт) создает отдельный анализ для каждого ряда:

<predictable attribute columns>

Задачи занятия

На этом занятии будут выполняться следующие задачи:

  • Создание нового пустого запроса

  • Изменение запроса, чтобы создать модель интеллектуального анализа данных

  • Выполнение запроса

Создание запроса

На первом этапе необходимо подключиться к экземпляру служб Analysis Services и создать новый DMX-запрос в среде SQL Server Management Studio.

Создание нового DMX-запроса в среде SQL Server Management Studio

  1. Откройте среду SQL Server Management Studio.

  2. В диалоговом окне Соединение с сервером в списке Тип сервера выберите Службы Analysis Services. В поле Имя сервера введите LocalHost или имя экземпляра Analysis Services, к которому необходимо подключиться на данном занятии. Щелкните Соединить.

  3. В окне Обозреватель объектов щелкните правой кнопкой мыши эеземпляр служб Analysis Services, укажите пункт Создать запрос и щелкните DMX.

    Откроется редактор запросов, содержащий новый пустой запрос.

Изменение запроса

Следующим шагом будет изменение инструкции CREATE MINING MODEL, чтобы создать модель интеллектуального анализа данных, используемую для составления прогнозов, а также ее базовую структуру интеллектуального анализа данных.

Настройка инструкции CREATE MINING MODEL

  1. В редакторе запросов скопируйте общий пример инструкции CREATE MINING MODEL в пустое окно запроса.

  2. Замените следующий код:

    [mining model name] 
    

    на

    [Forecasting_MIXED]
    
  3. Замените следующий код:

    <key columns>
    

    на

    [Reporting Date] DATE KEY TIME,
    [Model Region] TEXT KEY
    

    Ключевое слово TIME KEY указывает на то, что столбец ReportingDate содержит значения временных этапов, используемые для определения порядка следования значений. Временными этапами могут быть даты и значения времени, целые числа или любой другой тип упорядоченных данных при условии, что значения уникальны, а данные отсортированы.

    Ключевые слова TEXT и KEY указывают на то, что столбец ModelRegion содержит дополнительный ключ ряда. Допускается использование только одного ключа ряда, при этом значения в столбце должны отличаться друг от друга.

  4. Замените следующий код:

    < predictable attribute columns> )
    

    на

        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    
  5. Замените следующий код:

    USING <algorithm name>([parameter list])
    WITH DRILLTHROUGH
    

    на

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    

    Параметр алгоритма AUTO_DETECT_PERIODICITY = 0,8 указывает на то, что алгоритм должен обнаруживать циклы в данных. Установка значения, близкого к 1, позволяет обнаружить множество шаблонов, но может замедлить процесс обработки.

    Параметр алгоритма FORECAST_METHOD задает алгоритм анализа данных ARTXP или ARIMA или сочетание обоих алгоритмов.

    Ключевое слово WITH DRILLTHROUGH обеспечивает возможность просмотра подробной статистики в исходных данных после завершения создания модели. Добавьте это предложение в том случае, если нужно просматривать модель с помощью средства просмотра временных рядов (Майкрософт). Для создания прогноза оно не требуется.

    Полная инструкция теперь должна выглядеть следующим образом:

    CREATE MINING MODEL [Forecasting_MIXED]
         (
        [Reporting Date] DATE KEY TIME,
        [Model Region] TEXT KEY,
        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В диалоговом окне Сохранить как перейдите к соответствующей папке и присвойте файлу имя Forecasting_MIXED.dmx.

Выполнение запроса

На последнем шаге нужно выполнить запрос. Создав и сохранив запрос, его необходимо выполнить, чтобы сформировать модель интеллектуального анализа данных и соответствующую структуру на сервере. Дополнительные сведения о выполнении запросов в редакторе запросов см. в разделе Окно «Редактор запросов» компонента Database Engine среды SQL Server Management Studio.

Выполнение запроса

  • На панели инструментов в редакторе запросов щелкните Выполнить.

    Состояние запроса после завершения выполнения инструкции отображается на вкладке Сообщения в нижней части редактора запросов. Сообщение должно выглядеть следующим образом:

    Executing the query 
    Execution complete
    

    Теперь на сервере содержится новая структура с именем Forecasting_MIXED_Structure, а также связанная с ней модель интеллектуального анализа данных Forecasting_MIXED.

На следующем занятии к созданной структуре интеллектуального анализа данных Forecasting_MIXED будет добавлена модель интеллектуального анализа данных.