Занятие 1. Создание модели интеллектуального анализа данных временных рядов и структуры интеллектуального анализа данных
На этом занятии будет создана модель интеллектуального анализа данных, с помощью которой можно спрогнозировать значения во времени на основании исторических данных. После создания модели автоматически будет создана базовая структура, которую можно использовать в качестве основы для дополнительных моделей интеллектуального анализа данных.
На этом занятии предполагается, что вы знакомы с моделями прогнозирования и требованиями алгоритма временных рядов (Майкрософт). Дополнительные сведения см. в разделе Алгоритм временных рядов (Майкрософт).
Инструкция CREATE MINING MODEL
Инструкция CREATE MINING MODEL (расширения интеллектуального анализа данных) используется для непосредственного создания модели интеллектуального анализа данных и автоматического формирования базовой структуры интеллектуального анализа данных. Код инструкции можно разбить на следующие части:
присвоение имени модели;
определение временной метки;
определение необязательного ключевого столбца ряда;
определение прогнозируемого атрибута или атрибутов.
В следующем фрагменте показан стандартный пример инструкции CREATE MINING MODEL:
CREATE MINING MODEL [<Mining Structure Name>]
(
<key columns>,
<predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH
Первая строчка кода определяет имя модели интеллектуального анализа данных:
CREATE MINING MODEL [Mining Model Name]
Службы Analysis Services автоматически формируют имя базовой структуры путем добавления строки «_structure» к имени модели, что гарантирует несовпадение имени структуры и модели. Дополнительные сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе Идентификаторы (расширения интеллектуального анализа данных).
В следующей строке кода задается ключевой столбец модели интеллектуального анализа данных, который в случае с моделью временных рядов уникально определяет временной этап в исходных данных. Временной этап I определен с помощью ключевых слов KEY TIME после имени столбца и типов данных. Если модель временных рядов имеет отдельный ключ ряда, она определяется с помощью ключевого слова KEY.
<key columns>
Следующая строка кода используется для определения столбцов в прогнозируемой модели. Отдельная модель интеллектуального анализа данных может иметь несколько прогнозируемых атрибутов. В таком случае алгоритм временных рядов (Майкрософт) создает отдельный анализ для каждого ряда:
<predictable attribute columns>
Задачи занятия
На этом занятии будут выполняться следующие задачи:
Создание нового пустого запроса
Изменение запроса, чтобы создать модель интеллектуального анализа данных
Выполнение запроса
Создание запроса
На первом этапе необходимо подключиться к экземпляру служб Analysis Services и создать новый DMX-запрос в среде SQL Server Management Studio.
Создание нового DMX-запроса в среде SQL Server Management Studio
Откройте среду SQL Server Management Studio.
В диалоговом окне Соединение с сервером в списке Тип сервера выберите Службы Analysis Services. В поле Имя сервера введите LocalHost или имя экземпляра Analysis Services, к которому необходимо подключиться на данном занятии. Щелкните Соединить.
В окне Обозреватель объектов щелкните правой кнопкой мыши эеземпляр служб Analysis Services, укажите пункт Создать запрос и щелкните DMX.
Откроется редактор запросов, содержащий новый пустой запрос.
Изменение запроса
Следующим шагом будет изменение инструкции CREATE MINING MODEL, чтобы создать модель интеллектуального анализа данных, используемую для составления прогнозов, а также ее базовую структуру интеллектуального анализа данных.
Настройка инструкции CREATE MINING MODEL
В редакторе запросов скопируйте общий пример инструкции CREATE MINING MODEL в пустое окно запроса.
Замените следующий код:
[mining model name]
на
[Forecasting_MIXED]
Замените следующий код:
<key columns>
на
[Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY
Ключевое слово TIME KEY указывает на то, что столбец ReportingDate содержит значения временных этапов, используемые для определения порядка следования значений. Временными этапами могут быть даты и значения времени, целые числа или любой другой тип упорядоченных данных при условии, что значения уникальны, а данные отсортированы.
Ключевые слова TEXT и KEY указывают на то, что столбец ModelRegion содержит дополнительный ключ ряда. Допускается использование только одного ключа ряда, при этом значения в столбце должны отличаться друг от друга.
Замените следующий код:
< predictable attribute columns> )
на
[Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT )
Замените следующий код:
USING <algorithm name>([parameter list]) WITH DRILLTHROUGH
на
USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
Параметр алгоритма AUTO_DETECT_PERIODICITY = 0,8 указывает на то, что алгоритм должен обнаруживать циклы в данных. Установка значения, близкого к 1, позволяет обнаружить множество шаблонов, но может замедлить процесс обработки.
Параметр алгоритма FORECAST_METHOD задает алгоритм анализа данных ARTXP или ARIMA или сочетание обоих алгоритмов.
Ключевое слово WITH DRILLTHROUGH обеспечивает возможность просмотра подробной статистики в исходных данных после завершения создания модели. Добавьте это предложение в том случае, если нужно просматривать модель с помощью средства просмотра временных рядов (Майкрософт). Для создания прогноза оно не требуется.
Полная инструкция теперь должна выглядеть следующим образом:
CREATE MINING MODEL [Forecasting_MIXED] ( [Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY, [Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH
В меню Файл щелкните Сохранить DMXQuery1.dmx как.
В диалоговом окне Сохранить как перейдите к соответствующей папке и присвойте файлу имя Forecasting_MIXED.dmx.
Выполнение запроса
На последнем шаге нужно выполнить запрос. Создав и сохранив запрос, его необходимо выполнить, чтобы сформировать модель интеллектуального анализа данных и соответствующую структуру на сервере. Дополнительные сведения о выполнении запросов в редакторе запросов см. в разделе Окно «Редактор запросов» компонента Database Engine среды SQL Server Management Studio.
Выполнение запроса
На панели инструментов в редакторе запросов щелкните Выполнить.
Состояние запроса после завершения выполнения инструкции отображается на вкладке Сообщения в нижней части редактора запросов. Сообщение должно выглядеть следующим образом:
Executing the query Execution complete
Теперь на сервере содержится новая структура с именем Forecasting_MIXED_Structure, а также связанная с ней модель интеллектуального анализа данных Forecasting_MIXED.
На следующем занятии к созданной структуре интеллектуального анализа данных Forecasting_MIXED будет добавлена модель интеллектуального анализа данных.
Следующее занятие