Создание прогнозов (учебник по интеллектуальному анализу данных — начальный уровень)
Когда точность моделей интеллектуального анализа данных проверена и модели признаны пригодными, можно создавать прогнозирующие DMX-запросы, используя для этого построитель прогнозирующих запросов на вкладке Прогноз модели интеллектуального анализа данных в конструкторе интеллектуального анализа данных.
Построитель прогнозирующих запросов имеет три представления. В представлениях Конструирование и Запрос можно создать и проверить запрос. Затем этот запрос можно выполнить и просмотреть результаты в представлении Результат.
Дополнительные сведения об использовании построителя прогнозирующих запросов см. в разделе Создание прогнозирующих запросов расширений интеллектуального анализа данных.
Создание запроса
Первым шагом в создании прогнозирующего запроса является выбор модели интеллектуального анализа данных и входной таблицы.
Выбор модели и входной таблицы
На вкладке Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных в поле Модель интеллектуального анализа нажмите кнопку Выбрать модель.
В диалоговом окне Выбор модели интеллектуального анализа данных перейдите по дереву к структуре Targeted Mailing, разверните узел этой структуры, выберите TM_Decision_Tree, а затем нажмите кнопку ОК.
В поле Выбор входных таблиц нажмите кнопку Выбрать таблицу вариантов.
В диалоговом окне Выбор таблицы в списке Источник данных выберите Adventure Works DW2008R2.
В поле Имя таблицы/представления выберите таблицу ProspectiveBuyer (dbo) и нажмите кнопку ОК.
Таблица ProspectiveBuyer наиболее похожа на таблицу вариантов vTargetMail.
Сопоставление столбцов
После выбора входной таблицы в построителе прогнозируемых запросов будет создано сопоставление по умолчанию между моделью интеллектуального анализа данных и таблицей входных данных на основе имен столбцов. По крайней мере один столбец структуры необходимо сопоставить со столбцом внешних данных.
Важно! |
---|
Данные, которые используются для определения точности моделей, должны содержать столбец, который может быть сопоставлен с прогнозируемым столбцом. |
Сопоставление столбцов структуры со столбцами входной таблицы
Щелкните правой кнопкой мыши линии, соединяющие между собой окна Модель интеллектуального анализа данных и Выбор входной таблицы, и выберите команду Изменить соединения.
Обратите внимание, что сопоставляется не каждый столбец. Мы добавим сопоставления для нескольких столбцов таблицы.
В разделе Столбец таблицы щелкните ячейку Bike Buyer и в раскрывающемся списке выберите ProspectiveBuyer.Unknown.
При этом прогнозируемый столбец [Bike Buyer] сопоставляется со столбцом входной таблицы.
Нажмите кнопку ОК.
В окне Обозреватель решений щелкните правой кнопкой мыши представление источника данных Targeted Mailing и выберите пункт Конструктор представлений.
Щелкните правой кнопкой мыши заголовок таблицы ProspectiveBuyer и выберите команду Создать именованное вычисление.
В поле Имя столбца введите calcAge.
В поле Выражение введите DATEDIFF(YYYY,[BirthDate],getdate()) и нажмите кнопку ОК.
Во входной таблице нет соответствующего столбца Age. Данное выражение вычислит возраст клиента по столбцу BirthDate входной таблицы. Поскольку столбец Age был определен как наиболее важный для прогнозирования покупательского спроса на велосипеды, он должен присутствовать и в модели, и во входной таблице.
В конструкторе интеллектуального анализа данных выберите вкладку Прогноз модели интеллектуального анализа данных и снова откройте окно Изменение соединений.
В разделе Столбец таблицы щелкните ячейку Age и в раскрывающемся списке выберите ProspectiveBuyer.calcAge.
Нажмите кнопку ОК.
Проектирование прогнозирующего запроса
Создание прогнозирующего запроса
Первой кнопкой на панели инструментов вкладки Прогноз модели интеллектуального анализа данных является кнопка Переключиться в представление проектирования / Переключиться в представление результатов / Переключиться в представление запроса. Щелкните стрелку вниз на этой кнопке и выберите Проект.
В сетке на вкладке Прогноз модели интеллектуального анализа данных щелкните ячейку в первой пустой строке столбца Источник и выберите значение Прогнозирующая функция.
Таким образом определяется целевой столбец для функции PredictProbability. Дополнительные сведения о функциях см. в разделе Справочник по функциям расширений интеллектуального анализа данных.
В ячейке, расположенной на пересечении строки Прогнозирующая функция и столбца Поле, выберите значение PredictProbability.
В окне Модель интеллектуального анализа данных выше выделите строку [Bike Buyer] и перетащите ее в ячейку Критерий или аргумент.
После этого строка [TM_Decision_Tree].[Bike Buyer] появляется в ячейке Критерий или аргумент.
Щелкните следующую пустую строку в столбце Источник и выберите значение TM_Decision_Tree.
В ячейке, расположенной на пересечении строки TM_Decision_Tree и столбца Поле, выберите значение Bike Buyer.
В строке TM_Decision_Tree столбца Критерий или аргумент введите значение =1.
Щелкните следующую пустую строку в столбце Источник и выберите значение ProspectiveBuyer.
В строке ProspectiveBuyer столбца Поле выберите значение ProspectiveBuyerKey.
При этом к прогнозирующему запросу добавляется уникальный идентификатор, который позволяет определить возможных покупателей велосипедов.
Добавьте еще пять строк в сетку. Для каждой строки в столбце Источник выберите значение ProspectiveBuyer, а затем добавьте в ячейки Поле следующие столбцы:
calcAge
LastName
FirstName
AddressLine1
AddressLine2
Наконец, выполните запрос и просмотрите результаты.
Выполнение запроса и просмотр результатов
На вкладке Прогноз модели интеллектуального анализа данных нажмите кнопку Результат.
После выполнения запроса отображаются результаты для просмотра.
На вкладке Прогноз модели интеллектуального анализа данных отображаются контактные данные вероятных покупателей велосипедов. В столбце Выражение указывается вероятность получения точного прогноза. Эти результаты можно использовать, чтобы определить, для каких потенциальных заказчиков следует выполнить прямую почтовую рассылку.
Нажмите кнопку Сохранить, чтобы сохранить результаты.
Следующая задача занятия