Создание прогнозов (учебник по интеллектуальному анализу данных)
После того, как выполнена проверка точности моделей интеллектуального анализа данных и принято решение об их пригодности, можно создать прогнозируемые запросы для расширений интеллектуального анализа данных (DMX), используя построитель прогнозируемых запросов на вкладке Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных. Построение запросов в построителе прогнозируемых запросов, как и в конструкторе запросов на доступ, выполняется путем перетаскивания объектов мышью. Построитель прогнозируемых запросов имеет следующие представления:
- Конструирование
- Запрос
- Результат
В представлениях Конструирование и Запрос можно создать и проверить запрос. Затем этот запрос можно выполнить и просмотреть результаты в представлении Результат.
Дополнительные сведения об использовании построителя прогнозируемых запросов см. в разделе Создание прогнозирующих запросов расширений интеллектуального анализа данных.
Создание запроса
Первым шагом в создании прогнозируемого запроса является выбор модели интеллектуального анализа данных и входной таблицы.
Выбор модели и входной таблицы
На вкладке Прогноз модели интеллектуального анализа данных конструктора интеллектуального анализа данных в поле Модель интеллектуального анализа нажмите кнопку Выбрать модель.
Откроется диалоговое окно Выбор модели интеллектуального анализа данных.
Перейдите по дереву к структуре Прямая почтовая рассылка, раскройте ее, выберите элемент TM_Decision_Tree и нажмите кнопку ОК.
В поле Выбор входных таблиц нажмите кнопку Выбрать таблицу вариантов.
Откроется диалоговое окно Выбор таблицы.
Убедитесь, что в списке Источник данных выбрана база данных Adventure Works DW.
В поле Имя таблицы/представления выберите таблицу ProspectiveBuyer и нажмите кнопку ОК.
После выбора входной таблицы в построителе прогнозируемых запросов будет создано сопоставление по умолчанию между моделью интеллектуального анализа данных и таблицей входных данных на основе имен столбцов.
Создание прогнозируемого запроса
В столбце Источник сетки на вкладке Прогноз модели интеллектуального анализа данных щелкните ячейку в первой пустой строке и выберите ProspectiveBuyer.
Убедитесь, что в ячейке, расположенной на пересечении строки ProspectiveBuyer и столбца Поле, выбрано значение ProspectAlternateKey.
При этом к прогнозирующему запросу добавляется уникальный идентификатор, который позволяет выявить возможных покупателей велосипедов, и тех, кто откажется их покупать.
Щелкните следующую пустую строку в столбце Источник и выберите параметр TM_Decision_Tree.
Убедитесь, что в ячейке, расположенной на пересечении строки TM_Decision_Tree и столбца Поле, выбрано значение Покупатель велосипеда.
При этом для создания прогнозов будет использоваться модель дерева принятия решений (Microsoft) структуры прямой почтовой рассылки.
Щелкните следующую пустую строку в столбце Источник и выберите параметр Прогнозирующая функция.
В ячейке, расположенной на пересечении строки Прогнозирующая функция и столбца Поле, выберите значение PredictProbability.
Прогнозирующие функции предоставляют сведения о прогнозировании модели. Функция PredictProbability позволяет получить сведения о вероятности получения точного прогноза. Параметры прогнозирующей функции можно указать в столбце Критерий или аргумент.
В ячейке, расположенной на пересечении строки PredictProbability и столбца Критерий или аргумент, введите [TM_Decision_Tree].[Покупатель велосипеда].
Таким образом определяется целевой столбец для функции PredictProbability. Дополнительные сведения о функциях см. в разделе Ссылка на функцию расширений интеллектуального анализа данных.
Нажмите Переключиться в представление результатов запроса, первую кнопку на панели инструментов вкладки Прогноз модели интеллектуального анализа данных .
В следующей таблице представлена часть возвращенных результатов. Они показывают, что заказчик с идентификационным номером 827, возможно, купит велосипед, а вероятность прогноза составляет 63%.
ProspectAlternateKey | BikeBuyer | Expression |
---|---|---|
827 |
1 |
0.633836… |
833 |
0 |
0.521134… |
844 |
0 |
0.735697… |
Просмотр результатов
В столбцах ProspectAlternateKey, BikeBuyer и Expression соответственно определяются потенциальные заказчики, указывается, приобретают ли потенциальные заказчики велосипеды, а также отображается вероятность получения точного прогноза. Эти результаты можно использовать, чтобы определить, для каких потенциальных заказчиков следует выполнить прямую почтовую рассылку.
Первая кнопка на панели инструментов вкладки Прогноз модели интеллектуального анализа данных позволяет переключаться между тремя представлениями. Если нажать кнопку Переключиться в представление результатов запроса, можно увидеть результаты текущего прогнозирующего запроса. При просмотре результатов можно нажать кнопку Переключиться в режим проектирования запросов, чтобы вернуться к сетке и изменить запрос.
Если переключиться в представление Запрос, можно изменить DMX-код, созданный построителем прогнозирующих запросов. Кроме того, здесь можно выполнить запрос, изменить его и выполнить измененный запрос. Например, чтобы просмотреть только заказчиков, которые по прогнозу, возможно, купят велосипед, и отсортировать их по убыванию вероятности, в конец DMX-запроса можно добавить следующие инструкции:
WHERE [Bike Buyer] = 1
ORDER BY PredictProbability([TM_Decision_Tree].[Bike Buyer]) DESC
Можно переключаться между представлениями Запрос и Результаты, однако если переключиться обратно в представление Конструирование, измененный запрос не сохранится.
Следующее занятие
Занятие 3. Построение сценария прогнозирования
См. также
Другие ресурсы
Как создать прогнозирующий запрос
Использование построителя прогнозирующих запросов для создания прогнозирующих запросов расширений интеллектуального анализа данных