Учебник по расширениям интеллектуального анализа данных потребительской корзины
С помощью данного учебника вы научитесь создавать, обучать и исследовать модели интеллектуального анализа данных при помощи языка запросов расширения интеллектуального анализа данных (DMX). После этого вы будете использовать модели интеллектуального анализа данных для создания прогнозов, описывающих, какие продукты будут покупаться с наибольшей вероятностью.
Модели интеллектуального анализа данных будут созданы на основе данных, содержащихся в образце базы данных AdventureWorksDW2012 , где хранятся данные вымышленной компании Компания Adventure Works Cycles. Компания Adventure Works Cycles является крупной транснациональной производственной организацией. Компания изготавливает и продает велосипеды из металла и композитных материалов в Северной Америке, а также на европейском и азиатском рынках. Основное производство расположено в городе Ботель, штат Вашингтон, и имеет 290 служащих; существуют несколько региональных групп продаж, расположенных на территории рынков сбыта.
Сценарий учебника
Компания Adventure Works Cycles приняла решение создать пользовательское приложение с применением функциональности интеллектуального анализа данных, чтобы предсказать, какие типы продуктов наиболее вероятно будут покупаться клиентами. Целью приложения является возможность определить набор продуктов и предсказать, какие дополнительные продукты будут покупаться вместе с другими продуктами. После этого Компания Adventure Works Cycles будет использовать полученные сведения, чтобы добавить на веб-сайт новую функцию — «Предложение», а также лучше предоставлять информацию клиентам.
Службы Microsoft SQL Server Службы Analysis Services предоставляют ряд средств, которые могут быть использованы для выполнения этой задачи.
Язык DMX-запросов
Компонент Алгоритм взаимосвязей (Майкрософт)
Редактор запросов в среде Среда SQL Server Management Studio
Расширения интеллектуального анализа данных представляют собой язык запросов, предоставляемый службами Службы Analysis Services и используемый для создания и работы с моделями интеллектуального анализа данных. Алгоритм взаимосвязей (Майкрософт) создает модели, которые могут предсказывать продукты, которые, скорее всего, будут покупаться вместе.
Целью данного учебника является описание запросов расширений интеллектуального анализа данных, которые используются в описанном выше приложении.
Дополнительные сведения см. в разделе Решения для интеллектуального анализа данных
Структура и модели интеллектуального анализа данных
Перед созданием инструкций для расширения интеллектуального анализа данных важно понять, какие основные объекты служб Службы Analysis Services используются для создания моделей интеллектуального анализа данных. Структура интеллектуального анализа данных — это структура данных, определяющая домен данных, на основе которого строятся модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может содержать несколько моделей интеллектуального анализа данных, совместно использующих один домен. Модель интеллектуального анализа данных применяет алгоритм интеллектуального анализа к данным, представленным структурой интеллектуального анализа данных.
Строительными блоками структуры интеллектуального анализа являются столбцы, которые описывают данные, содержащиеся в источнике данных. Эти столбцы содержат такие сведения, как тип данных, тип содержимого и способы распределения данных.
Модели интеллектуального анализа данных должны включать ключевой столбец, описанный в структуре интеллектуального анализа данных, а также набор оставшихся столбцов. Модель интеллектуального анализа данных определяет использование каждого столбца и определяет алгоритм, используемый для создания этой модели. Например, в расширении интеллектуального анализа данных можно указать столбец в качестве ключевого или столбца типа PREDICT. Если столбец не указан, он считается входным столбцом.
В расширении интеллектуального анализа данных существует два способа создания моделей интеллектуального анализа данных. Можно либо создать структуру интеллектуального анализа данных и связанную модель интеллектуального анализа данных вместе с помощью инструкции CREATE MINING MODEL, либо вначале создать структуру интеллектуального анализа данных с помощью инструкции CREATE MINING STRUCTURE, а затем добавить к структуре модель интеллектуального анализа данных с помощью инструкции ALTER STRUCTURE. Эти методы описаны ниже.
CREATE MINING MODEL
Эта инструкция используется для одновременного создания структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных с одним и тем же именем. К имени модели интеллектуального анализа данных добавляется слово «Structure», чтобы отличить ее от структуры интеллектуального анализа данных.Эта инструкция полезна, если создается структура интеллектуального анализа данных, которая будет содержать только одну модель интеллектуального анализа данных.
Дополнительные сведения см. в разделе CREATE MINING MODEL (расширения интеллектуального анализа данных).
CREATE MINING STRUCTURE
Эта инструкция используется для создания новой структуры интеллектуального анализа данных без использования моделей.При использовании CREATE MINING STRUCTURE можно также создать набор контрольных данных, который может быть использован для проверки моделей, основанных на той же структуры интеллектуального анализа данных.
Дополнительные сведения см. в разделе CREATE MINING STRUCTURE (расширения интеллектуального анализа данных).
ALTER MINING STRUCTURE
Эта инструкция используется для добавления модели интеллектуального анализа данных к уже существующей на сервере структуре интеллектуального анализа данных.Есть несколько причин, почему может понадобиться добавить несколько моделей интеллектуального анализа данных в структуру интеллектуального анализа данных. Например, можно создать несколько моделей интеллектуального анализа данных, которые используют разные алгоритмы, чтобы выяснить, какой из них самый лучший. При помощи одного и того же алгоритма можно создать несколько различных моделей и установить для них различные настройки определенного параметра, чтобы выяснить, какое значение параметра является наилучшим.
Дополнительные сведения см. в разделе ALTER MINING STRUCTURE (расширения интеллектуального анализа данных).
В этом учебнике создается структура интеллектуального анализа данных, которая содержит несколько моделей, поэтому в учебнике используется второй метод.
Дополнительные сведения см. в разделах:
Справочник по расширениям интеллектуального анализа данных, Основные сведения об инструкции SELECT (расширения интеллектуального анализа данных), Структура и методы использования прогнозирующих запросов расширений интеллектуального анализа данных
Обзор учебника
Учебник содержит следующие занятия:
Занятие 1. Создание структуры интеллектуального анализа «Потребительская корзина»
На этом занятии рассматривается использование инструкции CREATE для создания структур интеллектуального анализа данных.Занятие 2. Добавление моделей интеллектуального анализа к структуре интеллектуального анализа «Потребительская корзина»
На этом занятии рассматривается использование инструкции ALTER для добавления моделей интеллектуального анализа данных в структуру интеллектуального анализа данных.Занятие 3. Обработка структуры интеллектуального анализа данных «Потребительская корзина»
На этом занятии рассматривается использование инструкции INSERT INTO для обработки структур интеллектуального анализа данных и связанных с ними моделей интеллектуального анализа данных.Занятие 4. Прогнозирование «Потребительской корзины»
На этом занятии рассматривается использование инструкции PREDICTION JOIN для создания прогнозов по моделям интеллектуального анализа данных.
Требования
Прежде чем выполнять задания этого учебника, убедитесь, что установлены следующие компоненты:
Microsoft SQL Server
Microsoft SQL Server Службы Analysis Services
База данных AdventureWorksDW2012
В целях повышения безопасности образцы баз данных по умолчанию не установлены. Чтобы установить официальные образцы баз данных для Microsoft SQL Server, перейдите по ссылке https://www.CodePlex.com/MSFTDBProdSamples или посетите раздел «Образцы баз данных» домашней страницы Microsoft SQL Server Samples and Community Projects («Образцы кода и проекты сообщества Microsoft SQL Server»). Щелкните Базы данных, затем перейдите на вкладку Выпуски и выберите нужные базы данных.
Примечание |
---|
При просмотре учебников рекомендуется добавить на панель инструментов средства просмотра документов кнопки Следующий раздел и Предыдущий раздел. Дополнительные сведения см. в разделе Добавление в справку кнопок «Далее» и «Назад». |
См. также
Задания
Учебник по основам интеллектуального анализа данных
Основные понятия
Учебник по расширениям интеллектуального анализа данных «Покупатель велосипеда»