Поделиться через


Учебник по интеллектуальному анализу данных

Добро пожаловать в базовый учебник по интеллектуальному анализу данных Microsoft Analysis Services. Microsoft SQL Server предоставляет интегрированную среду для создания моделей интеллектуального анализа данных и прогнозирования. В этом руководстве вы завершите сценарий для целевой кампании рассылки, в которой используется машинное обучение для анализа и прогнозирования поведения покупки клиентов. В этом руководстве показано, как использовать три наиболее важных алгоритма интеллектуального анализа данных: кластеризацию, деревья принятия решений и наивный Байес. Вы также узнаете, как анализировать результаты с помощью средств просмотра моделей интеллектуального анализа данных, а также создавать прогнозы и диаграммы точности с помощью средств интеллектуального анализа данных, включенных в microsoft SQL Server Analysis Services. Вымышленная компания Adventure Works Cycles используется для всех примеров.

Когда вы освоите использование средств интеллектуального анализа данных, мы рекомендуем также завершить Intermediate Data Mining Tutorial (Analysis Services - Data Mining). В уроках показано, как использовать прогнозирование, анализ корзины рынка, временные ряды, модели ассоциаций, вложенные таблицы и кластеризацию последовательностей.

Сценарий учебного пособия

В этом руководстве вы являетесь сотрудником компании Adventure Works Cycles, которому поручено изучить больше о клиентах компании на основе исторических покупок и затем использовать эти данные для прогнозирования, применимого в маркетинговых стратегиях. Компания никогда не делала интеллектуального анализа данных раньше, поэтому необходимо создать новую базу данных специально для интеллектуального анализа данных и настроить несколько моделей интеллектуального анализа данных.

Чему вы научитесь

В этом руководстве описано, как создавать и работать с различными типами методов машинного обучения. Вы также узнаете, как создать копию модели интеллектуального анализа данных и применить фильтр к входным данным, чтобы получить различные результаты. После этого можно сравнить результаты обеих моделей с помощью диаграммы лифта. Наконец, вы будете использовать детализацию для получения дополнительных данных из базовой структуры интеллектуального анализа данных.

Интеллектуальный анализ данных Служб Microsoft Analysis Services включает следующие функции, которые помогают легко разрабатывать и сравнивать несколько прогнозных моделей, а затем выполнять действия по результатам:

  • Наборы тестов удержаний —При создании структуры интеллектуального анализа данных теперь можно разделить данные в структуре интеллектуального анализа данных на наборы обучения и тестирования. Это позволяет тестировать модели на аналогичных наборах данных и сравнивать точность связанных моделей.

  • Фильтры модели интеллектуального анализа данных —Теперь можно подключать фильтры к модели интеллектуального анализа данных и применять их как во время обучения, так и при тестировании. Это позволяет легко создавать связанные модели на разных подмножествах данных.

  • Детализация по случаям структуры и столбцам структуры - Теперь вы можете легко перейти от общих шаблонов в модели интеллектуального анализа данных к практическим деталям в источнике данных.

Это руководство разделено на следующие уроки:

Урок 1. Подготовка базы данных для Analysis Services (базовый учебник по анализу данных)
На этом занятии вы узнаете, как создать новую базу данных Analysis Services, добавить источник данных и представление источника данных и подготовить новую базу данных для использования с интеллектуальным анализом данных.

Урок 2. Создание целевой структуры рассылки (учебник по интеллектуальному анализу данных уровня "Базовый")
На этом уроке вы узнаете, как создать структуру модели майнинга данных, которая может использоваться в целевой рассылке.

Занятие 3. Добавление и обработка моделей
На этом занятии вы узнаете, как добавить модели в структуру. Созданные модели создаются с помощью следующих алгоритмов:

  • Деревья принятия решений Майкрософт

  • Кластеризация Майкрософт

  • Microsoft Naive Bayes

Урок 4. Изучение целевых моделей рассылки (учебник по интеллектуальному анализу данных)
В этом уроке вы узнаете, как изучить и интерпретировать результаты каждой модели с помощью средств просмотра.

Урок 5. Тестирование моделей (учебник по интеллектуальному анализу данных уровня "Базовый")
На этом занятии вы создайте копию одной из целевых моделей рассылки, добавьте фильтр модели интеллектуального анализа данных, чтобы ограничить обучающие данные определённым набором клиентов, а затем оцените эффективность модели.

Занятие 6. Создание и работа с прогнозами (учебник по интеллектуальному анализу данных уровня "Базовый")
В этом заключительном уроке учебника по интеллектуальному анализу данных уровня "базовый" вы используете модель для прогнозирования того, какие клиенты, скорее всего, приобретут велосипед. Затем вы подробно изучите базовые случаи, чтобы получить контактные данные.

Требования

Убедитесь, что установлены следующие компоненты:

  • Microsoft SQL Server 2014

  • Службы Microsoft SQL Server Analysis Services в многомерном режиме

  • База данных AdventureWorksDW2012 .

Для повышения безопасности примеры баз данных не устанавливаются с SQL Server. Чтобы установить официальные базы данных для Microsoft SQL Server, перейдите на страницу примеров баз данных Microsoft SQL и выберите SQL Server 2014.

Замечание

При работе с руководством вы можете упростить перемещение между шагами, если добавить кнопки "Далее" и "Предыдущая тема" на панель инструментов средства просмотра документов.

См. также

Решения интеллектуального анализа данных
Задачи модели добычи данных и инструкции
Создание и запрос моделей интеллектуального анализа данных с помощью DMX: руководства (службы анализа — интеллектуальный анализ данных)