Поделиться через


Создание целевой структуры модели интеллектуального анализа почты (учебник по интеллектуальному анализу данных уровня "Базовый")

Первым шагом в создании целевого сценария рассылки является использование мастера интеллектуального анализа данных в SQL Server Data Tools (SSDT) для создания новой структуры интеллектуального анализа данных и модели интеллектуального анализа данных дерева принятия решений.

В этой задаче вы создадите новую структуру майнинга и добавите начальную модель майнинга, основанную на алгоритме «Деревья решений» от Microsoft. Чтобы создать структуру, сначала вы выберете таблицы и представления, а затем определите, какие столбцы будут использоваться для обучения и для тестирования.

Для создания структуры анализа данных для сценария целевой рассылки

  1. В обозревателе решений щелкните правой кнопкой мыши Структуры интеллектуального анализа данных и выберите Новая структура интеллектуального анализа данных, чтобы запустить мастер интеллектуального анализа данных.

  2. На странице "Добро пожаловать в мастер интеллектуального анализа данных " нажмите кнопку "Далее".

  3. На странице "Выбор метода определения " убедитесь, что выбрана существующая реляционная база данных или хранилище данных , а затем нажмите кнопку "Далее".

  4. На странице "Создание структуры интеллектуального анализа данных " в разделе "Какой метод интеллектуального анализа данных вы хотите использовать?", выберите деревья принятия решений Майкрософт.

    Замечание

    Если вы получите предупреждение о том, что алгоритмы интеллектуального анализа данных не найдены, свойства проекта могут быть настроены неправильно. Это предупреждение возникает, когда проект пытается получить список алгоритмов интеллектуального анализа данных с сервера служб Analysis Services и не может найти сервер. По умолчанию SQL Server Data Tools будет использовать localhost в качестве сервера. Если вы используете другой экземпляр или именованный экземпляр, необходимо изменить свойства проекта. Для получения дополнительной информации см. раздел "Создание проекта служб Analysis Services" (учебник по интеллектуальному анализу данных уровня "Базовый").

  5. Нажмите кнопку Далее.

  6. На странице "Выбор представления источника данных " в области "Доступные представления источников данных " выберите "Целевая рассылка". Вы можете нажать «Просмотреть», чтобы посмотреть таблицы в представлении источника данных, а затем нажать «Закрыть», чтобы вернуться к мастеру.

  7. Нажмите кнопку Далее.

  8. На странице "Указание типов таблиц" установите флажок в столбце "Образец" для vTargetMail, чтобы использовать его в качестве основной таблицы, а затем нажмите Далее. Вы будете использовать таблицу ProspectiveBuyer позже для тестирования; игнорируйте его сейчас.

  9. На странице "Указание данных обучения " вы определите по крайней мере один прогнозируемый столбец, один ключевой столбец и один входной столбец для модели. Установите флажок в прогнозируемом столбце в строке BikeBuyer .

    Замечание

    Обратите внимание на предупреждение в нижней части окна. Вы не сможете перейти на следующую страницу, пока не выберете по крайней мере один входной и один прогнозируемый столбец.

  10. Нажмите кнопку "Предложить", чтобы открыть диалоговое окно "Предложения связанных столбцов ".

    Кнопка "Предложить " включена всякий раз, когда выбран хотя бы один прогнозируемый атрибут. В диалоговом окне "Предложения связанных столбцов" перечислены столбцы , которые наиболее тесно связаны с прогнозируемым столбцом, и упорядочивает атрибуты по их корреляции с прогнозируемым атрибутом. Столбцы со значительной корреляцией (достоверность больше 95%) автоматически выбираются для включения в модель.

    Просмотрите предложения, а затем нажмите Отмена, чтобы игнорировать предложения.

    Замечание

    При нажатии кнопки "ОК" все перечисленные предложения будут помечены как входные столбцы в мастере. Если вы согласны только с некоторыми предложениями, необходимо изменить значения вручную.

  11. Убедитесь, что флажок в столбце "Ключ" установлен в строке CustomerKey .

    Замечание

    Если исходная таблица из представления источника данных указывает ключ, мастер интеллектуального анализа данных автоматически выбирает этот столбец в качестве ключа для модели.

  12. Установите флажки в столбце входных данных в следующих строках. Чтобы проверить несколько столбцов, выделите диапазон ячеек и нажмите клавиши CTRL при выборе флажка.

    • Возраст

    • CommuteDistance

    • Английское образование

    • Английская Профессия

    • Род

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • КоличествоДетейДома

    • Регион

    • TotalChildren

    • YearlyIncome

  13. В самом левом столбце страницы установите галочки в следующих строках.

    • AddressLine1

    • AddressLine2

    • ДатаПервойПокупки

    • EmailAddress

    • FirstName

    • LastName

    Убедитесь, что в этих строках отмечены галочки только в левом столбце. Эти столбцы будут добавлены в структуру, но не будут включены в модель. Однако после построения модели они будут доступны для детализации и тестирования. Дополнительные сведения о детализации см. в разделе "Запросы детализации" (интеллектуальный анализ данных)

  14. Нажмите кнопку Далее.

Следующая задача на занятии

Указание типа данных и типа контента (учебник по интеллектуальному анализу данных уровня "Базовый")

См. также

Определение типов таблиц (мастер интеллектуального анализа данных)
Конструктор интеллектуального анализа данных
Алгоритм деревьев принятия решений Майкрософт