Поделиться через


Изучение наивной модели Bayes (учебник по интеллектуальному анализу данных уровня "Базовый")

Алгоритм Microsoft Naive Bayes предоставляет несколько методов для отображения взаимодействия между покупкой велосипеда и входными атрибутами.

Microsoft Naive Bayes Viewer предоставляет следующие вкладки для изучения наивных байесовских моделей интеллектуального анализа данных.

Сеть зависимостей

Вкладка "Сеть зависимостей" работает так же, как вкладка "Сеть зависимостей " для средства просмотра деревьев Майкрософт. Каждый узел в средстве просмотра представляет атрибут, а строки между узлами представляют связи. В просмотрщике вы можете видеть все атрибуты, влияющие на состояние прогнозируемого атрибута, Покупатель велосипеда.

Изучение модели на вкладке "Сеть зависимостей"

  1. Используйте список моделей интеллектуального анализа данных в верхней части вкладки "Средство просмотра моделей интеллектуального анализа данных ", чтобы переключиться на TM_NaiveBayes модель.

  2. Используйте список просмотрщиков, чтобы перейти на Microsoft Naive Bayes Viewer.

  3. Щелкните узел Bike Buyer, чтобы определить его зависимости.

    Розовая подсветка означает, что все атрибуты влияют на покупку велосипеда.

  4. Настройте ползунок, чтобы определить наиболее влиятельный атрибут.

    Когда вы уменьшаете ползунок, остаются только атрибуты, которые оказывают наибольшее влияние на столбец [Покупатель велосипеда]. Изменяя ползунок, вы можете обнаружить, что некоторые из самых влиятельных атрибутов: число автомобилей в собственности, расстояние до работы и общее количество детей.

Профили атрибутов

Вкладка "Профили атрибутов" описывает, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.

Изучение модели на вкладке "Профили атрибутов"

  1. В поле "Прогнозируемая" убедитесь, что Bike Buyer выбрано.

  2. Если легенда майнинга блокирует отображение профилей атрибутов, переместите её в сторону.

  3. В поле столбцов гистограммы выберите 5.

    В нашей модели 5 — максимальное количество состояний для любой переменной.

    Атрибуты, влияющие на состояние этого прогнозируемого атрибута, перечислены вместе со значениями каждого состояния входных атрибутов и их распределения в каждом состоянии прогнозируемого атрибута.

  4. В столбце "Атрибуты" найдите номер автомобилей, принадлежащих. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и не-покупателей (столбец с меткой 0). Человек без автомобиля или с одним автомобилем с гораздо большей вероятностью купит велосипед.

  5. Дважды щелкните ячейку "Количество автомобилей" в столбце покупатель велосипедов (столбец с меткой 1).

    Легенда майнинга отображает более подробное представление.

Характеристики атрибутов

На вкладке "Характеристики атрибутов " можно выбрать атрибут и значение, чтобы узнать, как часто значения других атрибутов отображаются в выбранных случаях значений.

Изучение модели на вкладке "Характеристики атрибутов"

  1. Убедитесь, что Bike Buyer в списке атрибутов выбрано.

  2. Задайте значение1.

    В средстве просмотра вы увидите, что клиенты, у которых нет детей дома, короткое время в пути, и живут в регионе Северной Америки, скорее всего, купят велосипед.

Дискриминация атрибутов

На вкладке "Дискриминация атрибутов " можно исследовать связь между двумя дискретными значениями покупки велосипедов и другими значениями атрибутов. TM_NaiveBayes Поскольку модель имеет только два состояния, 1 и 0, вам не нужно вносить какие-либо изменения в средство просмотра.

В просмотрщике можно увидеть, что люди, которые не имеют собственных автомобилей, имеют тенденцию покупать велосипеды, а люди, которые владеют двумя автомобилями, имеют тенденцию не покупать велосипеды.

Ознакомьтесь со следующими разделами, чтобы изучить другие модели анализа данных.

Следующее занятие

Урок 5. Тестирование моделей (учебник по интеллектуальному анализу данных уровня "Базовый")

Предыдущая задача в уроке

Изучение модели кластеризации (учебник по интеллектуальному анализу данных уровня "Базовый")

См. также

Просмотр модели с помощью средства просмотра Microsoft Naive Bayes
Вкладка "Атрибутная дискриминация" (обозреватель моделей Data Mining)
Вкладка "Профили атрибутов" (средство просмотра моделей интеллектуального анализа данных)
Вкладка "Характеристики атрибутов" (Просмотрщик моделей анализа данных)
Вкладка "Сетевые зависимости" (Просмотрщик моделей интеллектуального анализа)