Поделиться через


Изучение модели упрощенного алгоритма Байеса (учебник по интеллектуальному анализу данных — начальный уровень)

 

Применимо к: SQL Server 2016 Preview

Microsoft Упрощенный алгоритм Байеса предоставляет несколько методов отображения взаимодействия между покупкой велосипедов и входными атрибутами.

Microsoft Байеса содержит следующие вкладки для исследования моделей интеллектуального анализа данных упрощенного алгоритма Байеса:

Сеть зависимостей

Профили атрибутов

Характеристики атрибута

Сравнение атрибутов

Сеть зависимостей

Сеть зависимостей Вкладка работает так же, как Сеть зависимостей вкладке Microsoft средство просмотра деревьев. Каждый из узлов в средстве просмотра отображает атрибут, а линии между узлами представляют связи. В средстве просмотра показаны все атрибуты, влияющие на состояние прогнозируемого атрибута «Покупатель велосипеда».

Исследование модели на вкладке «Сеть зависимостей»

  1. Используйте модель интеллектуального анализа данных списка в верхней части средство просмотра модели интеллектуального анализа для перехода к TM_NaiveBayes модели.

  2. Используйте просмотра список, чтобы переключиться в Байеса Майкрософт.

  3. Щелкните Bike Buyer узла для определения его зависимостей.

    Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.

  4. Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.

    По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Покупатель велосипеда]. Регулировка ползунка поможет выяснить, что наибольшее значение имеют такие атрибуты, как число автомобилей во владении, расстояние до работы и общее количество детей.

В начало

Профили атрибутов

Профили атрибутов вкладку описывает, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.

Исследование модели на вкладке «Профили атрибутов»

  1. В прогнозируемый Убедитесь, что Bike Buyer выбран.

  2. Если обозначения интеллектуального анализа данных блокирует отображение атрибут профилей, переместите его в сторону.

  3. В гистограммы выберите 5.

    В нашей модели значение 5 — это максимальное количество состояний для любой одной переменной.

    Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.

  4. В атрибуты столбец, найти Число машин во владении. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.

  5. Дважды щелкните Число машин во владении ячейки в столбце покупателя велосипеда столбец (столбец с меткой 1).

    Обозначения интеллектуального анализа данных более подробные сведения.

В начало

Характеристики атрибута

С Характеристики атрибута вкладке можно выбрать атрибут и значение, чтобы узнать, как часто отображаются значения для других атрибутов в вхождениях выбранного значения.

Исследование модели на вкладке «Характеристики атрибута»

  1. В атрибута Убедитесь, что Bike Buyer выбран.

  2. Задайте значение для 1.

    В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.

В начало

Сравнение атрибутов

С Сравнение атрибутов вкладке можно изучать связь между двумя дискретными значениями покупателей велосипеда и другими значениями атрибутов. Поскольку TM_NaiveBayes модель содержит только два состояния, 1 и 0, не нужно вносить изменения в средстве просмотра.

В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.

Связанные задачи

В следующих разделах для изучения модели интеллектуального анализа данных.

Следующее занятие

Занятие 5: Тестирование моделей ( Учебник по основам интеллектуального анализа данных )

Предыдущая задача занятия

Изучение модели кластеризации ( Учебник по основам интеллектуального анализа данных )

См. также:

Просмотр модели с помощью средства просмотра упрощенного алгоритма Байеса (Майкрософт)
Вкладка "Сравнение атрибутов" (средство просмотра моделей интеллектуального анализа данных)
Вкладка "Профили атрибутов" (средство просмотра моделей интеллектуального анализа данных)
Вкладка "Характеристики атрибутов" (средство просмотра моделей интеллектуального анализа данных)
Вкладка "Сеть зависимостей" (средство просмотра моделей интеллектуального анализа данных)