Мультиклассовое увеличивающееся дерево принятия решений

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

Используйте этот компонент для создания модели машинного обучения, основанной на алгоритме усиленных деревьев принятия решений.

Дерево решений с усилением — это метод обучения ансамбля, в котором второе дерево исправляет ошибки первого дерева, третье дерево исправляет ошибки первого и второго деревьев и так далее. Прогнозы основаны на совокупности деревьев вместе.

Порядок настройки

Этот компонент создает необученную модель классификации. Поскольку классификация — это метод обучения с учителем, вам понадобится помеченный набор данных, который включает столбец метки со значением для всех строк.

Вы можете обучить этот тип модели, используя Модель обучения.

  1. Добавьте в конвейер компонент Мультиклассовое увеличивающееся дерево принятия решений.

  2. Укажите, как вы хотите обучать модель, выбрав параметр Создать режим учителя.

    • Одиночный параметр: Если вы знаете, как вы хотите настроить модель, вы можете предоставить определенный набор значений в качестве аргументов.

    • Диапазон параметров: Выберите этот вариант, если вы не уверены в лучших параметрах и хотите запустить анализ параметров. Выберите диапазон значений для итерации, и Настройка гиперпараметров модели перебирает все возможные комбинации заданных вами настроек, чтобы определить гиперпараметры, дающие оптимальные результаты.

  3. Максимальное количество листьев в дереве ограничивает максимальное количество конечных узлов (листьев), которые могут быть созданы в любом дереве.

    Увеличивая это значение, вы потенциально увеличиваете размер дерева и достигаете более высокой точности с риском переобучения и увеличения времени обучения.

  4. Минимальное количество выборок на листовой узел указывает количество случаев, необходимых для создания любого конечного узла (листа) в дереве.

    Увеличив это значение, вы увеличиваете пороговое значение для создания новых правил. Например, при использовании значения по умолчанию 1, даже один случай может привести к созданию нового правила. Если увеличить его до 5, для создания правила обучающие данные должны будут содержать не менее пяти вариантов.

  5. Скорость обучения определяет размер шага во время обучения. Введите число от 0 до 1.

    Скорость обучения определяет, насколько быстро или медленно ученик приходит к оптимальному решению. Если размер шага слишком велик, вы можете выйти за пределы оптимального решения. Если размер шага слишком мал, обучение займет больше времени, чтобы прийти к наилучшему решению.

  6. Количество созданных деревьев указывает общее количество деревьев решений, которые необходимо создать в ансамбле. Создавая больше деревьев принятия решений, вы можете потенциально получить большее покрытие, но время на обучение при этом увеличится.

  7. Начальное значение случайного числа необязательно задает неотрицательное целое число, которое будет использоваться в качестве значения случайного начального числа. Указание начального числа обеспечивает воспроизводимость для прогонов с одинаковыми данными и параметрами.

    Случайное начальное число по умолчанию равно 42. Последовательные прогоны с использованием разных случайных начальных чисел могут иметь разные результаты.

  8. Обучите модель:

    • Если для параметра Создать режим учителя задано значение Одиночный параметр, подключите помеченный набор данных и компонент Обучение модели.

    • Если для параметра Создать режим учителя выбран вариант Диапазон параметров, подключите набор помеченных данных и обучите модель с помощью модуля Настройка гиперпараметров модели.

    Примечание

    При передаче диапазона параметров в модуль Обучение модели используется только значение по умолчанию в списке с одиночным параметром.

    Если передать в компонент Настройка гиперпараметров модели один набор значений параметров, когда он ожидает диапазон для каждого параметра, он пропускает эти значения и использует значения по умолчанию для обучаемого объекта.

    Если выбран вариант Parameter Range (Диапазон параметров) и указано одно значение для любого параметра, это единственное заданное значение будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.

Дальнейшие действия

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.