Компонент многоклассовой логистической регрессии

В этой статье описывается компонент в конструкторе машинного обучения Azure.

Этот компонент используется для создания модели логистической регрессии, которую можно использовать для прогнозирования нескольких значений.

Классификация с применением логистической регрессии является методом управляемого обучения и, следовательно, требует размеченного набора данных. Обучение модели осуществляется путем предоставления модели и размеченного набора данных в качестве входных данных для компонента, такого как Обучение модели. Обученную модель затем можно использовать для прогнозирования новых примеров входных данных.

Машинное обучение Azure также предоставляет компонент двухклассовой логистической регрессии, который подходит для классификации двоичных или дихотомических переменных.

О мультиклассовой логистической регрессии

Логистическая регрессия — это известный статистический метод, который используется для прогнозирования вероятности результата и широко применяется в задачах классификации. Алгоритм прогнозирует вероятность возникновения события путем подгонки данных логистической функции.

В мультиклассовой логистической регрессии классификатор можно использовать для прогнозирования нескольких результатов.

Настройка мультиклассовой логистической регрессии

  1. Добавьте компонент Многоклассовая логистическая регрессия в конвейер.

  2. Укажите, как должна быть обучена модель, установив параметр Создать режим учителя.

    • Одиночный параметр. Используйте этот вариант, если вы знаете, как хотите настроить модель, и предоставьте определенный ряд значений в качестве аргументов.

    • Диапазон параметров. Используйте этот вариант, если вы не знаете наилучшие параметры и хотите выполнить вариацию параметров. Выберите диапазон значений для итерации, а Настройка гиперпараметров модели выполнит итерацию по всем возможным сочетаниям указанных параметров, чтобы определить гиперпараметры, которые приводят к оптимальным результатам.

  3. Отклонение оптимизации. Укажите пороговое значение для конвергенции оптимизатора. Если улучшение между итерациями меньше, чем пороговое значение, алгоритм прекращает работу и возвращает текущую модель.

  4. Вес регуляризации L1, вес регуляризации L2. Введите значение, которое будет использоваться для параметров регуляризации L1 и L2. Для обоих параметров рекомендуется использовать ненулевое значение.

    Регуляризация — это метод предотвращения образования лжевзаимосвязей за счет применения штрафных коэффициентов к моделям с предельными значениями. Регуляризация предполагает добавление штрафа, связанного со значениями коэффициентов, к погрешности гипотезы. К точной модели с предельными коэффициентами будет применен больший штраф. При этом для менее точной модели с более приемлемыми значениями штраф будет меньше.

    Регуляризации L1 и L2 отличаются результатами и способом применения. L1 можно применять к разреженным моделям, что удобно при работе с многомерными данными. L2, напротив, предпочтительнее использовать для неразреженных данных. Этот алгоритм поддерживает линейное сочетание значений регуляризации L1 и L2. Это означает, что, если x = L1 и y = L2, ax + by = c определяет линейный диапазон терминов регуляризации.

    Для моделей логистической регрессии, например, регуляризации эластичной сети, были применены различные линейные сочетания терминов L1 и L2.

  5. Начальное число случайных чисел. Введите целочисленное значение, которое будет использоваться в качестве начального значения для алгоритма, если необходимо, чтобы результаты были повторяемыми между выполнениями. В противном случае в качестве начального значения используется значение системных часов, что может привести к несколько различным результатам в выполнении того же конвейера.

  6. Подключите размеченный набор данных и обучите модель:

    • Если для параметра Создать режим учителя задано значение Одиночный параметр, подключите помеченный набор данных и компонент Обучение модели.

    • Если для параметра Создать режим учителя выбран вариант Диапазон параметров, подключите набор помеченных данных и обучите модель с помощью модуля Настройка гиперпараметров модели.

    Примечание

    При передаче диапазона параметров в модуль Обучение модели используется только значение по умолчанию в списке с одиночным параметром.

    Если передать в компонент Настройка гиперпараметров модели один набор значений параметров, когда он ожидает диапазон для каждого параметра, он пропускает эти значения и использует значения по умолчанию для обучаемого объекта.

    Если выбран вариант Диапазон параметров и указано одно значение для любого параметра, это единственное заданное значение будет использоваться во время подбора параметров, даже если другие параметры меняются в диапазоне значений.

  7. Отправьте конвейер.

Дальнейшие действия

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.