Компонент двухклассового метода опорных векторов

В этой статье описывается компонент в конструкторе Машинного обучения Azure.

С помощью этого компонента можно создать модель, основанную на алгоритме метода опорных векторов.

Методы опорных векторов (SVM) — это хорошо исследованный класс методов контролируемого обучения. Эта конкретная реализация подходит для прогнозирования двух возможных результатов на основе непрерывных или категорийных переменных.

После определения параметров модели обучайте модель, используя обучающие компоненты и предоставляя набор данных с тегами, включающий столбец меток или результатов.

О методах опорных векторов

Методы опорных векторов принадлежат к самым первым алгоритмам машинного обучения, а модели по этому методу использовались во многих сценариях — от получения информации до классификации текста и изображений. Методы опорных векторов можно использовать для задач классификации и регрессии.

Эта модель SVM является моделью контролируемого обучения, которая требует наличия размеченных данных. В процессе обучения алгоритм анализирует входные данные и распознает закономерности в многомерном пространстве, именуемом гиперплоскостью. Все входные примеры представлены в этом пространстве в виде точек и сопоставлены с выходными категориями таким образом, чтобы категории были разделены максимально широкими и четкими зазорами.

Для прогнозирования алгоритм SVM назначает новые примеры в одной или другой категории, сопоставляя их в одну и ту же область.

Порядок настройки

Для этого типа модели рекомендуется нормализовать набор данных перед его использованием для обучения классификатора.

  1. Добавьте в конвейер компонент двухклассового метода опорных векторов.

  2. Укажите, как вы хотите обучать модель, выбрав значение Создать режим учителя.

    • Одиночный параметр: если вы знаете, как хотите настроить модель, можете предоставить определенный ряд значений в качестве аргументов.

    • Диапазон параметров: если вы не знаете наилучшие параметры, оптимальные варианты можно найти с помощью компонента Настройка гиперпараметров модели. Вы предоставляете некоторый диапазон значений, и учитель выполняет итерацию по нескольким сочетаниям параметров, чтобы определить сочетание значений, которое дает наилучший результат.

  3. Для параметра Число итераций введите число, которое обозначает количество итераций, используемых при построении модели.

    Этот параметр можно использовать для достижения компромисса между скоростью обучения и его точностью.

  4. Для параметра Lambda укажите значение для использования в качестве веса для регуляризации L1.

    Это коэффициент регуляризации, который можно использовать для настройки модели. Большие значения ведут к ухудшению более сложных моделей.

  5. Выберите параметр Нормализация функций, если требуется нормализовать функции перед обучением.

    Если применяется нормализация, перед обучением точки данных центрируются в среднем значении и масштабируются таким образом, чтобы иметь одну единицу стандартного отклонения.

  6. Для нормализации коэффициентов выберите пункт Проекция на сферу единиц.

    Проецирование значений в пространство единиц означает, что перед обучением точки данных центрируются в точке 0 и масштабируются таким образом, чтобы иметь одну единицу стандартного отклонения.

  7. В окне Начальное значение случайного числа введите целое значение, которое будет использоваться в качестве начального значения, если вы хотите обеспечить воспроизводимость между выполнениями. В противном случае в качестве начального значения используется значение системных часов, что может привести к несколько различным результатам между выполнениями.

  8. Подключите размеченный набор данных и обучите модель:

    • Если для параметра Создать режим учителя задано значение Одиночный параметр, подключите помеченный набор данных и компонент Обучение модели.

    • Если для параметра Создать режим учителя выбран вариант Диапазон параметров, подключите набор помеченных данных и обучите модель с помощью модуля Настройка гиперпараметров модели.

    Примечание

    При передаче диапазона параметров в модуль Обучение модели используется только значение по умолчанию в списке с одиночным параметром.

    Если передать в компонент Настройка гиперпараметров модели один набор значений параметров, когда он ожидает диапазон для каждого параметра, он пропускает эти значения и использует значения по умолчанию для обучаемого объекта.

    Если выбран вариант Диапазон параметров и указано одно значение для любого параметра, это единственное заданное значение будет использоваться во время подбора параметров, даже если другие параметры меняются в диапазоне значений.

  9. Отправьте конвейер.

Результаты

После завершения обучения:

  • Чтобы сохранить моментальный снимок обученной модели, выберите вкладку Выходные данные на правой панели компонента Обучение модели. Щелкните значок Зарегистрировать набор данных, чтобы сохранить модель как компонент для повторного использования.

  • Чтобы использовать модель для оценки, добавьте компонент Модель оценки в конвейер.

Дальнейшие действия

Ознакомьтесь с набором доступных компонентов для Машинного обучения Azure.