Двухклассовая машина опорных векторов

Создает модель двоичной классификации с помощью алгоритма машины опорных векторов.

категория: Машинное обучение/инициализация модели или классификации

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль одноклассового компьютера поддержки двух классов в Машинное обучение Studio (классическая модель) для создания модели, основанной на алгоритме на основе вектора поддержки.

Методы опорных векторов (SVM) — это хорошо исследованный класс методов контролируемого обучения. Эта конкретная реализация подходит для прогнозирования двух возможных результатов на основе непрерывных или категорийных переменных.

Определив параметры модели, обучить модель с помощью одного из обучающих модулейи предоставив набор данных с тегами , включающий столбец меток или результатов.

Дополнительные сведения о поддержке векторных компьютеров

Методы опорных векторов принадлежат к самым первым алгоритмам машинного обучения, а модели по этому методу использовались во многих сценариях — от получения информации до классификации текста и изображений. Методы опорных векторов можно использовать для задач классификации и регрессии.

Эта модель SVM является моделью контролируемого обучения, которая требует наличия размеченных данных. В процессе обучения алгоритм анализирует входные данные и распознает закономерности в многомерном пространстве, именуемом гиперплоскостью. Все входные примеры представлены в этом пространстве в виде точек и сопоставлены с выходными категориями таким образом, чтобы категории были разделены максимально широкими и четкими зазорами.

Для прогнозирования алгоритм SVM назначает новые примеры в одной или другой категории, сопоставляя их в одну и ту же область.

Настройка Two-Class поддержки векторной машины

Для этого типа модели рекомендуется нормализовать набор данных перед его использованием для обучения классификатора.

Добавьте модуль для работы с двумя классами, поддерживающий Векторный компьютер , в эксперимент в студии (классическая модель).
Укажите, как вы хотите обучать модель, выбрав значение Создать режим учителя.
- Одиночный параметр: если вы знаете, как хотите настроить модель, можете предоставить определенный ряд значений в качестве аргументов.
- Диапазон параметров. Если вы не знаете наилучших параметров, оптимальные параметры можно найти, указав несколько значений, и с помощью модуля настройки модели настройте модель , чтобы найти оптимальную конфигурацию. Преподаватель выполняет перебор нескольких сочетаний параметров и определяет сочетание значений, которые создают лучшую модель.
Для параметра Число итераций введите число, которое обозначает количество итераций, используемых при построении модели.

Этот параметр можно использовать для достижения компромисса между скоростью обучения и его точностью.
Для параметра Lambda укажите значение для использования в качестве веса для регуляризации L1.

Это коэффициент регуляризации, который можно использовать для настройки модели. Большие значения ведут к ухудшению более сложных моделей.
Выберите параметр Нормализация функций, если требуется нормализовать функции перед обучением.

Если применяется нормализация, перед обучением точки данных центрируются в среднем значении и масштабируются таким образом, чтобы иметь одну единицу стандартного отклонения.
Для нормализации коэффициентов выберите пункт Проекция на сферу единиц.

Проецирование значений в пространство единиц означает, что перед обучением точки данных центрируются в точке 0 и масштабируются таким образом, чтобы иметь одну единицу стандартного отклонения.
В окне Начальное значение случайного числа введите целое значение, которое будет использоваться в качестве начального значения, если вы хотите обеспечить воспроизводимость между выполнениями. В противном случае в качестве начального значения используется значение системных часов, что может привести к несколько различным результатам между выполнениями.
Выберите параметр Разрешить неизвестную категорию, чтобы создать группу для неизвестных значений в обучающих или проверочных наборах. В этом случае модель может быть менее точной для известных значений, но она может предоставлять лучшие прогнозы для новых (неизвестных) значений.

Если отменить его выбор, модель сможет принимать только значения, содержащиеся в данных для обучения.
Подключение помеченный набор данных и один из обучающих модулей:
- Если для параметра Создать режим учителя задано значение Одиночный параметр, используйте модуль Обучение модели.
- Если для параметра создать режим инструктора задать значение диапазон параметров, используйте Параметры настройки модели.
Примечание

Если вы передали диапазон параметров для обучения модели, будет использоваться только первое значение из списка диапазонов параметров.

Если передать один набор значений параметров в модуль настройки модели Настройка , когда он ожидает диапазон параметров для каждого параметра, он игнорирует значения и использует значения по умолчанию для средства обучения.

Если выбрать параметр диапазон параметров и ввести одно значение для любого параметра, это единственное значение, которое вы указали, будет использоваться во время очистки, даже если другие параметры меняются в диапазоне значений.
Запустите эксперимент.

Результаты

После завершения обучения:

Чтобы просмотреть сводку по параметрам модели, а также весовые коэффициенты функций, полученные в ходе обучения, щелкните правой кнопкой мыши выходные данные « обучение модели » или « Настройка модели» и выберите « визуализировать».
Чтобы использовать обученные модели для создания прогнозов, подключите обученную модель к модулю Оценка модели .
Чтобы выполнить перекрестную проверку для набора данных с меткой, подключите обученную модель и набор данных для перекрестной проверки модели.

Примеры

Примеры использования этого алгоритма обучения см. в Коллекция решений ии Azure:

Прямой маркетинг: использует модель SVM для классификации клиентов по стремления.
Прогнозирование кредитных рисков. использует SVM для оценки кредитного риска.
Сравнить многоклассовые классификаторы: использует модель SVM для распознавания рукописного текста.

Технические примечания

В этом разделе содержатся сведения о реализации, советы и ответы на часто задаваемые вопросы.

Советы по использованию

Несмотря на то, что в ходе последних исследований разработаны более точные алгоритмы, этот алгоритм отлично подходит для простых наборов данных в случаях, когда главным приоритетом является скорость, а не точность. Если, использовав двухклассовую модель опорных векторов, вы не получили нужных результатов, воспользуйтесь одним из следующих методов классификации:

Мультиклассовая регрессионная логистическая модель
Two-Class Boosted Decision Tree (Двухклассовое увеличивающееся дерево принятия решений);

Параметры модуля

Имя	Диапазон	Тип	По умолчанию	Описание
Число итераций	>= 1	Целое число	1	Количество итераций
Lambda	>= double.Epsilon	Тип с плавающей запятой	0,001	Весовой коэффициент регуляризации L1. Использование ненулевого значения позволяет избежать лжевзаимосвязей модели в обучающем наборе данных.
Функции нормализации	Любой	Логическое значение	True	Нормализовать функции, если значение равно true.
Проекция на единичную сферу	Любой	Логическое значение	Неверно	Проецировать функции на единичную окружность, если значение равно true.
Начальное значение случайного числа	Любой	Целое число		Начальное значение для генератора случайных чисел, используемого моделью. Чтобы использовать значение по умолчанию, оставьте это поле пустым.
Разрешить неизвестные категориальные уровни	Любой	Логическое значение	True	Если значение равно True, создается дополнительный уровень для каждого категориального столбца. Все уровни в тестовом наборе данных, недоступные в обучающем наборе, сопоставляются с этим дополнительным уровнем.

Выходные данные

Имя	Тип	Описание
Необученная модель	Таблица данных	Необученная модель двоичной классификации.

См. также раздел

Классификация
Список модулей в алфавитном порядке

Last updated on 2019-05-06