Поделиться через


Обучение модели

Важно!

Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.

Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.

Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.

Обучает модель классификации или регрессии по методу обучения с учителем

категория: Машинное обучение/обучение

Примечание

применимо к: только Машинное обучение Studio (классическая модель)

Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.

Обзор модуля

в этой статье описывается, как использовать модуль обучения модели в Машинное обучение Studio (классическая модель) для обучения модели классификации или регрессии. Обучение выполняется после определения модели и установки ее параметров. Также требуется наличие данных с тегами. Модуль Обучение модели можно также использовать для повторного обучения существующей модели с новыми данными.

Принцип работы процесса обучения

в Машинное обучение создание и использование модели машинного обучения обычно выполняется в три этапа.

  1. Необходимо настроить модель, выбрав определенный тип алгоритма и определив ее параметры или гиперпараметры. Выберите любой из следующих типов моделей:

    • Модели классификации, основанные на нейронных сетях, деревьях принятия решений, лесах принятия решений и других алгоритмах.
    • Модели регрессии, которые могут включать стандартную линейную регрессию или использовать другие алгоритмы, включая нейронные сети и байсиан регрессию.
  2. Предоставьте помеченный набор данных, который имеет данные, совместимые с алгоритмом. Подключите данные и модель к модулю Обучение модели.

    В каком формате создается конкретный двоичный формат, iLearner, который инкапсулирует статистические шаблоны, полученные из данных. Вы не можете напрямую изменять или читать этот формат. Тем не менее другие модули в студии (классическая модель) могут использовать эту обученную моделью.

    Вы также можете просматривать свойства модели. Дополнительные сведения см. в разделе " результаты ".

  3. После завершения обучения используйте обученную модель с одним из модулей оценки, чтобы создать прогнозы на основе новых данных.

Примечание

Для других специализированных задач машинного обучения требуются различные методы обучения, а в Studio (классическая модель) — отдельные модули обучения для них. Например, обнаружение образов, кластеризация и аномалии детктион все используют пользовательские методы обучения. Обучение модели предназначено для использования только с моделями регрессии и классификации.

Защищенное и неконтролируемое обучение

Вы могли слышать, что вы слышали о контролируемом или неконтролируемом обучении . Обучение модели классификации или регрессии с помощью обучения модели является классическим примером защищенного машинного обучения. Это означает, что необходимо предоставить набор данных, содержащий исторические данные, из которых будут изучены закономерности. Данные должны содержать как результат (метку), которые вы пытаетесь спрогнозировать, так и связанные факторы (переменные). В модели машинного обучения нужны результаты для определения функций, которые лучше предсказать результаты.

В процессе обучения данные сортируются по результатам, а алгоритм извлекает статистические шаблоны для построения модели.

Неконтролируемое обучение указывает либо на то, что результат неизвестен, либо если вы решили не использовать известные метки. Например, алгоритмы кластеризации обычно используют неконтролируемые методы обучения, но могут использовать метки, если они доступны. Еще один пример — моделирование разделов с помощью Lda. Вы не можете использовать модель обучения с этими алгоритмами.

Совет

Не знакомы с машинным обучением? В этом руководстве описывается процесс получения данных, настройки алгоритма, обучения и использования модели. Создание первого эксперимента машинного обучения

Использование модели обучения

  1. в Машинное обучение Studio (классическая модель) настройте модели классификации или модели регрессии .

    Вы также можете обучить пользовательскую модель, созданную с помощью команды создать модель R.

  2. Добавьте модуль обучение модели в эксперимент. Этот модуль можно найти в категории Машинное обучение. Раскройте узел обучение, а затем перетащите модуль обучение модели в свой эксперимент.

  3. В левой части входных данных присоедините необученную модель. Прикрепите набор данных для обучения к правому вводу параметра Модель обучения.

    Набор данных для обучения должен содержать столбец меток. Все строки без меток игнорируются.

  4. В поле столбец меткищелкните запустить селектор столбцови выберите один столбец, содержащий результаты, которые модель может использовать для обучения.

    • Для решения проблем с классификацией столбец меток должен содержать либо категориальные, либо дискретные значения. Примеры могут включать оценку с ответами "да/нет", код или имя классификации заболеваний или группу по уровню доходов. Если выбрать некатегориальный столбец, модуль будет возвращать ошибку во время обучения.

    • Для проблем регрессии столбец метки должен содержать числовые данные, которые представляют переменную ответа. В идеале числовые данные представляют числовую шкалу.

    В качестве примера можно привести оценку кредитного риска, прогнозируемое время на отказ для жесткого диска или прогнозируемое количество звонков в центр обработки вызовов для заданного дня или времени. Если не выбрать числовой столбец, может появиться сообщение об ошибке.

    • если не указать, какой столбец меток следует использовать, Машинное обучение попытается определить, какой столбец будет соответствовать столбцу меток, используя метаданные набора данных. Если вы выбрали неправильный столбец, используйте селектор столбцов, чтобы исправить его.

    Совет

    Если при использовании селектора столбцов возникают проблемы, просмотрите советы в статье Выбор столбцов в наборе данных. В ней описаны некоторые распространенные сценарии и советы по использованию параметров WITH RULES (С правилами) и По имени.

  5. Запустите эксперимент. Если у вас много данных, это может занять некоторое время.

Результаты

После обучения модели выполните следующие действия:

  • Чтобы просмотреть параметры модели и весовые коэффициенты функций, щелкните правой кнопкой мыши выходные данные и выберите визуализировать.

  • Чтобы использовать модель в других экспериментах, щелкните правой кнопкой мыши модель и выберите сохранить модель. Введите имя модели.

    При этом модель сохраняется в виде моментального снимка, который не обновляется повторными запусками эксперимента.

  • Чтобы использовать модель для прогнозирования новых значений, подключите ее к модулю Оценка модели вместе с новыми входными данными.

Если необходимо обучить тип модели, не поддерживаемый обучением модели, существует несколько вариантов:

  • Создайте настраиваемый метод оценки с помощью скрипта R или воспользуйтесь одним из множества доступных пакетов оценки R.

  • Напишите собственный скрипт Python для обучения и оценки модели или используйте существующую библиотеку Python:

  • Модели обнаружения аномалий

  • Модели рекомендаций

    • если в вашей модели используется рекомендация Matchbox, предоставляемая в Машинное обучение, используйте модуль рекомендации по обучению Matchbox .

    • Если вы используете другой алгоритм анализа потребительской корзины или рекомендации, используйте его методы обучения в скрипте R или в скрипте Python.

  • Модели кластеризации

Примеры

Примеры использования модуля обучение модели в экспериментах машинного обучения см. в следующих экспериментах в Коллекция решений ии Azure:

Ожидаемые входные данные

Имя Тип Описание
Необученная модель Интерфейс ILearner Необученный ученик
Dataset Таблица данных Данные для обучения

Параметры модуля

Имя Диапазон Тип По умолчанию Описание
Столбец метки any Выбор столбцов Выберите столбец, который содержит столбец метки или столбец результата

Выходные данные

Имя Тип Описание
Обученная модель Интерфейс ILearner Обученный ученик

Исключения

Список всех ошибок модуля см. в разделе коды ошибок модуля.

Исключение Описание
Ошибка 0032 Исключение возникает, если аргумент не является числом.
Ошибка 0033 Исключение возникает, если аргумент — бесконечность.
Ошибка 0083 Исключение возникает, если набор данных, используемый для обучения, не может применяться для определенного типа ученика.
Ошибка 0035 Исключение возникает, если для данного пользователя или элемента не были предоставлены какие-либо признаки.
Ошибка 0003 Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты.
Ошибка 0020 Исключение возникает, если количество столбцов в некоторых наборах данных, переданных модулю, слишком мало.
Ошибка 0021 Исключение возникает, если количество строк в некоторых наборах данных, переданных модулю, слишком мало.
Ошибка 0013 Исключение возникает, если модулю передан обучаемый недопустимого типа.

См. также раздел

Анализ модели
Список модулей в алфавитном порядке