Упражнение. Обучение модели машинного обучения

Завершено

Вы собрали данные с датчиков на производственном оборудовании компании. Часть оборудования работоспособна, часть — нет. Теперь вы хотите использовать Model Builder, чтобы обучить модель машинного обучения, которая будет прогнозировать сбои. Используя машинное обучение для автоматизации мониторинга этих устройств, можно значительно сэкономить благодаря своевременному обслуживанию.

Добавление нового элемента "Модель машинного обучения (ML.NET)"

Чтобы начать процесс обучения, необходимо добавить новый элемент Модель машинного обучения (ML.NET) в новое или существующее приложение .NET.

Создание библиотеки классов C#

Так как вы начинаете с нуля, создайте новый проект библиотеки классов C#, в который будет добавлена модель машинного обучения.

  1. Запустите среду Visual Studio.

  2. В окне "Пуск" выберите Создать проект.

  3. В диалоговом окне Создание проекта в строке поиска введите библиотека классов.

  4. В списке вариантов выберите пункт Библиотека классов. Убедитесь, что выбран язык C#, и нажмите кнопку Далее.

    Screenshot that shows selections for creating a class library project.

  5. В поле Имя проекта введите PredictiveMaintenance. Оставьте значения по умолчанию для остальных полей и нажмите Далее.

  6. Выберите .NET 6.0 (предварительная версия) в раскрывающемся списке Платформа и щелкните Создать, чтобы сформировать шаблон библиотеки классов C#.

Добавление машинного обучения в проект

Когда проект библиотеки классов откроется в Visual Studio, добавьте в него машинное обучение.

  1. В обозревателе решений Visual Studio щелкните проект правой кнопкой мыши.

  2. Выберите Добавить>Модель машинного обучения.

    Screenshot that shows selections for adding a machine learning model to a project.

  3. В диалоговом окне Добавление нового элемента выберите Модель машинного обучения (ML.NET).

  4. В поле Имя введите PredictiveMaintenanceModel.mbconfig для модели и выберите Добавить.

    Screenshot that shows selections for creating a model.

Через несколько секунд файл PredictiveMaintenanceModel.mbconfig будет добавлен в проект.

Выбор сценария

При первом добавлении модели машинного обучения в проект откроется экран Model Builder. Теперь пора выбрать сценарий.

Вы пытаетесь определить, произошел ли отказ оборудования. Так как существует только два варианта и вы хотите определить, в каком состоянии находится оборудование, выберите сценарий классификации данных.

На этапе Сценарий на экране Model Builder выберите сценарий Классификация данных. Выбрав этот сценарий, вы сразу переходите на экран Среда.

Screenshot that shows selections for choosing the data classification scenario.

Выбор среды

Для сценариев классификации данных поддерживаются только локальные среды, использующие ЦП.

  1. На этапе Среда на экране Model Builder по умолчанию выбран вариант Локальная (ЦП). Оставьте среду по умолчанию.
  2. Нажмите Следующий этап.

Screenshot that shows selections for choosing a local compute training environment.

Загрузка и подготовка данных

Теперь, когда вы выбрали сценарий и среду обучения, пришло время загрузить и подготовить собранные данные с помощью Model Builder.

Подготовка данных

  1. Откройте файл в текстовом редакторе выбранного варианта.

  2. Имена исходных столбцов содержат специальные символы квадратной скобки. Чтобы избежать проблем с анализом данных, удалите специальные символы из имен столбцов.

    Исходный заголовок:

    UDI,Product ID,Type,Air temperature [K],Process temperature [K],Rotational speed [rpm],Torque [Nm],Tool wear [min],Machine failure,TWF,HDF,PWF,OSF,RNF

    Обновленный заголовок:

    UDI,Product ID,Type,Air temperature,Process temperature,Rotational speed,Torque,Tool wear,Machine failure,TWF,HDF,PWF,OSF,RNF

  3. Сохраните файл ai4i2020.csv с вашими изменениями.

Выбор типа источника данных.

Набор данных прогнозного обслуживания представляет собой CSV-файл.

На этапе Данные на экране Model Builder выберите значение Файл (CSV, TSV, TXT) для параметра Тип источника данных.

Указание местоположения данных.

Нажмите кнопку Обзор и используйте проводник, чтобы указать расположение набора данных ai4i2020.csv.

Выбор столбца метки

Выберите Отказ оборудования из раскрывающегося списка Столбец для прогнозирования (метка).

Screenshot that shows loading a predictive maintenance C S V file dataset.

Выбор расширенных параметров данных

По умолчанию все столбцы, не являющиеся меткой, используются в качестве признаков. Некоторые столбцы содержат избыточные сведения, а другие не предоставляют данные для прогноза. Используйте дополнительные параметры данных, чтобы проигнорировать эти столбцы.

  1. Выберите Расширенные параметры данных.

  2. В диалоговом окне Расширенные параметры данных перейдите на вкладку Параметры столбцов.

    Screenshot that shows configuring advanced data options for the predictive maintenance dataset.

  3. Настройте параметры столбца следующим образом:

    Столбцы Цель Тип данных Категориальный
    UDI Пропустить Одна
    Код продукта Возможность Строка
    Тип Возможность Строка X
    Температура воздуха Возможность Одна
    Температура процесса Возможность Одна
    Скорость вращения Возможность Одна
    Крутящий момент Возможность Одна
    Износ инструмента Возможность Одна
    Отказ оборудования Label Одна X
    TWF Пропустить Одна X
    HDF Пропустить Одна X
    PWF Пропустить Одна X
    OSF Пропустить Одна X
    RNF Пропустить Одна X
  4. Выберите Сохранить.

  5. На этапе Данные на экране Model Builder выберите Следующий этап.

Обучение модели

Используйте Model Builder и AutoML для обучения модели.

Установка времени обучения

Model Builder автоматически задает продолжительность обучения в зависимости от размера файла. В этом случае, чтобы помочь Model Builder исследовать больше моделей, увеличьте значение времени обучения.

  1. На этапе Обучение на экране Model Builder задайте для параметра Время обучения (в секундах) значение 30.
  2. Выберите Обучать.

Отслеживание процесса обучения

Screenshot that shows where to track training of the predictive maintenance classification model.

Когда процесс обучения начнется, Model Builder исследует различные модели. Процесс обучения отслеживается в результатах обучения и в окне вывода Visual Studio. В результатах обучения содержатся сведения об оптимальной модели, которая была найдена в процессе обучения. Окно вывода содержит подробные сведения, такие как имя используемого алгоритма, время, затраченное на обучение, и метрики производительности для этой модели.

Вы можете заметить, что одно и то же название алгоритма встречается несколько раз. Это связано с тем, что Model Builder пробует не только разные алгоритмы, но и разные конфигурации гиперпараметров для этих алгоритмов.

Оценка модели

Используйте метрики оценки и данные, чтобы проверить, насколько хорошо работает модель.

Проверка модели

На этапе Оценка на экране Model Builder можно просмотреть метрики и алгоритмы оценки, выбранные для лучшей модели. Помните, что ваши результаты могут отличаться от результатов в этом модуле, так как выбранный алгоритм и параметры могут быть другими.

Тестирование модели

В разделе Тестирование модели на этапе Оценка можно указать новые данные и оценить результаты прогноза.

Screenshot that shows making predictions with your trained model.

В разделе Образец данных можно указать входные данные для модели, чтобы делать прогнозы. Каждое поле соответствует столбцам, используемым для обучения модели. Это удобный способ проверки правильности работы модели. По умолчанию Model Builder предварительно заполняет первую строку из набора данных.

Давайте проверим модель, чтобы определить, выдает ли она ожидаемые результаты.

  1. В разделе Образец данных введите следующие данные: Они поступают из строки в наборе данных с идентификатором UID 161.

    Столбец Значение
    Код продукта L47340
    Тип L
    Температура воздуха 298,4
    Температура процесса 308,2
    Скорость вращения 1282
    Крутящий момент 60,7
    Износ инструмента 216
  2. Выберите Прогноз.

Оценка результатов прогноза

В разделе Результаты отображается прогноз, сделанный моделью, и уровень достоверности этого прогноза.

В столбце Отказ оборудования с идентификатором UID 161 в наборе данных указано значение 1. Это совпадает с прогнозируемым значением с наибольшим уровнем достоверности в разделе Результаты.

Если хотите, продолжите работу с моделью, вводя различные данные и оценивая сделанные прогнозы.

Поздравляем! Вы обучили модель для прогнозирования отказа оборудования. В следующем уроке вы узнаете об использовании модели.