Начало работы с классификацией изображений в Azure

Завершено

Классификацию изображений можно выполнять с помощью azure AI Пользовательское визуальное распознавание, доступной в рамках предложений служб ИИ Azure. Это, как правило, проще и быстрее, чем писать собственный код обучения модели, и позволяет создавать эффективное решение для классификации изображений даже людям с небольшим опытом машинного обучения или без него.

Ресурсы Azure для azure AI Пользовательское визуальное распознавание

Создание решения для классификации изображений с помощью Azure AI Пользовательское визуальное распознавание состоит из двух основных задач. Сначала необходимо обучить модель с помощью существующих изображений, а затем опубликовать модель, чтобы клиентские приложения могли использовать ее для создания прогнозов.

Для выполнения каждой из этих задач требуется ресурс в подписке Azure. Можно использовать следующие типы ресурсов.

  • Пользовательское визуальное распознавание: выделенный ресурс для службы пользовательского визуального распознавания, который может быть учебным, прогнозом или обоими ресурсами.
  • Службы ИИ Azure: общий ресурс, включающий azure AI Пользовательское визуальное распознавание вместе со многими другими службами ИИ Azure. Этот тип ресурса можно использовать для обучения, прогнозирования или и того, и другого.

Разделение ресурсов обучения и прогнозирования удобно тогда, когда вы хотите отслеживать применение ресурсов для обучения модели отдельно от клиентских приложений, использующих эту модель для прогнозирования классов изображений. Однако оно может сделать разработку решения классификации изображений немного запутанной.

Самый простой подход — использовать общий ресурс служб искусственного интеллекта Azure для обучения и прогнозирования. То есть вам нужно учитывать только одну конечную точку (HTTP-адрес, по которому размещена служба) и ключ (секретное значение, используемое клиентскими приложениями для проверки подлинности).

Если вы решите создать ресурс Пользовательского визуального распознавания, вам будет предложено выбрать, для чего он создается — для обучения, прогнозирования или для обеих целей. Важно отметить, что если вы выберете обе цели, то будут созданы два ресурса — один для обучения, другой для прогнозирования.

Кроме того, можно использовать подход с сочетанием и сопоставлением, в котором вы используете выделенный Пользовательское визуальное распознавание ресурс для обучения, но развертываете модель в ресурсе служб искусственного интеллекта Azure для прогнозирования. Чтобы это работало, ресурсы для обучения и прогнозирования должны быть созданы в одном регионе.

Обучение модели

Чтобы обучить модель классификации, необходимо отправить изображения в ресурс обучения и пометить их соответствующими метками класса. Затем вы должны обучить модель и оценить результаты обучения.

Эти задачи можно выполнять на портале Пользовательское визуальное распознавание или при наличии необходимых возможностей для написания кода, которые можно использовать в одном из пакетов средств разработки программного обеспечения на языке программирования для служб azure Пользовательское визуальное распознавание.

Один из ключевых аспектов при использовании изображений для классификации состоит в том, что у вас должно быть достаточное количество изображений рассматриваемых объектов, и эти изображения должны показывать объект под разными углами.

Оценка модели

Процесс обучения модели — это итеративный процесс, в котором служба искусственного интеллекта Azure Пользовательское визуальное распознавание неоднократно обучает модель с помощью некоторых данных, но держит некоторые обратно для оценки модели. В конце процесса обучения производительность обученной модели определяется следующими метриками оценки.

  • Точность: какой процент прогнозов класса, сделанных моделью? Например, если модель спрогнозировала, что десять изображений являются оранжевыми, из которых оранжевыми на самом деле были восемь, то точность равна 0,8 (80 %).
  • Помните: какой процент прогнозов классов правильно определила модель? Например, если модель обнаружила семь из десяти изображений яблока, то полнота составит 0,7 (70 %).
  • Средняя точность (AP): общая метрика, которая учитывает как точность, так и отзыв.

Использование модели для прогнозирования

После обучения модели и оценки ее производительности можно опубликовать модель в ресурсе прогнозирования. При публикации модели ей можно присвоить имя (значение по умолчанию — "IterationX", где X — это количество циклов обучения модели).

Чтобы разработчики клиентских приложений могли использовать вашу модель, им требуются следующие сведения.

  • Идентификатор проекта: уникальный идентификатор проекта Пользовательское визуальное распознавание, созданного для обучения модели.
  • Имя модели: имя, назначенное модели во время публикации.
  • Конечная точка прогнозирования — HTTP-адрес конечных точек для ресурса прогнозирования, в котором была опубликована модель (не учебного ресурса).
  • Ключ прогнозирования — ключ проверки подлинности для ресурса прогнозирования, в котором была опубликована модель (не учебного ресурса).