Обзор вариантов для меток изображений

Завершено

Самый простой вариант для обнаружения объектов — использовать интерактивный интерфейс на портале Azure AI Пользовательское визуальное распознавание. Этот интерфейс автоматически предлагает области, содержащие объекты, которым можно назначить теги или настроить путем перетаскивания ограничивающего прямоугольника, чтобы присоединить объект к метке.

Кроме того, после добавления метки к исходному пакету изображений модель можно обучить. Последующие метки новых изображений могут использовать преимущества средства смарт-маркировщика на портале. Это средство может предлагать не только области, но и классы объектов, которые они содержат.

Кроме того, можно использовать средство для работы с метками, такое как в Студии машинного обучение Azure или Инструмент расстановки тегов в визуальных объектах Майкрософт (VOTT), чтобы воспользоваться преимуществами других функций (таких как назначение задач маркировки изображений нескольким членам группы).

Единицы измерения ограничивающего прямоугольника

Если вы решили использовать средство маркировки, отличное от портала Azure AI Пользовательское визуальное распознавание, может потребоваться настроить выходные данные в соответствии с единицами измерения, ожидаемыми API Пользовательское визуальное распознавание Azure AI. Ограничивающие прямоугольники определяются четырьмя значениями, представляющими левые (X) и верхние (Y) координаты верхнего левого угла ограничивающего прямоугольника, а также его ширину и высоту. Эти значения выражаются в виде пропорциональных значений относительно размера исходного изображения. Например, рассмотрим этот ограничивающий прямоугольник:

  • Слева: 0,1
  • Сверху: 0,5
  • Ширина: 0,5
  • Высота: 0,25

Это определяет поле, в котором значение слева находится 0,1 (одна десятая) от левого края изображения, а значение сверху — 0,5 (половина высоты изображения) сверху. Поле имеет половину ширины и четверть высоты всего изображения.

На приведенном ниже рисунке показаны сведения о метках для объектов на изображении в формате JSON.

An image with JSON labels for the objects it contains