Поделиться через


Обнаружение объектов

Обнаружение объекта похоже на добавление тегов, но в этом случае API возвращает координаты (в пикселях) прямоугольника, ограничивающего каждый найденный на изображении объект. Например, если изображение содержит собаку, кота и человека, операция обнаружения объектов перечисляет эти объекты с их координатами на изображении. Эту функциональность можно использовать, чтобы обрабатывать отношения между объектами на изображении. Кроме того, она позволяет определить, присутствуют ли на изображении несколько экземпляров одного объекта.

Функция обнаружения объектов применяет теги на основе объектов или живых объектов, определенных на изображении. Между таксономией тегов и таксономией обнаружения объектов не существует формальных связей. На концептуальном уровне функция обнаружения объектов находит только объекты и живые вещи, в то время как функция тега также может включать контекстные термины, такие как "помещение", которые нельзя локализовать с ограничивающими прямоугольниками.

Быстро и легко опробуйте возможности обнаружения объектов в браузере с помощью Vision Studio.

Пример обнаружения объектов

Следующий ответ JSON иллюстрирует, что API анализа изображений возвращает при обнаружении объектов в примере изображения.

Женщина с устройством Microsoft Surface на кухне

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Ограничения

Важно учесть ограничения функции обнаружения объектов, чтобы избежать влияния (или уменьшить его) ложных отрицательных результатов (пропущенных объектов) и ограниченных сведений.

  • Объекты обычно не обнаруживаются, если они небольшие (менее 5% изображения).
  • Объекты обычно не обнаруживаются, если они расположены тесно (например, стек плит).
  • Объекты не отличаются по брендам или продуктам (например, различные типы сода на полке магазина). Тем не менее можно получить сведения о торговых марках на изображении с помощью функции обнаружения торговых марок.

Использование API

Функция обнаружения объектов является частью API анализа изображений. Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Objects в параметр запроса visualFeatures. Затем, когда вы получите полный ответ JSON, анализирует строку для содержимого "objects" раздела.