Udostępnij za pośrednictwem


Wykrywanie obiektów

W tym artykule opisano funkcję wykrywania obiektów. Wykrywanie obiektów jest podobne do tagowania, ale interfejs API zwraca współrzędne pola ograniczenia (w pikselach) dla każdego obiektu znalezionego na obrazie. Jeśli na przykład obraz zawiera psa, kota i osobę, operacja wykrywania obiektu zawiera listę tych obiektów ze współrzędnymi na obrazie.

Za pomocą tej funkcji można przetwarzać relacje między obiektami na obrazie. Pozwala również określić, czy na obrazie istnieje wiele wystąpień tego samego obiektu.

Nie ma formalnej relacji między taksonomią tagowania a taksonomią wykrywania obiektów. Na poziomie koncepcyjnym funkcja wykrywania obiektów znajduje tylko obiekty i żywe elementy, podczas gdy funkcja znacznika może również zawierać terminy kontekstowe, takie jak wewnątrz, które nie mogą być zlokalizowane za pomocą ramek ograniczających.

Wypróbuj możliwości wykrywania obiektów szybko i łatwo w przeglądarce przy użyciu usługi Azure AI Vision Studio.

Przykład wykrywania obiektów

Poniższa odpowiedź JSON pokazuje, co interfejs API analizowania obrazu zwraca po wykryciu obiektów na przykładowym obrazie.

Zdjęcie przedstawiające kobietę korzystającą z urządzenia Microsoft Surface w kuchni.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Ograniczenia

Ważne jest, aby pamiętać o ograniczeniach wykrywania obiektów, aby można było uniknąć lub ograniczyć skutki fałszywie negatywnych wyników (pominiętych obiektów) oraz ograniczonych szczegółów.

  • Obiekty zwykle nie są wykrywane, jeśli są małe (mniej niż 5% obrazu).
  • Obiekty zwykle nie są wykrywane, jeśli są ułożone blisko siebie (na przykład stos płyt).
  • Obiekty nie różnią się marką ani nazwami produktów (na przykład różne rodzaje sod na półce sklepu). Można jednak uzyskać informacje o marce z obrazu za pomocą funkcji Wykrywanie marek.

Używanie interfejsu API

Funkcja wykrywania obiektów jest częścią interfejsu API analizowania obrazu . Ten interfejs API można wywołać za pomocą natywnego zestawu SDK lub wywołań REST. Uwzględnij Objects w parametrze zapytania visualFeatures. Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości sekcji obiektów .