Objektidentifiering

Objektidentifiering liknar taggning, men API:et returnerar koordinaterna för avgränsningsrutan (i bildpunkter) för varje objekt som finns i bilden. Om en bild till exempel innehåller en hund, katt och person, visar objektidentifieringsåtgärden dessa objekt med deras koordinater i bilden. Du kan använda den här funktionen för att bearbeta relationerna mellan objekten i en bild. Du kan också avgöra om det finns flera instanser av samma objekt i en bild.

Funktionen för objektidentifiering tillämpar taggar baserat på de objekt eller levande saker som identifieras i bilden. Det finns ingen formell relation mellan taggningstaxonomi och taxonomi för objektidentifiering. På konceptuell nivå hittar objektidentifieringsfunktionen bara objekt och levande saker, medan taggfunktionen också kan innehålla kontextuella termer som "inomhus", som inte kan lokaliseras med avgränsningsrutor.

Prova funktionerna för objektidentifiering snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Exempel på objektidentifiering

Följande JSON-svar illustrerar vad Analysera API:et returnerar när objekt identifieras i exempelbilden.

A woman using a Microsoft Surface device in a kitchen

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Begränsningar

Det är viktigt att notera begränsningarna för objektidentifiering så att du kan undvika eller minimera effekterna av falska negativa objekt (missade objekt) och begränsad information.

  • Objekt identifieras vanligtvis inte om de är små (mindre än 5 % av bilden).
  • Objekt identifieras vanligtvis inte om de är nära ordnade tillsammans (t.ex. en stack med plattor).
  • Objekt särskiljs inte efter varumärke eller produktnamn (till exempel olika läsksorter på en butikshylla). Du kan dock hämta varumärkesinformation från en bild med hjälp av funktionen Varumärkesidentifiering .

Använda API:et

Funktionen för objektidentifiering är en del av API:et Analysera bild . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Objects i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "objects" avsnittet.