Objektidentifiering

Artikel
09/02/2024

Objektidentifiering liknar taggning, men API:et returnerar koordinaterna för avgränsningsrutan (i bildpunkter) för varje objekt som finns i bilden. Om en bild till exempel innehåller en hund, katt och person listar objektidentifieringsåtgärden dessa objekt med deras koordinater i bilden. Du kan använda den här funktionen för att bearbeta relationerna mellan objekten i en bild. Du kan också avgöra om det finns flera instanser av samma objekt i en bild.

Funktionen för objektidentifiering tillämpar taggar baserat på de objekt eller levande saker som identifieras i bilden. Det finns ingen formell relation mellan taggningstaxonomi och taxonomi för objektidentifiering. På konceptuell nivå hittar objektidentifieringsfunktionen bara objekt och levande saker, medan taggfunktionen även kan innehålla kontextuella termer som "inomhus", som inte kan lokaliseras med avgränsningsrutor.

Prova funktionerna för objektidentifiering snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Prova Vision Studio

Exempel på objektidentifiering

Följande JSON-svar illustrerar vad API:et Analysera bild returnerar när objekt identifieras i exempelbilden.

En kvinna som använder en Microsoft Surface-enhet i ett kök

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Begränsningar

Det är viktigt att notera begränsningarna för objektidentifiering så att du kan undvika eller minimera effekterna av falska negativa objekt (missade objekt) och begränsad information.

Objekt identifieras vanligtvis inte om de är små (mindre än 5 % av bilden).
Objekt identifieras vanligtvis inte om de är nära ordnade tillsammans (t.ex. en stack med plattor).
Objekt särskiljs inte efter varumärkes- eller produktnamn (olika typer av läsk på en butikshylla, till exempel). Du kan dock hämta varumärkesinformation från en bild med hjälp av funktionen Varumärkesidentifiering.

Använda API:et

Funktionen för objektidentifiering är en del av API:et Analysera bild . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Objects i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "objects" avsnittet.

Snabbstart: VISION REST API eller klientbibliotek

Dela via

Objektidentifiering

Exempel på objektidentifiering

Begränsningar

Använda API:et

Feedback

Ytterligare resurser