Objektidentifiering

Den här artikeln förklarar funktionen för objektidentifiering. Objektidentifiering liknar taggning, men API:et returnerar koordinaterna för avgränsningsrutan (i bildpunkter) för varje objekt som finns i bilden. Om en bild till exempel innehåller en hund, katt och person listar objektidentifieringsåtgärden dessa objekt med deras koordinater i bilden.

Du kan använda den här funktionen för att bearbeta relationerna mellan objekten i en bild. Du kan också avgöra om det finns flera instanser av samma objekt i en bild.

Det finns ingen formell relation mellan taggningstaxonomi och taxonomi för objektidentifiering. På konceptuell nivå hittar objektidentifieringsfunktionen bara objekt och levande saker, medan taggfunktionen även kan innehålla kontextuella termer som inomhus, som inte kan lokaliseras med avgränsningsrutor.

Prova funktionerna för objektidentifiering snabbt och enkelt i webbläsaren med hjälp av Azure Vision Studio.

Prova Vision Studio

Exempel på objektidentifiering

Följande JSON-svar visar vad API:et Analysera bild returnerar när det identifierar objekt i exempelbilden.

Foto som visar en kvinna som använder en Microsoft Surface-enhet i ett kök.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Begränsningar

Det är viktigt att notera begränsningarna för objektidentifiering så att du kan undvika eller minimera effekterna av falska negativa objekt (missade objekt) och begränsad information.

Objekt identifieras vanligtvis inte om de är små (mindre än 5 % av bilden).
Objekt identifieras vanligtvis inte om de är nära ordnade tillsammans (t.ex. en stack med plattor).
Objekt särskiljs inte efter varumärkes- eller produktnamn (olika typer av läsk på en butikshylla, till exempel). Du kan dock hämta varumärkesinformation från en bild med hjälp av funktionen Varumärkesidentifiering.

Använda API:et

Funktionen för objektidentifiering är en del av API:et Analysera bild . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Objects i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i objektavsnittet.

Snabbstart: Bildanalys

Feedback

Var den här sidan till hjälp?

Last updated on 2025-09-26