Objektidentifiering (version 4.0)
Objektidentifiering liknar taggning, men API:et returnerar koordinaterna för avgränsningsrutan (i bildpunkter) för varje objekt som finns i bilden. Om en bild till exempel innehåller en hund, katt och person, visar objektidentifieringsåtgärden dessa objekt med deras koordinater i bilden. Du kan använda den här funktionen för att bearbeta relationerna mellan objekten i en bild. Du kan också avgöra om det finns flera instanser av samma objekt i en bild.
Funktionen för objektidentifiering tillämpar taggar baserat på de objekt eller levande saker som identifieras i bilden. Det finns ingen formell relation mellan taggningstaxonomi och taxonomi för objektidentifiering. På konceptuell nivå hittar objektidentifieringsfunktionen bara objekt och levande saker, medan taggfunktionen också kan innehålla kontextuella termer som "inomhus", som inte kan lokaliseras med avgränsningsrutor.
Prova funktionerna för objektidentifiering snabbt och enkelt i webbläsaren med hjälp av Vision Studio.
Dricks
Du kan använda funktionen Objektidentifiering via Azure OpenAI-tjänsten . Med MODELLEN GPT-4 Turbo med vision kan du chatta med en AI-assistent som kan analysera de bilder du delar, och alternativet Vision Enhancement använder bildanalys för att ge AI-hjälpen mer information (läsbar text och objektplatser) om bilden. Mer information finns i snabbstarten GPT-4 Turbo med vision.
Exempel på objektidentifiering
Följande JSON-svar visar vad Analysis 4.0 API returnerar när objekt identifieras i exempelbilden.
{
"metadata":
{
"width": 1260,
"height": 473
},
"objectsResult":
{
"values":
[
{
"name": "kitchen appliance",
"confidence": 0.501,
"boundingBox": {"x":730,"y":66,"w":135,"h":85}
},
{
"name": "computer keyboard",
"confidence": 0.51,
"boundingBox": {"x":523,"y":377,"w":185,"h":46}
},
{
"name": "Laptop",
"confidence": 0.85,
"boundingBox": {"x":471,"y":218,"w":289,"h":226}
},
{
"name": "person",
"confidence": 0.855,
"boundingBox": {"x":654,"y":0,"w":584,"h":473}
}
]
}
}
Begränsningar
Det är viktigt att notera begränsningarna för objektidentifiering så att du kan undvika eller minimera effekterna av falska negativa objekt (missade objekt) och begränsad information.
- Objekt identifieras vanligtvis inte om de är små (mindre än 5 % av bilden).
- Objekt identifieras vanligtvis inte om de är nära ordnade tillsammans (t.ex. en stack med plattor).
- Objekt särskiljs inte efter varumärke eller produktnamn (till exempel olika läsksorter på en butikshylla). Du kan dock hämta varumärkesinformation från en bild med hjälp av funktionen Varumärkesidentifiering .
Använda API:et
Funktionen för objektidentifiering är en del av API:et Analysera bild . Du kan anropa det här API:et med HJÄLP av REST. Inkludera Objects
i frågeparametern funktioner . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "objects"
avsnittet.
Nästa steg
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för