Share via


Objektidentifiering (version 4.0)

Objektidentifiering liknar taggning, men API:et returnerar koordinaterna för avgränsningsrutan (i bildpunkter) för varje objekt som finns i bilden. Om en bild till exempel innehåller en hund, katt och person, visar objektidentifieringsåtgärden dessa objekt med deras koordinater i bilden. Du kan använda den här funktionen för att bearbeta relationerna mellan objekten i en bild. Du kan också avgöra om det finns flera instanser av samma objekt i en bild.

Funktionen för objektidentifiering tillämpar taggar baserat på de objekt eller levande saker som identifieras i bilden. Det finns ingen formell relation mellan taggningstaxonomi och taxonomi för objektidentifiering. På konceptuell nivå hittar objektidentifieringsfunktionen bara objekt och levande saker, medan taggfunktionen också kan innehålla kontextuella termer som "inomhus", som inte kan lokaliseras med avgränsningsrutor.

Prova funktionerna för objektidentifiering snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Dricks

Du kan använda funktionen Objektidentifiering via Azure OpenAI-tjänsten . Med MODELLEN GPT-4 Turbo med vision kan du chatta med en AI-assistent som kan analysera de bilder du delar, och alternativet Vision Enhancement använder bildanalys för att ge AI-hjälpen mer information (läsbar text och objektplatser) om bilden. Mer information finns i snabbstarten GPT-4 Turbo med vision.

Exempel på objektidentifiering

Följande JSON-svar visar vad Analysis 4.0 API returnerar när objekt identifieras i exempelbilden.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Begränsningar

Det är viktigt att notera begränsningarna för objektidentifiering så att du kan undvika eller minimera effekterna av falska negativa objekt (missade objekt) och begränsad information.

  • Objekt identifieras vanligtvis inte om de är små (mindre än 5 % av bilden).
  • Objekt identifieras vanligtvis inte om de är nära ordnade tillsammans (t.ex. en stack med plattor).
  • Objekt särskiljs inte efter varumärke eller produktnamn (till exempel olika läsksorter på en butikshylla). Du kan dock hämta varumärkesinformation från en bild med hjälp av funktionen Varumärkesidentifiering .

Använda API:et

Funktionen för objektidentifiering är en del av API:et Analysera bild . Du kan anropa det här API:et med HJÄLP av REST. Inkludera Objects i frågeparametern funktioner . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "objects" avsnittet.

Nästa steg