Objectdetectie (versie 4.0)

Artikel
01/23/2024

Objectdetectie is vergelijkbaar met taggen, maar de API retourneert de coördinaten van het begrenzingsvak (in pixels) voor elk object dat in de afbeelding is gevonden. Als een afbeelding bijvoorbeeld een hond, kat en persoon bevat, geeft de objectdetectiebewerking deze objecten weer met hun coördinaten in de afbeelding. U kunt deze functionaliteit gebruiken om de relaties tussen de objecten in een afbeelding te verwerken. Hiermee kunt u ook bepalen of er meerdere exemplaren van hetzelfde object in een afbeelding zijn.

Met de functie objectdetectie worden tags toegepast op basis van de objecten of levende dingen die in de afbeelding zijn geïdentificeerd. Er is geen formele relatie tussen de taxonomie voor taggen en de objectdetectietaxonomie. Op conceptueel niveau vindt de functie objectdetectie alleen objecten en levende dingen, terwijl de tagfunctie ook contextuele termen zoals 'binnen' kan bevatten, die niet met begrenzingsvakken kunnen worden gelokaliseerd.

Probeer de mogelijkheden van objectdetectie snel en eenvoudig uit in uw browser met Behulp van Vision Studio.

Vision Studio uitproberen

Tip

U kunt de functie Objectdetectie gebruiken via de Azure OpenAI-service . Met het GPT-4 Turbo with Vision-model kunt u chatten met een AI-assistent die de afbeeldingen die u deelt, kan analyseren en de optie Vision-uitbreiding gebruikmaakt van Afbeeldingsanalyse om ai-hulp te bieden met meer details (leesbare tekst- en objectlocaties) over de afbeelding. Zie de snelstartgids GPT-4 Turbo met Vision voor meer informatie.

Voorbeeld van objectdetectie

Het volgende JSON-antwoord illustreert wat de Analysis 4.0-API retourneert bij het detecteren van objecten in de voorbeeldafbeelding.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Beperkingen

Het is belangrijk om rekening te houden met de beperkingen van objectdetectie, zodat u de effecten van fout-negatieven (gemiste objecten) en beperkte details kunt voorkomen of beperken.

Objecten worden over het algemeen niet gedetecteerd als ze klein zijn (minder dan 5% van de afbeelding).
Objecten worden over het algemeen niet gedetecteerd als ze dicht bij elkaar zijn gerangschikt (bijvoorbeeld een stapel platen).
Objecten worden niet gedifferentieerd op merk- of productnaam (bijvoorbeeld verschillende soorten frisdrank op een schap in een winkel). U kunt echter merkinformatie ophalen uit een afbeelding met behulp van de functie Merkdetectie .

De API gebruiken

De functie objectdetectie maakt deel uit van de Analyze Image-API . U kunt deze API aanroepen met REST. Opnemen Objects in de queryparameter voor functies . Wanneer u vervolgens het volledige JSON-antwoord krijgt, parseert u de tekenreeks voor de inhoud van de "objects" sectie.

Volgende stappen

De Afbeeldings-API analyseren aanroepen

Objectdetectie (versie 4.0)

Voorbeeld van objectdetectie

Beperkingen

De API gebruiken

Volgende stappen

Aanvullende resources