Delen via


Objectdetectie

In dit artikel wordt het concept van objectdetectie uitgelegd. Objectdetectie is vergelijkbaar met taggen, maar de API retourneert de coördinaten van het begrenzingsvak (in pixels) voor elk object dat in de afbeelding is gevonden. Als een afbeelding bijvoorbeeld een hond, kat en persoon bevat, bevat de objectdetectiebewerking die objecten met hun coördinaten in de afbeelding. U kunt deze functionaliteit gebruiken om de relaties tussen de objecten in een afbeelding te verwerken. Hiermee kunt u ook bepalen of er meerdere exemplaren van hetzelfde object in een afbeelding zijn.

Met de functie objectdetectie worden tags toegepast op basis van de objecten of levende dingen die in de afbeelding zijn geïdentificeerd. Er is geen formele relatie tussen de taxonomie voor taggen en de objectdetectietaxonomie. Op conceptueel niveau vindt de functie objectdetectie alleen objecten en levende dingen, terwijl de tagfunctie ook contextuele termen kan bevatten, zoals binnen, die niet met begrenzingsvakken kunnen worden gelokaliseerd.

Probeer de mogelijkheden van objectdetectie snel en eenvoudig uit in uw browser met behulp van Azure AI Vision Studio.

Voorbeeld van objectdetectie

In het volgende JSON-antwoord ziet u wat de Analyze Image-API retourneert wanneer objecten in de voorbeeldafbeelding worden gedetecteerd.

Foto van een vrouw die een Microsoft Surface-apparaat in een keuken gebruikt.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Beperkingen

Het is belangrijk om rekening te houden met de beperkingen van objectdetectie, zodat u de effecten van fout-negatieven (gemiste objecten) en beperkte details kunt voorkomen of beperken.

  • Objecten worden meestal niet gedetecteerd als ze klein zijn (minder dan 5% van de afbeelding).
  • Objecten worden meestal niet gedetecteerd als ze dicht bij elkaar zijn gerangschikt (bijvoorbeeld een stapel platen).
  • Objecten worden niet onderscheiden door merk- of productnamen (bijvoorbeeld verschillende soorten frisdranken op een winkelplank). U kunt echter merkinformatie uit een afbeelding halen met behulp van de functie Merkdetectie.

De API gebruiken

De functie objectdetectie maakt deel uit van de Analyze Image-API . U kunt deze API aanroepen via een systeemeigen SDK of via REST-aanroepen. Opnemen Objects in de visualFeatures queryparameter. Wanneer u vervolgens het volledige JSON-antwoord krijgt, parseert u de tekenreeks voor de inhoud van de objectsectie .