Objectdetectie

Objectdetectie is vergelijkbaar met taggen, maar de API retourneert de coördinaten van het begrenzingsvak (in pixels) voor elk object dat in de afbeelding is gevonden. Als een afbeelding bijvoorbeeld een hond, kat en persoon bevat, geeft de objectdetectiebewerking deze objecten weer met hun coördinaten in de afbeelding. U kunt deze functionaliteit gebruiken om de relaties tussen de objecten in een afbeelding te verwerken. Hiermee kunt u ook bepalen of er meerdere exemplaren van hetzelfde object in een afbeelding zijn.

Met de functie objectdetectie worden tags toegepast op basis van de objecten of levende dingen die in de afbeelding zijn geïdentificeerd. Er is geen formele relatie tussen de taxonomie voor taggen en de objectdetectietaxonomie. Op conceptueel niveau vindt de functie objectdetectie alleen objecten en levende dingen, terwijl de tagfunctie ook contextuele termen zoals 'binnen' kan bevatten, die niet met begrenzingsvakken kunnen worden gelokaliseerd.

Probeer de mogelijkheden van objectdetectie snel en eenvoudig uit in uw browser met Behulp van Vision Studio.

Voorbeeld van objectdetectie

Het volgende JSON-antwoord illustreert wat de Analyse-API retourneert bij het detecteren van objecten in de voorbeeldafbeelding.

A woman using a Microsoft Surface device in a kitchen

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Beperkingen

Het is belangrijk om rekening te houden met de beperkingen van objectdetectie, zodat u de effecten van fout-negatieven (gemiste objecten) en beperkte details kunt voorkomen of beperken.

  • Objecten worden over het algemeen niet gedetecteerd als ze klein zijn (minder dan 5% van de afbeelding).
  • Objecten worden over het algemeen niet gedetecteerd als ze dicht bij elkaar zijn gerangschikt (bijvoorbeeld een stapel platen).
  • Objecten worden niet gedifferentieerd op merk- of productnaam (bijvoorbeeld verschillende soorten frisdrank op een schap in een winkel). U kunt echter merkinformatie ophalen uit een afbeelding met behulp van de functie Merkdetectie .

De API gebruiken

De functie objectdetectie maakt deel uit van de Analyze Image-API . U kunt deze API aanroepen via een systeemeigen SDK of via REST-aanroepen. Opnemen Objects in de queryparameter visualFeatures . Wanneer u vervolgens het volledige JSON-antwoord krijgt, parseert u de tekenreeks voor de inhoud van de "objects" sectie.