Détection d’objets

Article
09/04/2024

La détection d’objets est similaire à l’étiquetage, mais l’API retourne les coordonnées de cadre englobant (en pixels) pour chaque objet trouvé dans l’image. Par exemple, si une image contient un chien, un chat et une personne, l’opération de détection d’objet répertorie ces objets ainsi que leurs coordonnées dans l’image. Vous pouvez utiliser cette fonctionnalité pour traiter les relations entre les objets dans une image. Elle vous permet également de déterminer s’il existe plusieurs instances du même objet dans une image.

La fonction de détection d’objet applique des étiquettes en fonction des objets ou éléments vivants identifiés dans l’image. Il n’existe aucune relation formelle entre la taxonomie des balises et la taxonomie de détection d’objets. À un niveau conceptuel, la fonction de détection d’objet recherche uniquement des objets et éléments vivants, tandis que la fonction d’étiquette peut également inclure des termes contextuels tels que « intérieur », qui ne peuvent pas être localisés avec des cadres englobants.

Essayez les fonctionnalités de détection d’objets rapidement et facilement dans votre navigateur à l’aide de Vision Studio.

Essayez Vision Studio

Exemple de détection d’objet

La réponse JSON suivante illustre ce que retourne l’API Analyse Image lors de la détection d’objets dans l’exemple d’image.

Une femme utilisant un appareil Microsoft Surface dans une cuisine

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limites

Les limites de la détection d'objet doivent impérativement être prises en compte afin d'éviter ou d'atténuer les effets des faux négatifs (objets manqués) et des détails limités.

Les objets ne sont généralement pas détectés s’ils sont petits (moins de 5 % de l’image).
Les objets ne sont généralement pas détectés s'ils sont disposés à proximité les uns des autres (une pile d'assiettes, par exemple).
Les objets ne sont pas différenciés par marque ou nom de produit (différents types de sodas sur une étagère de magasin, par exemple). Toutefois, vous pouvez obtenir des informations sur les marques figurant sur une image à l'aide de la fonctionnalité Détection de marque.

Utilisation de l’API

La fonctionnalité de détection d'objet fait partie de l'API Analyser l'image. Vous pouvez appeler cette API via un SDK natif ou via des appels REST. Incluez Objects dans le paramètre de requête visualFeatures. Ensuite, lorsque vous obtenez la réponse JSON complète, analysez la chaîne de contenu de la section "objects".

Démarrage rapide : API REST ou bibliothèques clientes Vision

Partager via

Détection d’objets

Exemple de détection d’objet

Limites

Utilisation de l’API

Commentaires

Ressources supplémentaires