Partager via


Détection d’objets

Cet article explique le concept de la détection d’objet. La détection d’objets est similaire à l’étiquetage, mais l’API retourne les coordonnées de cadre englobant (en pixels) pour chaque objet trouvé dans l’image. Par exemple, si une image contient un chien, un chat et une personne, l’opération de détection d’objet répertorie ces objets ainsi que leurs coordonnées dans l’image. Vous pouvez utiliser cette fonctionnalité pour traiter les relations entre les objets dans une image. Elle vous permet également de déterminer s’il existe plusieurs instances du même objet dans une image.

La fonction de détection d’objet applique des étiquettes en fonction des objets ou éléments vivants identifiés dans l’image. Il n’existe aucune relation formelle entre la taxonomie des balises et la taxonomie de détection d’objets. À un niveau conceptuel, la fonction de détection d’objet recherche uniquement des objets et éléments vivants, alors que la fonction de balise peut également inclure des termes contextuels tels que intérieur, qui ne peuvent pas être localisés avec des cadres englobants.

Essayez rapidement et facilement les fonctionnalités de détection d’objets dans votre navigateur en tirant parti d’Azure AI Vision Studio.

Exemple de détection d’objet

La réponse JSON suivante montre ce que l’API Analyse Image retourne lorsqu’elle détecte des objets dans l’exemple d’image.

Photographie montrant une femme qui utilise un appareil Microsoft Surface dans une cuisine.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limites

Les limites de la détection d'objet doivent impérativement être prises en compte afin d'éviter ou d'atténuer les effets des faux négatifs (objets manqués) et des détails limités.

  • Les objets ne sont généralement pas détectés s’ils sont petits (moins de 5 % de l’image).
  • Les objets ne sont généralement pas détectés s'ils sont disposés à proximité les uns des autres (une pile d'assiettes, par exemple).
  • Les objets ne sont pas différenciés par marque ou nom de produit (différents types de sodas sur une étagère de magasin, par exemple). Toutefois, vous pouvez obtenir des informations sur les marques figurant sur une image à l'aide de la fonctionnalité Détection de marque.

Utilisation de l’API

La fonctionnalité de détection d'objet fait partie de l'API Analyser l'image. Vous pouvez appeler cette API via un SDK natif ou via des appels REST. Incluez Objects dans le paramètre de requête visualFeatures. Ensuite, lorsque vous obtenez la réponse JSON complète, analysez la chaîne de contenu de la section objets.