Partager via


Activer les vêtements proposés d’une personne observée

Lors de l’indexation d’une vidéo à l’aide des paramètres vidéo avancés d’Azure AI Video Indexer, vous pouvez afficher les vêtements recommandés d’une personne observée. L’insight fournit des moments dans la vidéo où les personnes clés sont en évidence et clairement visibles, y compris les coordonnées des personnes, l’horodatage et le cadre de la capture. Cet insight permet une publicité contextuelle de haute qualité dans la vidéo, où les publicités de vêtements pertinentes sont mises en correspondance avec l’heure spécifique dans la vidéo dans laquelle elles sont consultées.

Cet article explique comment afficher l’insight sur les vêtements proposés et comment les images de vêtements proposés sont classées.

Afficher une vidéo d’introduction

Vous pouvez afficher la courte vidéo suivante qui explique comment afficher et utiliser les insights des vêtements en une.

L’insight des vêtements proposés est disponible lors de l’indexation de votre fichier en choisissant l’option Avancé -> Vidéo avancée ou Vidéo avancée + présélection audio (sous Vidéo + indexation audio). L’indexation standard n’inclut pas cet insight.

Cette capture d’écran représente une option d’indexation de la vidéo.

Les images de vêtements proposées sont classées en fonction de certains des facteurs suivants : moments clés de la vidéo, durée de l’affichage de la personne, émotions textuelles et événements audio. Les insights privént la trame de classement la plus élevée par scène, ce qui vous permet de produire des publicités contextuelles par scène tout au long de la vidéo. Le fichier JSON est classé par la séquence de scènes dans la vidéo, chaque scène ayant la trame la plus évaluée comme résultat.

Remarque

L’insight des vêtements proposés ne peut être consulté qu’à partir du fichier d’artefact, et l’insight n’est pas dans le site web Azure AI Video Indexer.

  1. Dans le coin supérieur droit, sélectionnez pour télécharger le fichier zip d’artefact : Télécharger ->Artifact (ZIP)
  2. Ouvrez featuredclothing.zip.

Le fichier .zip contient deux objets :

  • featuredclothing.map.json - le fichier contient des instances de chaque vêtement proposé, avec les propriétés suivantes :

    • id – index de classement ("id": 1 est le vêtement le plus important).
    • confidence – score des vêtements proposés.
    • frameIndex – le meilleur cadre des vêtements.
    • timestamp – correspondant à frameIndex.
    • opBoundingBox – cadre englobant de la personne.
    • faceBoundingBox – cadre englobant du visage de la personne, s’il est détecté.
    • fileName – où le meilleur cadre des vêtements est enregistré.
    • sceneID - la scène où la scène apparaît.

    Exemple des vêtements proposés avec "sceneID": 1.

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map – ce dossier contient des images des meilleurs cadres dans utilisant les vêtements proposés, correspondant à la fileName propriété de chaque instance dans featuredclothing.map.json.

Limitations et hypothèses

Il est important de noter les limitations des vêtements proposés pour éviter ou atténuer les effets des fausses détections d’images avec une faible qualité ou une faible pertinence. 

  • La condition préalable pour les vêtements proposés est que la personne portant les vêtements peut être trouvée dans l’aperçu des personnes observées.
  • Si le visage d’une personne portant les vêtements proposés n’est pas détecté, les résultats n’incluent pas le cadre englobant des visages.
  • Si une personne dans une vidéo porte plusieurs tenues, l’algorithme sélectionne sa meilleure tenue en tant qu’image de vêtements unique.
  • Lorsque posées, les pistes sont optimisées pour gérer les personnes observées qui apparaissent le plus souvent à l’avant.
  • Des détections erronées peuvent se produire en cas de chevauchement des personnes.
  • Les images contenant des personnes floues sont plus sujettes aux résultats de faible qualité.

Pour plus d’informations, consultez les limitations des personnes observées.