Aktivieren ausgewählter Kleidungsstücke einer beobachteten Person
Beim Indizieren eines Videos mit erweiterten Azure AI Video Indexer-Einstellungen können Sie die empfohlene Kleidung einer beobachteten Person anzeigen. Der Einblick bietet Momente innerhalb des Videos, in denen wichtige Personen prominent präsentiert und deutlich sichtbar sind, einschließlich der Koordinaten der Personen, des Zeitstempels und des Rahmens der Aufnahme. Dieser Einblick ermöglicht hochwertige kontextbezogene Werbung in Video, bei der relevante Kleidungsanzeigen mit der spezifischen Zeit innerhalb des Videos abgeglichen werden, in dem sie angezeigt werden.
In diesem Artikel wird erläutert, wie Sie die Erkenntnisse zu ausgewählten Kleidungsstücken anzeigen und wie diesen Bildern mit den Kleidungsstücken ein Rang zugewiesen wird.
Anzeigen eines Einführungsvideos
Sie können das folgende kurze Video ansehen, in dem erläutert wird, wie Sie die Erkenntnisse zu ausgewählten Kleidungsstücken anzeigen und verwenden.
Anzeigen von ausgewählter Kleidung
Das Feature für die Kleidungseinblicke ist verfügbar, wenn Sie Ihre Datei mit der Voreinstellung ->Erweitertes Video oder Erweitertes Video + Audio (unter „Video + Audio Indizierung“) indizieren. Die Standardindizierung schließt diese Einsicht nicht ein.
Die vorgestellten Kleidungsbilder werden basierend auf einigen der folgenden Faktoren bewertet: Schlüsselmomente des Videos, Dauer, die die Person erscheint, textbasierte Emotionen und Audioereignisse. Die Einblicke private den höchsten Bewertungsrahmen pro Szene, mit dem Sie kontextbezogene Werbung pro Szene im gesamten Video erstellen können. Die JSON-Datei wird nach der Sequenz der Szenen im Video bewertet, wobei jede Szene den am häufigsten bewerteten Frame als Ergebnis aufweist.
Hinweis
Die empfohlenen Bekleidungs-Einblicke können nur aus der Artefaktdatei angezeigt werden, und der Einblick befindet sich nicht auf der Azure AI Video Indexer-Website.
- Wählen Sie in der rechten oberen Ecke die Option zum Herunterladen der Artefakt-Zip-Datei: Download ->Artefakte (ZIP)
- Öffnen Sie
featuredclothing.zip
.
Die ZIP-Datei enthält die folgenden zwei Objekte:
featuredclothing.map.json
- die Datei enthält Instanzen jeder ausgewählten Kleidung mit den folgenden Eigenschaften:id
– Bewertungsindex ("id": 1
ist die wichtigste Kleidung).confidence
– Score der ausgewählten Kleidung.frameIndex
– der beste Frame der Kleidung.timestamp
– entspricht dem FrameIndex.opBoundingBox
– Begrenzungsrahmen der Person.faceBoundingBox
– Begrenzungsrahmen des Gesichtes der Person, wenn erkannt.fileName
– wo der beste Frame der Kleidung gespeichert wird.sceneID
- die Szene, in der die Szene angezeigt wird.
Ein Beispiel für ausgewählte Kleidung mit
"sceneID": 1
."instances": [ { "confidence": 0.07, "faceBoundingBox": {}, "fileName": "frame_100.jpg", "frameIndex": 100, "opBoundingBox": { "x": 0.09062, "y": 0.4, "width": 0.11302, "height": 0.59722 }, "timestamp": "0:00:04", "personName": "Observed Person #1", "sceneId": 1 }
featuredclothing.frames.map
– dieser Ordner enthält Bilder der besten Frames, in denen die ausgewählte Kleidung angezeigt wurde, entsprechend der EigenschaftfileName
in jeder Instanz infeaturedclothing.map.json
.
Einschränkungen und Voraussetzungen
Es ist wichtig, die Einschränkungen der ausgewählten Kleidung zu beachten, um die Auswirkungen falscher Erkennungen von Bildern mit niedriger Qualität oder geringer Relevanz zu vermeiden oder zu verringern.
- Voraussetzung für die vorgestellte Kleidung ist, dass die Person, die die Kleidung trägt, in den beobachteten Menschen Einblicke gefunden werden kann.
- Wenn das Gesicht einer Person, die die empfohlene Kleidung trägt, nicht erkannt wird, enthalten die Ergebnisse nicht die Gesichter umgebende Box.
- Wenn eine Person in einem Video mehr als ein Outfit trägt, wählt der Algorithmus sein bestes Outfit als einzelnes ausgewähltes Kleidungsbild aus.
- Bei der Darstellung sind die Tracks für die beobachteten Personen optimiert, die am häufigsten im Vordergrund stehen.
- Falsche Erkennungen können auftreten, wenn Personen überlappen.
- Frames, die verschwommene Personen enthalten, sind anfälliger für niedrige Qualitätsergebnisse.
Weitere Informationen finden Sie in den Einschränkungen von beobachteten Personen.