Povolení doporučeného oblečení pozorované osoby

Důležité

Vzhledem k oznámení o vyřazení služby Azure Media Services vám Azure AI Video Indexer oznámí úpravy funkcí Azure AI Video Indexeru. Informace o tom, co to znamená pro váš účet Azure AI Video Indexer, najdete v tématu Změny související s vyřazením služby Azure Media Service (AMS). Podívejte se na průvodce přípravou na vyřazení AMS: Průvodce aktualizací VI a migrací.

Při indexování videa pomocí pokročilého nastavení videa Azure AI Video Indexeru můžete zobrazit doporučené oblečení pozorované osoby. Přehled poskytuje momenty ve videu, ve kterém jsou klíčové osoby zřetelně viditelné, včetně souřadnic osob, časového razítka a snímku. Tento přehled umožňuje vysoce kvalitní kontextovou reklamu ve videu, kde se relevantní reklamy na oblečení shodují s konkrétním časem ve videu, ve kterém se zobrazují.

Tento článek popisuje, jak zobrazit doporučený přehled oblečení a jak jsou vybrané obrázky oblečení seřazené.

Zobrazení úvodního videa

Můžete si prohlédnout následující krátké video, které popisuje, jak zobrazit a používat doporučený přehled oblečení.

Doporučený přehled oblečení je k dispozici při indexování souboru výběrem možnosti Upřesnit –> Pokročilé video nebo Pokročilé video + audio přednastavení (v části Video + audio indexování). Standardní indexování nezahrnuje tento přehled.

Tento snímek obrazovky představuje možnost indexování videa.

Vybrané obrázky oblečení jsou seřazené na základě některých z následujících faktorů: klíčové momenty videa, doba trvání zobrazení osoby, textové emoce a zvukové události. Přehledy vypisují nejvyšší rámec hodnocení na scénu, což umožňuje vytvářet kontextové reklamy na scénu v celém videu. Soubor JSON je seřazený podle posloupnosti scén ve videu, přičemž každá scéna má jako výsledek nejlepší rámeček.

Poznámka:

Doporučený přehled oblečení se dá zobrazit jenom ze souboru artefaktů a přehled není na webu Azure AI Video Indexer.

  1. V pravém horním rohu vyberte, že chcete stáhnout soubor ZIP artefaktu: Stáhnout ->Artifact (ZIP)
  2. Otevře záznam typu featuredclothing.zip.

Soubor .zip obsahuje dva objekty:

  • featuredclothing.map.json – soubor obsahuje instance jednotlivých doporučených oblečení s následujícími vlastnostmi:

    • id – ranking index ("id": 1 je nejdůležitější oblečení).
    • confidence – skóre doporučeného oblečení.
    • frameIndex - nejlepší rám oblečení.
    • timestamp – odpovídající frameIndex.
    • opBoundingBox - ohraničující rámeček osoby.
    • faceBoundingBox – ohraničující skříňka obličeje osoby, pokud byla zjištěna.
    • fileName – kde je uložen nejlepší rám oblečení.
    • sceneID - scéna, kde se scéna objeví.

    Příklad doporučeného oblečení s "sceneID": 1.

    "instances": [
      	{
        		"confidence": 0.07,
    			"faceBoundingBox": {},
    			"fileName": "frame_100.jpg",
        		"frameIndex": 100,
        		"opBoundingBox": {
            			"x": 0.09062,
            			"y": 0.4,
    				"width": 0.11302,
            			"height": 0.59722
    				},
       			 "timestamp": "0:00:04",
        		"personName": "Observed Person #1",
        		"sceneId": 1
      	}
    
  • featuredclothing.frames.map – tato složka obsahuje obrázky nejlepších snímků, ve které se vybrané oblečení objevilo, odpovídající fileName vlastnosti v každé instanci v featuredclothing.map.json.

Omezení a předpoklady

Je důležité si uvědomit omezení doporučených oblečení, abyste se vyhnuli nebo zmírnit účinky falešných detekcí obrázků s nízkou kvalitou nebo nízkou levostí. 

  • Předpokladem pro doporučené oblečení je, že osoba, která nosí oblečení, se nachází v přehledu pozorovaných lidí.
  • Pokud není rozpoznána tvář osoby, která má doporučený oděv, výsledky neobsahují ohraničující rámečky tváří.
  • Pokud někdo ve videu nosí více než jeden oblečení, algoritmus vybere svůj nejlepší oblečení jako jeden doporučený obrázek oblečení.
  • Při zobrazení jsou stopy optimalizované tak, aby zvládly pozorované osoby, které se nejčastěji objevují na přední straně.
  • Při překrývání lidí může dojít k nesprávným detekcí.
  • Snímky obsahující rozmazané osoby jsou náchylnější k výsledkům nízké kvality.

Další informace najdete v omezeních pozorovaných lidí.