Sdílet prostřednictvím


Získání analýz detekce objektů

V tomto článku se dozvíte, jak získat přehledy detekce objektů Ve službě Azure AI Video Indexer. Rozpoznávání objektů je funkce, která detekuje a sleduje objekty ve videích. Dá se použít k vyhledání objektů, jako jsou auta, kabelky, batohy a notebooky.

Podporované objekty

  • letadlo
  • jablko
  • batoh
  • banán
  • baseballová rukavice
  • postel
  • lavice
  • bicykl
  • člun
  • kniha
  • láhev
  • mísa
  • brokolice
  • autobus
  • dort
  • auto
  • mrkev
  • mobilní telefon
  • židle
  • hodiny
  • myš počítače
  • pohovka
  • šálek
  • jídelní stůl
  • kobliha
  • požární hydrant
  • vidlička
  • létající talíř
  • fén
  • kabelka
  • párek v rohlíku
  • klávesnice
  • drak
  • nůž
  • notebook
  • mikrovlna
  • motocykl
  • myš počítače
  • kravata
  • pomeranč
  • trouba
  • parkovací automat
  • pizza
  • rostlina v květináči
  • sendvič
  • nůžky
  • dřez/umyvadlo
  • skejtbord
  • lyže
  • snowboard
  • lžíce
  • sportovní míč
  • Značka Stop
  • kufr
  • surfovací prkno
  • medvídek
  • tenisová raketa
  • toustovač
  • WC
  • zubní kartáček
  • Semafor
  • vlak
  • deštník
  • váza
  • sklenice na víno

Zobrazit JSON analýzy ve webovém portálu

Po nahrání a indexování videa si stáhněte přehledy ve formátu JSON z webového portálu.

  1. Vyberte kartu Knihovna.
  2. Vyberte požadované médium.
  3. Vyberte Stáhnout a pak vyberte Přehledy (JSON). Soubor JSON se otevře na nové kartě prohlížeče.
  4. Najděte pár klíčů popsaný v ukázkové odpovědi.

Použití rozhraní API

  1. Použijte požadavek Get Video Index . Pass &includeSummarizedInsights=false.
  2. Najděte páry klíčů popsané v ukázkové odpovědi.

Příklad odpovědi

Zjištěné a sledované objekty se zobrazí detectedObjects ve staženém souboru insights.json. Pokaždé, když se zjistí jedinečný objekt, získá objekt ID. Tento objekt je také sledován, což znamená, že model sleduje zjištěný objekt, aby se vrátil do rámce. Pokud ano, přidá se do instancí objektu jiná instance s různými počátečními a koncovými časy.

V tomto příkladu bylo první auto detekováno a bylo mu přiděleno ID 1, protože bylo také prvním detekovaným objektem. Poté bylo zjištěno jiné auto a tomuto autu bylo přiděleno ID 23, protože se jednalo o dvacátý třetí detekovaný objekt. Později se první auto znovu objevilo a do FORMÁTU JSON byla přidána další instance. Tady je výsledný json:

detectedObjects: [
    {
    id: 1,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t33",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.468,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:02.44",
        start: "0:00:00",
        end: "0:00:02.44"
        },
        {
        confidence: 0.53,
        adjustedStart: "0:03:00",
        adjustedEnd: "0:00:03.55",
        start: "0:03:00",
        end: "0:00:03.55"
        }    
    ]
    },
    {
    id: 23,
    type: "Car",
    thumbnailId: "1c0b9fbb-6e05-42e3-96c1-abe2cd48t34",
    displayName: "car",
    wikiDataId: "Q1420",
    instances: [
        {
        confidence: 0.427,
        adjustedStart: "0:00:00",
        adjustedEnd: "0:00:14.24",
        start: "0:00:00",
        end: "0:00:14.24"
        }    
    ]
    }
]
Klíč Definice
Průkaz totožnosti Přírůstkový počet ID zjištěných objektů v mediálním souboru
Typ Typ objektů, například Car
ThumbnailID GUID představující jedinou detekci objektu
zobrazovaný název Název, který se má zobrazit v prostředí portálu VI
WikiDataID Jedinečný identifikátor ve struktuře WikiData
Instance Seznam všech instancí, které byly sledovány
Spolehlivost Skóre mezi 0–1 označující spolehlivost detekce objektů
upravenýStart upravený čas spuštění videa při použití editoru
upravenýKonec upravený čas ukončení videa při použití editoru
začátek čas, kdy se objekt zobrazí v záběru
konec čas, kdy se objekt již v rámci nezobrazuje

Komponenty

Pro detekci objektů nejsou definovány žádné komponenty.

Poznámky k transparentnosti

Důležité

Přečtěte si přehled poznámek transparentnosti pro všechny funkce VI. Každý přehled má také vlastní poznámku k transparentnosti.

  • Pro standardní a pokročilé zpracování je až 20 detekcí na snímek a 35 stop na třídu.
  • Velikost objektu by neměla být větší než 90 procent rámce. Velké objekty, které konzistentně pokrývají velkou část rámce, nemusí být rozpoznány.
  • Malé nebo rozmazané objekty můžou být obtížné rozpoznat. Můžou být buď zmeškané, nebo chybně klasifikované (sklenička vína, šálek).
  • Objekty, které jsou přechodné a zobrazují se v několika snímcích, nemusí být rozpoznány.
  • Mezi další faktory, které mohou ovlivnit přesnost detekce objektů, patří nízké podmínky světla, pohyb kamery a okluze.
  • Azure AI Video Indexer podporuje pouze skutečné objekty. Animace ani CGI nepodporuje. Počítačové vygenerované grafiky (například informační nálepky) můžou vést k podivným výsledkům.
  • Pořadače, brožury a další písemné materiály bývají obvykle detekovány jako Book.

Ukázkový kód

Zobrazit všechny ukázky pro VI