Získání přehledů extrakce pojmenovaných entit

Článek
10/09/2024

Extrakce pojmenovaných entit

Extrakce pojmenovaných entit používá technologii NLP (Natural Language Processing) k extrakci přehledů o umístěních, lidech a značkách, které se zobrazují ve zvukových a obrázcích v mediálních souborech. Přehled extrakce pojmenovaných entit používá přepis a optické rozpoznávání znaků (OCR).

Případy použití pojmenovaných entit

Kontextová reklama, například umístění reklamy na pizza řetězec následující záběry na Itálii.
Hloubkové vyhledávání mediálních archivů pro přehledy o lidech nebo místech pro vytváření zpráv o funkcích
Vytvoření slovního popisu záběrů prostřednictvím zpracování OCR za účelem zlepšení přístupnosti pro zrakově postižené, například scénáře na pozadí ve filmech.
Extrahování přehledů o názvech značek

Zobrazení kódu JSON přehledu pomocí webového portálu

Po nahrání a indexování videa jsou přehledy k dispozici ve formátu JSON ke stažení pomocí webového portálu.

Vyberte kartu Knihovna.
Vyberte multimédia, se kterými chcete pracovat.
Vyberte Stáhnout a přehledy (JSON). Soubor JSON se otevře na nové kartě prohlížeče.
Vyhledejte pár klíčů popsaný v ukázkové odpovědi.

Použití rozhraní API

Použijte požadavek Získat index videa. Doporučujeme předat &includeSummarizedInsights=false.
Vyhledejte páry klíčů popsané v ukázkové odpovědi.

Příklad odpovědi

    namedPeople: [
    {
    referenceId: "Satya_Nadella",
    referenceUrl: "https://en.wikipedia.org/wiki/Satya_Nadella",
    confidence: 1,
    description: "CEO of Microsoft Corporation",
    seenDuration: 33.2,
    id: 2,
    name: "Satya Nadella",
    appearances: [
    {
    startTime: "0:01:11.04",
    endTime: "0:01:17.36",
    startSeconds: 71,
    endSeconds: 77.4
    },
    {
    startTime: "0:01:31.83",
    endTime: "0:01:37.1303666",
    startSeconds: 91.8,
    endSeconds: 97.1
    },

Důležité

Je důležité si přečíst přehled poznámek transparentnosti pro všechny funkce VI. Každý přehled má také vlastní poznámky k transparentnosti:

Poznámky k pojmenovaných entitám

Pečlivě zvažte přesnost výsledků, aby bylo možné zvýšit přesnost detekce, zkontrolovat kvalitu zvuku a obrázků, zvuk s nízkou kvalitou a obrázky může mít vliv na zjištěné přehledy.
Pojmenované entity detekují přehledy pouze ve zvuku a obrázcích. Loga v názvu značky nemusí být zjištěna.
Pečlivě vezměte v úvahu, že při použití pro vymáhání práva pojmenované entity nemusí vždy zjišťovat části zvuku. Aby bylo zajištěno spravedlivé a vysoce kvalitní rozhodnutí, vždy zkombinujte pojmenované entity s lidským dohledem.
Nepoužívejte pojmenované entity pro rozhodnutí, která mohou mít vážné negativní dopady na jednotlivce a skupiny. Modely strojového učení, které extrahují text, můžou vést k nedetekci nebo nesprávnému textovému výstupu. Vaše rozhodnutí na základě nesprávného výstupu můžou mít vážné nepříznivé dopady, kterým se musíte vyhnout. Vždy byste měli zahrnout lidský přezkum rozhodnutí, která mají potenciál pro vážné dopady na jednotlivce.

Komponenty

Během procedury extrakce pojmenovaných entit se mediální soubor zpracuje následujícím způsobem:

Komponenta	Definice
Zdrojový soubor	Uživatel nahraje zdrojový soubor pro indexování.
Extrakce textu	– Zvukový soubor se odešle do rozhraní API služby Speech Services k extrakci přepisu. – Ukázkové snímky se odesílají do rozhraní API služby Azure AI Vision k extrakci OCR.
Analýzy	Přehledy se pak posílají do rozhraní API Analýza textu a extrahují entity. Například Microsoft, Paříž nebo jméno osoby, jako je Paul nebo Sarah.
Zpracování a konsolidace	Výsledky se pak zpracují. Pokud je to možné, odkazy na Wikipedii se přidávají a značky jsou identifikovány prostřednictvím integrovaných a přizpůsobitelných seznamů brandingu Video Indexeru.
Hodnota spolehlivosti	Odhadovaná úroveň spolehlivosti každé pojmenované entity se vypočítá jako rozsah 0 až 1. Skóre spolehlivosti představuje jistotu přesnosti výsledku. Například 82% jistota je reprezentována jako skóre 0,82.

Ukázkový kód

Zobrazit všechny ukázky pro VI

Sdílet prostřednictvím