Uzyskiwanie szczegółowych informacji wyodrębniania nazwanych jednostek

Artykuł
07/26/2024

Ważne

Termin migracji zawartości usługi Azure Video Indexer z powodu wycofania usługi Azure Media Services upłynął. Aby uzyskać więcej informacji, zobacz przewodnik po wycofaniu.

Wyodrębnianie nazwanych jednostek

Wyodrębnianie nazwanych jednostek używa przetwarzania języka naturalnego (NLP) do wyodrębniania szczegółowych informacji o lokalizacjach, osobach i markach wyświetlanych w plikach audio i obrazów w plikach multimedialnych. Szczegółowe informacje wyodrębniania nazwanych jednostek używają transkrypcji i optycznego rozpoznawania znaków (OCR).

Przypadki użycia nazwanych jednostek

Kontekstowa reklama, na przykład umieszczenie reklamy dla sieci Pizza po nagraniu na Włochy.
Głębokie wyszukiwanie archiwów multimediów w celu uzyskania szczegółowych informacji na temat osób lub lokalizacji w celu utworzenia historii funkcji dla wiadomości.
Tworzenie słownego opisu materiału za pośrednictwem przetwarzania OCR w celu zwiększenia ułatwień dostępu dla osób niedowidzących, na przykład storyteller w tle w filmach.
Wyodrębnianie szczegółowych informacji na temat nazw marek.

Wyświetlanie kodu JSON szczegółowych informacji za pomocą portalu internetowego

Po przekazaniu i zaindeksowaniu klipu wideo szczegółowe informacje są dostępne w formacie JSON do pobrania przy użyciu portalu internetowego.

Wybierz kartę Biblioteka .
Wybierz multimedia, z którym chcesz pracować.
Wybierz pozycję Pobierz i Szczegółowe informacje (JSON). Plik JSON zostanie otwarty na nowej karcie przeglądarki.
Poszukaj pary kluczy opisanej w przykładowej odpowiedzi.

Używanie interfejsu API

Użyj żądania Pobierz indeks wideo. Zalecamy przekazanie &includeSummarizedInsights=falseelementu .
Poszukaj pary kluczy opisanej w przykładowej odpowiedzi.

Przykładowa odpowiedź

    namedPeople: [
    {
    referenceId: "Satya_Nadella",
    referenceUrl: "https://en.wikipedia.org/wiki/Satya_Nadella",
    confidence: 1,
    description: "CEO of Microsoft Corporation",
    seenDuration: 33.2,
    id: 2,
    name: "Satya Nadella",
    appearances: [
    {
    startTime: "0:01:11.04",
    endTime: "0:01:17.36",
    startSeconds: 71,
    endSeconds: 77.4
    },
    {
    startTime: "0:01:31.83",
    endTime: "0:01:37.1303666",
    startSeconds: 91.8,
    endSeconds: 97.1
    },

Składniki

Podczas procedury wyodrębniania nazwanych jednostek plik multimedialny jest przetwarzany w następujący sposób:

Składnik	Definicja
Plik źródłowy	Użytkownik przekazuje plik źródłowy do indeksowania.
Wyodrębnianie tekstu	— Plik dźwiękowy jest wysyłany do interfejsu API usług rozpoznawania mowy w celu wyodrębnienia transkrypcji. — Próbkowane ramki są wysyłane do interfejsu API usługi Azure AI Vision w celu wyodrębnienia OCR.
Analiza	Szczegółowe informacje są następnie wysyłane do interfejsu API analiza tekstu w celu wyodrębnienia jednostek. Na przykład Microsoft, Paryż lub nazwisko osoby, takie jak Paul lub Sarah.
Przetwarzanie i konsolidacja	Wyniki są następnie przetwarzane. Jeśli ma to zastosowanie, linki Wikipedii są dodawane, a marki są identyfikowane za pośrednictwem wbudowanych i dostosowywalnych list znakowania Video Indexer.
Wartość ufności	Szacowany poziom ufności każdej nazwanej jednostki jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82.

Uwagi dotyczące przezroczystości

Ważne

Ważne jest, aby zapoznać się z omówieniem noty przejrzystości dla wszystkich funkcji VI. Każda analiza zawiera również własne uwagi dotyczące przejrzystości:

Dokładnie zastanów się nad dokładnością wyników, aby promować dokładniejsze wykrywanie, sprawdzić jakość dźwięku i obrazów, niskiej jakości dźwięku i obrazów może mieć wpływ na wykryte szczegółowe informacje.
Nazwane jednostki wykrywają tylko szczegółowe informacje w obrazach i dźwiękach. Nie można wykryć logo w nazwie marki.
Należy dokładnie wziąć pod uwagę, że w przypadku korzystania z organów ścigania nazwanych jednostek nie zawsze mogą wykrywać części dźwięku. Aby zapewnić uczciwe i wysokiej jakości decyzje, połącz nazwane jednostki z nadzorem człowieka.
Nie używaj nazwanych jednostek do podejmowania decyzji, które mogą mieć poważne negatywne skutki. Modele uczenia maszynowego, które wyodrębniają tekst, mogą spowodować niewykryte lub nieprawidłowe dane wyjściowe tekstu. Decyzje oparte na nieprawidłowych danych wyjściowych mogą mieć poważny negatywny wpływ. Ponadto zaleca się uwzględnienie przeglądu przez człowieka decyzji, które mogą mieć poważny wpływ na osoby.

Przykładowy kod

Zobacz wszystkie przykłady dla vi

Udostępnij za pośrednictwem