Udostępnij za pośrednictwem


Wyodrębnianie nazwanych jednostek

Ważne

Ze względu na ogłoszenie wycofania usługi Azure Media Services usługa Azure AI Video Indexer ogłasza zmiany funkcji usługi Azure AI Video Indexer. Zobacz Zmiany związane z wycofaniem usługi Azure Media Service (AMS), aby dowiedzieć się, co to oznacza dla konta usługi Azure AI Video Indexer. Zobacz Przewodnik Przygotowywanie do wycofania usługi AMS: VI aktualizacji i migracji.

Wyodrębnianie nazwanych jednostek to funkcja sztucznej inteligencji usługi Azure AI Video Indexer, która używa przetwarzania języka naturalnego (NLP) do wyodrębniania szczegółowych informacji o lokalizacjach, osobach i markach wyświetlanych w plikach multimedialnych. Wyodrębnianie nazwanych jednostek jest automatycznie używane z transkrypcji i OCR, a jego szczegółowe informacje są oparte na wyodrębnionych podczas tych procesów. Wynikowe szczegółowe informacje są wyświetlane na karcie Szczegółowe informacje i są filtrowane do lokalizacji, osób i kategorii marki. Kliknięcie nazwanej jednostki powoduje wyświetlenie jego wystąpienia w pliku multimedialnym. Wyświetla on również opis jednostki i link Znajdź w usłudze Bing rozpoznawalnych jednostek.

Wymagania wstępne

Przegląd informacji o przezroczystości

Wyświetlanie szczegółowych informacji

Aby wyświetlić szczegółowe informacje w witrynie internetowej, wykonaj następujące czynności:

  1. Przejdź do pozycji Wyświetl i zaznacz pole Nazwane jednostki.
  2. Przejdź do obszaru Szczegółowe informacje i przewiń do nazwanych jednostek.

Aby wyświetlić szczegółowe informacje wyodrębniania nazwanych jednostek w pliku JSON, wykonaj następujące czynności:

  1. Kliknij pozycję Pobierz, a następnie pozycję Szczegółowe informacje (JSON).

  2. Nazwane jednostki są podzielone na trzy:

    • Marki
    • Lokalizacja
    • Osoby
  3. Skopiuj tekst i wklej go do przeglądarki JSON Viewer.

    namedPeople: [
    {
    referenceId: "Satya_Nadella",
    referenceUrl: "https://en.wikipedia.org/wiki/Satya_Nadella",
    confidence: 1,
    description: "CEO of Microsoft Corporation",
    seenDuration: 33.2,
    id: 2,
    name: "Satya Nadella",
    appearances: [
    {
    startTime: "0:01:11.04",
    endTime: "0:01:17.36",
    startSeconds: 71,
    endSeconds: 77.4
    },
    {
    startTime: "0:01:31.83",
    endTime: "0:01:37.1303666",
    startSeconds: 91.8,
    endSeconds: 97.1
    },
    

Aby pobrać plik JSON za pośrednictwem interfejsu API, użyj portalu deweloperów usługi Azure AI Video Indexer.

Składniki wyodrębniania nazwanych jednostek

Podczas procedury wyodrębniania nazwanych jednostek plik multimedialny jest przetwarzany w następujący sposób:

Składnik Definicja
Plik źródłowy Użytkownik przekazuje plik źródłowy do indeksowania.
Wyodrębnianie tekstu — Plik dźwiękowy jest wysyłany do interfejsu API usług rozpoznawania mowy w celu wyodrębnienia transkrypcji.
— Próbkowane ramki są wysyłane do interfejsu API usługi Azure AI Vision w celu wyodrębnienia OCR.
Analiza Szczegółowe informacje są następnie wysyłane do interfejsu API analiza tekstu w celu wyodrębnienia jednostek. Na przykład Microsoft, Paryż lub nazwisko osoby, takie jak Paul lub Sarah.
Przetwarzanie i konsolidacja Wyniki są następnie przetwarzane. Jeśli ma to zastosowanie, linki Wikipedii są dodawane, a marki są identyfikowane za pośrednictwem wbudowanych i dostosowywalnych list znakowania Video Indexer.
Wartość ufności Szacowany poziom ufności każdej nazwanej jednostki jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82.

Przykładowe przypadki użycia

  • Kontekstowa reklama, na przykład umieszczenie reklamy dla sieci Pizza po nagraniu na Włochy.
  • Głębokie wyszukiwanie archiwów multimediów w celu uzyskania szczegółowych informacji na temat osób lub lokalizacji w celu utworzenia historii funkcji dla wiadomości.
  • Tworzenie słownego opisu materiału za pośrednictwem przetwarzania OCR w celu zwiększenia ułatwień dostępu dla osób niedowidzących, na przykład storyteller w tle w filmach.
  • Wyodrębnianie szczegółowych informacji na temat marki na

Zagadnienia i ograniczenia dotyczące wybierania przypadku użycia

  • Dokładnie zastanów się nad dokładnością wyników, aby promować dokładniejsze wykrywanie, sprawdzić jakość dźwięku i obrazów, niskiej jakości dźwięku i obrazów może mieć wpływ na wykryte szczegółowe informacje.
  • Nazwane jednostki wykrywają tylko szczegółowe informacje w obrazach i dźwiękach. Nie można wykryć logo w nazwie marki.
  • Należy dokładnie wziąć pod uwagę, że w przypadku korzystania z organów ścigania nazwanych jednostek nie zawsze mogą wykrywać części dźwięku. Aby zapewnić uczciwe i wysokiej jakości decyzje, połącz nazwane jednostki z nadzorem człowieka.
  • Nie używaj nazwanych jednostek do podejmowania decyzji, które mogą mieć poważne negatywne skutki. Modele uczenia maszynowego, które wyodrębniają tekst, mogą spowodować niewykryte lub nieprawidłowe dane wyjściowe tekstu. Decyzje oparte na nieprawidłowych danych wyjściowych mogą mieć poważny negatywny wpływ. Ponadto zaleca się uwzględnienie przeglądu przez człowieka decyzji, które mogą mieć poważny wpływ na osoby.