Udostępnij za pośrednictwem


Wnioskowanie tematów

Ważne

Ze względu na ogłoszenie wycofania usługi Azure Media Services usługa Azure AI Video Indexer ogłasza zmiany funkcji usługi Azure AI Video Indexer. Zobacz Zmiany związane z wycofaniem usługi Azure Media Service (AMS), aby dowiedzieć się, co to oznacza dla konta usługi Azure AI Video Indexer. Zobacz Przewodnik Przygotowywanie do wycofania usługi AMS: VI aktualizacji i migracji.

Wnioskowanie tematów to funkcja sztucznej inteligencji usługi Azure AI Video Indexer, która automatycznie tworzy wnioskowane szczegółowe informacje pochodzące z transkrypcji audio, zawartości OCR w tekście wizualnym i osobistości rozpoznawane w filmie wideo przy użyciu modelu rozpoznawania twarzy usługi Video Indexer. Wyodrębnione tematy i kategorie (jeśli są dostępne) są wyświetlane na karcie Szczegółowe informacje. Aby przejść do tematu w pliku multimedialnym, kliknij pozycję Temat —> Odtwórz poprzedni lub Odtwórz dalej.

Wynikowe szczegółowe informacje są również generowane na liście podzielonej na kategorie w pliku JSON, który zawiera nazwę tematu, przedział czasu i współczynnik ufności.

Wymagania wstępne

Przegląd noty przezroczystości

Wyświetlanie szczegółowych informacji

Aby wyświetlić szczegółowe informacje dotyczące wnioskowania tematów w witrynie internetowej.

  1. Przejdź do obszaru Szczegółowe informacje i przewiń do obszaru Tematy.

Aby wyświetlić wystąpienia w pliku JSON, wykonaj następujące czynności:

  1. Kliknij pozycję Pobierz —> szczegółowe informacje (JSON).

  2. topics Skopiuj tekst i wklej go do przeglądarki JSON.

    "topics": [
      {
        "id": 1,
        "name": "Pens",
        "referenceId": "Category:Pens",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Pens",
        "referenceType": "Wikipedia",
        "confidence": 0.6833,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:30",
            "adjustedEnd": "0:01:17.5",
            "start": "0:00:30",
            "end": "0:01:17.5"
          }
        ]
      },
      {
        "id": 2,
        "name": "Musical groups",
        "referenceId": "Category:Musical_groups",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Musical_groups",
        "referenceType": "Wikipedia",
        "confidence": 0.6812,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:10",
            "adjustedEnd": "0:01:17.5",
            "start": "0:01:10",
            "end": "0:01:17.5"
          }
        ]
      },
    

Aby pobrać plik JSON za pośrednictwem interfejsu API, użyj portalu deweloperów usługi Azure AI Video Indexer.

Aby uzyskać więcej informacji, zobacz tematy.

Składniki tematów

Podczas procedury indeksowania tematów wyodrębniane są tematy w następujący sposób:

Składnik Definicja
Język źródłowy Użytkownik przekazuje plik źródłowy do indeksowania.
Przetwarzanie wstępne Transkrypcja, OCR i sztuczna inteligencja rozpoznawania twarzy wyodrębnia szczegółowe informacje z pliku multimedialnego.
Przetwarzanie szczegółowych informacji Tematy AI analizuje transkrypcję, OCR i szczegółowe informacje dotyczące rozpoznawania twarzy wyodrębnione podczas przetwarzania wstępnego:
- Transkrypcja tekstu, każdy wiersz transkrypcji wglądu w tekst jest badany przy użyciu technologii sztucznej inteligencji opartej na analizie ontologii.
- Szczegółowe informacje o rozpoznawaniu twarzy i rozpoznawania twarzy są analizowane razem przy użyciu technologii sztucznej inteligencji opartej na analizie ontologii.
Przetwarzanie końcowe - Transkrypcja tekstu, szczegółowe informacje są wyodrębniane i powiązane z kategorią Temat wraz z numerem wiersza transkrypowanego tekstu. Na przykład polityka w wierszu 7.
- OCR i rozpoznawanie twarzy każdy wgląd jest powiązany z kategorią Temat wraz z czasem wystąpienia tematu w pliku multimedialnym. Na przykład Freddie Mercury w kategoriach People and Music na 20.00.
Wartość ufności Szacowany poziom ufności każdego tematu jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82.

Przykładowe przypadki użycia

  • Personalizacja przy użyciu wnioskowania tematów w celu dopasowania do zainteresowań klientów, na przykład witryn internetowych dotyczących anglii publikujące promocje na temat angielskich filmów lub festiwali.
  • Głębokie wyszukiwanie archiwów w celu uzyskania szczegółowych informacji na temat konkretnych tematów w celu tworzenia historii funkcji dotyczących firm, osób lub technologii, na przykład przez agencję informacyjną.
  • Zarabianie, zwiększając wartość wyodrębnionych szczegółowych informacji. Na przykład branże, takie jak wiadomości lub media społecznościowe, które opierają się na przychodach z reklam, mogą dostarczać odpowiednie reklamy przy użyciu wyodrębnionych szczegółowych informacji jako dodatkowych sygnałów do serwera reklam.

Zagadnienia i ograniczenia dotyczące wybierania przypadku użycia

Poniżej przedstawiono kilka zagadnień, które należy wziąć pod uwagę podczas korzystania z tematów:

  • Podczas przekazywania pliku zawsze używaj wysokiej jakości zawartości wideo. Zalecany maksymalny rozmiar ramki to HD, a szybkość klatek na sekundę to 30 KLATEK NA SEKUNDĘ. Ramka powinna zawierać nie więcej niż 10 osób. Podczas wyprowadzania ramek z filmów wideo do modeli sztucznej inteligencji wysyłaj tylko około 2 lub 3 klatek na sekundę. Przetwarzanie 10 i więcej ramek może opóźnić wynik sztucznej inteligencji.
  • Podczas przekazywania pliku zawsze używaj wysokiej jakości zawartości audio i wideo. Do przeprowadzenia analizy wymagane jest co najmniej 1 minuta spontanicznej mowy konwersacyjnej. Efekty dźwiękowe są wykrywane tylko w segmentach innych niż mowa. Minimalny czas trwania sekcji innej niż mowa wynosi 2 sekundy. Polecenia głosowe i śpiew nie są obsługiwane.
  • Zazwyczaj małe osoby lub obiekty poniżej 200 pikseli i osoby siedzące mogą nie być wykrywane. Osoby noszące podobne ubrania lub mundury mogą zostać wykryte jako ta sama osoba i otrzymają ten sam numer identyfikacyjny. Osoby lub obiekty, które są utrudnione, mogą nie zostać wykryte. Ślady osób z przednimi i tylnymi pozycjami mogą być podzielone na różne wystąpienia.