Omówienie szczegółowych informacji o wykrywaniu efektów dźwiękowych

Artykuł
07/16/2024

Ostrzeżenie

W ciągu ostatniego roku usługa Azure AI Video Indexer (VI) ogłosiła usunięcie zależności od usługi Azure Media Services (AMS) ze względu na wycofanie. Ogłoszono korekty funkcji i zmiany , a przewodnik migracji został udostępniony.

Termin zakończenia migracji wynosił 30 czerwca 2024 r. Vi przedłużyła termin aktualizacji/migracji, dzięki czemu możesz zaktualizować konto VI i wyrazić zgodę na migrację zasobów usługi AMS VI do 15 lipca 2024 r. Aby korzystać z migracji zasobów usługi AMS VI, musisz również rozszerzyć konto usługi AMS do lipca. Przejdź do konta usługi AMS w witrynie Azure Portal i wybierz pozycję Kliknij tutaj, aby rozszerzyć.

Jednak po 30 czerwca, jeśli nie zaktualizowano konta VI, nie będzie można indeksować nowych filmów wideo ani nie będzie można odtworzyć żadnych filmów wideo, które nie zostały zmigrowane. Jeśli zaktualizujesz konto po 30 czerwca, możesz wznowić indeksowanie natychmiast, ale nie będzie można odtworzyć filmów wideo indeksowanych przed aktualizacją konta, dopóki nie zostaną zmigrowane za pośrednictwem migracji usługi AMS VI.

Wykrywanie efektów dźwiękowych

Wykrywanie efektów dźwiękowych wykrywa szczegółowe informacje na temat zdarzeń akustycznych i klasyfikuje je do kategorii, takich jak śmiech, reakcje tłumu, alarmy i/lub syreny.

Przypadki użycia efektów dźwiękowych

Firmy z dużym archiwum wideo mogą zwiększyć dostępność, oferując więcej kontekstu dla osób niedosłyszących przez transkrypcję efektów niespeechowych.
Zwiększona wydajność podczas tworzenia danych pierwotnych dla twórców zawartości. Ważne chwile w promos i przyczepy, takie jak śmiech, reakcje tłumu, strzały lub eksplozje można zidentyfikować, na przykład w Media and Entertainment.
Wykrywanie i klasyfikowanie strzałów, eksplozji i szkła rozbijania się w systemie smart-city lub w innych środowiskach publicznych, które obejmują kamery i mikrofony, aby zapewnić szybkie i dokładne wykrywanie incydentów przemocy.

Wyświetlanie kodu JSON szczegółowych informacji za pomocą portalu internetowego

Po przekazaniu i zaindeksowaniu klipu wideo szczegółowe informacje są dostępne w formacie JSON do pobrania przy użyciu portalu internetowego.

Wybierz kartę Biblioteka .
Wybierz multimedia, z którym chcesz pracować.
Wybierz pozycję Pobierz i Szczegółowe informacje (JSON). Plik JSON zostanie otwarty na nowej karcie przeglądarki.

Poszukaj pary kluczy opisanej w przykładowej odpowiedzi.

    "audioEffects": [
      {
        "id": 1,
        "type": "Silence",
        "instances": [
          {
            "confidence": 0,
            "adjustedStart": "0:01:46.243",
            "adjustedEnd": "0:01:50.434",
            "start": "0:01:46.243",
            "end": "0:01:50.434"
          }
        ]
      },
      {
        "id": 2,
        "type": "Speech",
        "instances": [
          {
            "confidence": 0,
            "adjustedStart": "0:00:00",
            "adjustedEnd": "0:01:43.06",
            "start": "0:00:00",
            "end": "0:01:43.06"
          }
        ]
      }
    ]

Podczas procedury wykrywania efektów audio dźwięku dźwięk w pliku multimedialnym jest przetwarzany w następujący sposób:

Składnik	Definicja
Plik źródłowy	Użytkownik przekazuje plik źródłowy do indeksowania.
Segmentacja	Dźwięk jest analizowany, audio nonspeech jest identyfikowane, a następnie podzielone na krótkie nakładające się wewnętrzne.
Klasyfikacja	Proces sztucznej inteligencji analizuje poszczególne segmenty i klasyfikuje jego zawartość do kategorii zdarzeń, takich jak reakcja tłumu lub śmiech. Następnie jest tworzona lista prawdopodobieństwa dla każdej kategorii zdarzeń zgodnie z regułami specyficznymi dla działu.
Poziom ufności	Szacowany poziom ufności każdego efektu audio jest obliczany jako zakres od 0 do 1. Wskaźnik ufności reprezentuje pewność dokładności wyniku. Na przykład 82% pewność jest reprezentowana jako wynik 0,82.

Udostępnij za pośrednictwem

Omówienie szczegółowych informacji o wykrywaniu efektów dźwiękowych

Wykrywanie efektów dźwiękowych

Przypadki użycia efektów dźwiękowych

Wyświetlanie kodu JSON szczegółowych informacji za pomocą portalu internetowego

Notatka dotycząca przezroczystości

Opinia

Opinia

Dodatkowe zasoby