Delen via


De gesproken taal automatisch identificeren met het taalidentificatiemodel

Belangrijk

Vanwege de aankondiging van buitengebruikstelling van Azure Media Services kondigt Azure AI Video Indexer-functies aan. Zie Wijzigingen met betrekking tot buitengebruikstelling van Azure Media Service (AMS) om te begrijpen wat dit betekent voor uw Azure AI Video Indexer-account. Zie de handleiding voorbereiden voor AMS-buitengebruikstelling: VI-update en migratiehandleiding.

Azure AI Video Indexer ondersteunt automatische taalidentificatie (LID). Dit is het proces voor het automatisch identificeren van de gesproken taal van audio-inhoud. Het mediabestand wordt getranscribeerd in de dominante geïdentificeerde taal.

Bekijk de lijst met ondersteunde talen van Azure AI Video Indexer in ondersteunde talen.

Zorg ervoor dat u de sectie Richtlijnen en beperkingen bekijkt.

Automatische taalidentificatie kiezen voor indexering

Wanneer u een video indexeert of opnieuw indexeert met behulp van de API, kiest u de auto detect optie in de sourceLanguage parameter.

Wanneer u de portal gebruikt, gaat u naar uw accountvideo's op de startpagina van Azure AI Video Indexer en beweegt u de muisaanwijzer over de naam van de video die u opnieuw wilt indexeren. Selecteer in de rechterbenedenhoek de knop Opnieuw indexeren . Kies in het dialoogvenster Video opnieuw indexeren de optie Automatisch detecteren in de vervolgkeuzelijst Videobrontaal.

Schermopname die laat zien waar automatisch detecteren moet worden geselecteerd.

Uitvoer van model

Azure AI Video Indexer transcribeert de video volgens de meest waarschijnlijke taal als het vertrouwen voor die taal is > 0.6. Als de taal niet met vertrouwen kan worden geïdentificeerd, wordt ervan uitgegaan dat de gesproken taal Engels is.

Model dominante taal is beschikbaar in de inzichten JSON als het sourceLanguage kenmerk (onder root/videos/insights). Er is ook een bijbehorende betrouwbaarheidsscore beschikbaar onder het sourceLanguageConfidence kenmerk.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Richtlijnen en beperkingen

Automatische taalidentificatie (LID) ondersteunt de volgende talen:

Bekijk de lijst met ondersteunde talen van Azure AI Video Indexer in ondersteunde talen.

  • Als het geluid andere talen bevat dan de ondersteunde lijst, is het resultaat onverwacht.
  • Als Azure AI Video Indexer de taal niet kan identificeren met een hoge betrouwbaarheid (groter dan 0,6), is de terugvaltaal Engels.
  • Op dit moment is er geen ondersteuning voor bestanden met audio in gemengde talen. Als de audio gemengde talen bevat, is het resultaat onverwacht.
  • Audio van lage kwaliteit kan van invloed zijn op de modelresultaten.
  • Het model vereist ten minste één minuut spraak in de audio.
  • Het model is ontworpen om een spontane gespreksspraak te herkennen (geen spraakopdrachten, zingen, enzovoort).