Identifier automatiquement la langue parlée avec le modèle d’identification de langue

Important

En raison de l’annonce de mise hors service d’Azure Media Services, Azure AI Video Indexer annonce les ajustements des fonctionnalités d’Azure AI Video Indexer. Consultez les modifications relatives à la mise hors service Azure Media Service (AMS) pour comprendre ce que cela signifie pour votre compte Azure AI Video Indexer. Consultez le guide de préparation de la mise hors service AMS : Mise à jour et migration vi.

Azure AI Video Indexer prend en charge l’identification automatique de la langue (LID), qui est le processus d’identification automatique de la langue parlée à partir du contenu audio. Le fichier multimédia est transcrit dans la langue dominante identifiée.

Consultez la liste des langues prises en charge par Azure AI Video Indexer dans les langues prises en charge.

Veillez à consulter la section Recommandations et limitations .

Choix de l’identification de la langue automatique pour l’indexation

Lors de l’indexation ou de la réindexation d’une vidéo à l’aide de l’API, choisissez l’option auto detect dans le paramètre sourceLanguage.

Lorsque vous utilisez le portail, accédez à vos vidéos de compte sur la page d’accueil d’Azure AI Video Indexer et pointez sur le nom de la vidéo que vous souhaitez réindexer. Dans le coin inférieur droit, sélectionnez le bouton Réindexer . Dans la boîte de dialogue Réindexer la vidéo, choisissez Détection automatique dans la liste déroulante Langue de la source vidéo.

Capture d’écran montrant où sélectionner la détection automatique.

Sortie du modèle

Azure AI Video Indexer transcrit la vidéo en fonction de la langue la plus probable si la confiance pour cette langue est > 0.6. Si la langue ne peut pas être identifiée en toute confiance, l’outil suppose que la langue parlée est l’anglais.

Le langage dominant du modèle est disponible dans Insights JSON en tant qu’attribut sourceLanguage (sous root/videos/insights). Un score de confiance correspondant est également disponible sous l’attribut sourceLanguageConfidence.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Directives et limitations

L’identification automatique de la langue (LID) prend en charge les langues suivantes :

Consultez la liste des langues prises en charge par Azure AI Video Indexer dans les langues prises en charge.

  • Si l’audio contient des langues autres que la liste prise en charge, le résultat est inattendu.
  • Si Azure AI Video Indexer ne peut pas identifier la langue avec une confiance suffisante (supérieure à 0,6), la langue de secours est l’anglais.
  • Actuellement, il n’existe pas de prise en charge des fichiers avec audio en langage mixte. Si l’audio contient des langues mixtes, le résultat est incertain.
  • L’audio de faible qualité peut affecter les résultats du modèle.
  • Le modèle requiert au moins une minute de parole dans l’audio.
  • Le modèle est conçu pour reconnaître un discours conversationnel spontané (pas les commandes vocales, le chant, etc.).