Partage via


Identifier automatiquement la langue parlée avec le modèle d’identification de langue

Avertissement

Au cours de la dernière année, Azure AI Video Indexer (VI) a annoncé la suppression de sa dépendance vis-à-vis d’Azure Media Services (AMS) en raison de sa mise hors service. Les ajustements et modifications des fonctionnalités ont été annoncés et un guide de migration a été fourni.

L’échéance de la migration a été le 30 juin 2024. VI a étendu l’échéance de mise à jour/migration afin de pouvoir mettre à jour votre compte VI et opter pour la migration des ressources AMS VI jusqu’au 15 juillet 2024. Pour utiliser la migration des ressources AMS VI, vous devez également étendre votre compte AMS à juillet. Accédez à votre compte AMS dans le Portail Azure, puis sélectionnez Cliquez ici pour étendre.

Toutefois, après le 30 juin, si vous n’avez pas mis à jour votre compte VI, vous ne pourrez pas indexer de nouvelles vidéos et vous serez en mesure de lire des vidéos qui n’ont pas été migrées. Si vous mettez à jour votre compte après le 30 juin, vous pouvez reprendre l’indexation immédiatement, mais vous ne pourrez pas lire les vidéos indexées avant la mise à jour du compte tant qu’ils ne sont pas migrés via la migration AMS VI.

Azure AI Video Indexer prend en charge l’identification automatique de la langue (LID), qui est le processus d’identification automatique de la langue parlée à partir du contenu audio. Le fichier multimédia est transcrit dans la langue dominante identifiée.

Consultez la liste des langues prises en charge par Azure AI Video Indexer dans les langues prises en charge.

Veillez à consulter la section Recommandations et limitations .

Choix de l’identification de la langue automatique pour l’indexation

Lors de l’indexation ou de la réindexation d’une vidéo à l’aide de l’API, choisissez l’option auto detect dans le paramètre sourceLanguage.

Lorsque vous utilisez le portail, accédez à vos vidéos de compte sur la page d’accueil d’Azure AI Video Indexer et pointez sur le nom de la vidéo que vous souhaitez réindexer. Dans le coin inférieur droit, sélectionnez le bouton Réindexer . Dans la boîte de dialogue Réindexer la vidéo, choisissez Détection automatique dans la liste déroulante Langue de la source vidéo.

Capture d’écran montrant où sélectionner la détection automatique.

Sortie du modèle

Azure AI Video Indexer transcrit la vidéo en fonction de la langue la plus probable si la confiance pour cette langue est > 0.6. Si la langue ne peut pas être identifiée en toute confiance, l’outil suppose que la langue parlée est l’anglais.

Le langage dominant du modèle est disponible dans Insights JSON en tant qu’attribut sourceLanguage (sous root/videos/insights). Un score de confiance correspondant est également disponible sous l’attribut sourceLanguageConfidence.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Directives et limitations

L’identification automatique de la langue (LID) prend en charge les langues suivantes :

Consultez la liste des langues prises en charge par Azure AI Video Indexer dans les langues prises en charge.

  • Si l’audio contient des langues autres que la liste prise en charge, le résultat est inattendu.
  • Si Azure AI Video Indexer ne peut pas identifier la langue avec une confiance suffisante (supérieure à 0,6), la langue de secours est l’anglais.
  • Actuellement, il n’existe pas de prise en charge des fichiers avec audio en langage mixte. Si l’audio contient des langues mixtes, le résultat est incertain.
  • L’audio de faible qualité peut affecter les résultats du modèle.
  • Le modèle requiert au moins une minute de parole dans l’audio.
  • Le modèle est conçu pour reconnaître un discours conversationnel spontané (pas les commandes vocales, le chant, etc.).