Qu’est-ce que la traduction vocale ?

Dans cet article, vous découvrez les avantages et les fonctionnalités du service de traduction vocale, qui permet de traduire en temps réel les flux audio multilingues de parole en parole et de parole en texte.

Avec le SDK Speech ou l’interface CLI Speech, vous donnez à vos applications, outils et appareils l’accès à une transcription de la source et à une traduction en sortie pour l’audio fourni. Des résultats de transcription et de traduction intermédiaires sont retournés dès que la parole est détectée, et les résultats finaux peuvent être convertis en synthèse vocale.

Pour obtenir la liste des langues prises en charge pour la traduction vocale, consultez Prise en charge de la langue et de la voix.

Fonctionnalités de base

  • Traduction de la parole en texte avec les résultats de la reconnaissance.
  • Traduction de la parole en parole.
  • Prise en charge de la traduction dans plusieurs langues cibles.
  • Résultats de reconnaissance et de traduction intermédiaires.

Bien démarrer

À la première étape, essayez le guide de démarrage rapide de la traduction vocale. La traduction vocale est disponible via le kit de développement logiciel (SDK) Speech et l’interface CLI.

Vous trouverez des exemples de traduction et de reconnaissance vocale avec le Kit de développement logiciel (SDK) Speech sur GitHub. Ces exemples couvrent des scénarios courants tels que la lecture du signal audio d’un fichier ou d’un flux, la reconnaissance et la traduction uniques et continues, et l’utilisation de modèles personnalisés.

Étapes suivantes