Documentation sur la reconnaissance vocale
La reconnaissance vocale du service Speech permet la transcription en temps réel et la transcription par lot des flux audio en texte. Avec une entrée de texte de référence supplémentaire, elle permet également l’évaluation de la prononciation en temps réel et donne aux orateurs un retour d’expérience concertant l’exactitude et la fluidité de leur façon de parler.
À propos de la reconnaissance vocale
Vue d’ensemble
- Qu’est-ce que la reconnaissance vocale en temps réel ?
- Qu’est-ce que la reconnaissance vocale avec traitement par lots ?
- Qu’est-ce que la reconnaissance vocale personnalisée ?
- Utiliser l’interface CLI Speech pour la reconnaissance vocale sans code
Démarrage rapide
Développer avec la reconnaissance vocale
Guide pratique
- Utiliser l’API de transcription rapide
- Créer un projet de voix personnalisée
- Effectuer l’apprentissage d’un modèle pour la reconnaissance vocale personnalisée
- Utiliser des formats d’entrée audio compressés