Documentazione del riconoscimento vocale
Il riconoscimento vocale del servizio Voce, noto anche come riconoscimento vocale, consente la trascrizione in batch e in tempo reale di flussi audio in testo. Con un input di testo di riferimento aggiuntivo, consente anche di valutare la pronuncia in tempo reale e di fornire commenti e suggerimenti sull'accuratezza e la fluidità dell'audio parlato.
Informazioni sul riconoscimento vocale
Panoramica
- Che cos'è il riconoscimento vocale in tempo reale?
- Che cos'è il riconoscimento vocale in batch?
- Che cos'è il Riconoscimento vocale personalizzato?
- Usare CLI di Voce per il riconoscimento vocale senza codice
Avvio rapido
Sviluppare con il riconoscimento vocale
Guida pratica
- Usare l'API di Trascrizione rapida
- Creare un progetto di Riconoscimento vocale personalizzato
- Eseguire il training di un modello per Riconoscimento vocale personalizzato
- Usare formati di input audio compressi