Che cos'è la traduzione vocale?
Questo articolo illustra i vantaggi e le funzionalità del servizio di traduzione vocale, che consente la conversione vocale e il riconoscimento vocale dei flussi audio, fornendo una traduzione in tempo reale e in più lingue.
Usando Speech SDK o l'interfaccia della riga di comando di Voce è possibile consentire ad applicazioni, strumenti e dispositivi di accedere alle trascrizioni di origine e agli output di traduzione per l'audio fornito. I risultati della trascrizione e della traduzione provvisorie vengono restituiti quando viene rilevato il parlato e i risultati finali possono essere convertiti in sintesi vocale.
Per un elenco delle lingue supportate per la traduzione vocale, vedere Lingue e voci supportate.
Funzionalità di base
- Riconoscimento vocale e traduzione con risultati del riconoscimento.
- Conversione vocale e traduzione.
- Supporto per la traduzione in più lingue di destinazione.
- Risultati provvisori del riconoscimento e della traduzione.
Operazioni preliminari
Per iniziare, provare la Guida di avvio rapido sulla traduzione vocale. Il servizio di traduzione vocale è disponibile tramite Speech SDK e l'interfaccia della riga di comando di Voce.
Su GitHub sono disponibili esempi di riconoscimento vocale e traduzione di Speech SDK. Questi esempi esaminano scenari comuni come la lettura di audio da un file o un flusso, la traduzione e il riconoscimento continuo e singolo e l'uso di modelli personalizzati.
Passaggi successivi
- Provare la Guida di avvio rapido sulla traduzione vocale
- Installare Speech SDK
- Installare l'l'interfaccia della riga di comando per Voce