Che cos'è la traduzione vocale?
In questo articolo vengono illustrati i vantaggi e le funzionalità del servizio di traduzione vocale, che consente la traduzione vocale in tempo reale e multilingue per la sintesi vocale e la traduzione vocale dei flussi audio.
Usando Speech SDK o l'interfaccia della riga di comando di Voce, è possibile concedere alle applicazioni, agli strumenti e ai dispositivi l'accesso alle trascrizioni di origine e agli output di traduzione per l'audio fornito. I risultati della trascrizione e della traduzione provvisoria vengono restituiti quando viene rilevato il riconoscimento vocale e i risultati finali possono essere convertiti in sintesi vocale.
Per un elenco delle lingue supportate per la traduzione vocale, vedere Supporto vocale e lingua.
Funzionalità di base
- Traduzione vocale con risultati di riconoscimento vocale.
- Traduzione vocale.
- Supporto per la traduzione in più lingue di destinazione.
- Risultati provvisori di riconoscimento e traduzione.
Attività iniziali
Come primo passaggio, provare la guida introduttiva alla traduzione vocale. Il servizio di traduzione vocale è disponibile tramite Speech SDK e l'interfaccia della riga di comando di Voce.
Gli esempi di riconoscimento vocale e traduzione di Speech SDK sono disponibili in GitHub. Questi esempi riguardano scenari comuni, ad esempio la lettura dell'audio da un file o da un flusso, il riconoscimento e la traduzione continui e a singolo scatto e l'uso di modelli personalizzati.
Passaggi successivi
- Provare la guida introduttiva alla traduzione vocale
- Installare Speech SDK
- Installare l'interfaccia della riga di comando di Voce