Che cos'è la traduzione vocale?

Questo articolo illustra i vantaggi e le funzionalità del servizio di traduzione vocale, che consente la conversione vocale e il riconoscimento vocale dei flussi audio, fornendo una traduzione in tempo reale e in più lingue.

Usando Speech SDK o l'interfaccia della riga di comando di Voce è possibile consentire ad applicazioni, strumenti e dispositivi di accedere alle trascrizioni di origine e agli output di traduzione per l'audio fornito. I risultati della trascrizione e della traduzione provvisorie vengono restituiti quando viene rilevato il parlato e i risultati finali possono essere convertiti in sintesi vocale.

Per un elenco delle lingue supportate per la traduzione vocale, vedere Lingue e voci supportate.

Funzionalità di base

  • Riconoscimento vocale e traduzione con risultati del riconoscimento.
  • Conversione vocale e traduzione.
  • Supporto per la traduzione in più lingue di destinazione.
  • Risultati provvisori del riconoscimento e della traduzione.

Operazioni preliminari

Per iniziare, provare la Guida di avvio rapido sulla traduzione vocale. Il servizio di traduzione vocale è disponibile tramite Speech SDK e l'interfaccia della riga di comando di Voce.

Su GitHub sono disponibili esempi di riconoscimento vocale e traduzione di Speech SDK. Questi esempi esaminano scenari comuni come la lettura di audio da un file o un flusso, la traduzione e il riconoscimento continuo e singolo e l'uso di modelli personalizzati.

Passaggi successivi