Condividi tramite


Che cos'è l'interfaccia della riga di comando per Voce?

L'interfaccia della riga di comando di Voce è uno strumento da riga di comando che consente di usare il servizio Voce senza dover scrivere codice. L'interfaccia della riga di comando di Voce richiede una configurazione minima. È possibile usarla facilmente per provare le principali funzionalità del servizio Voce e vedere come funziona con i propri casi d'uso. In pochi minuti è possibile eseguire flussi di lavoro di test semplici, come il riconoscimento vocale in batch da una directory di file o la sintesi vocale su una raccolta di stringhe di un file. Oltre ai flussi di lavoro semplici, l'interfaccia della riga di comando di Voce può essere usata in ambiente di produzione ed è possibile aumentarne le prestazioni per eseguire processi di dimensioni maggiori usando script .bat o della shell automatizzati.

La maggior parte delle funzionalità di Speech SDK è disponibile nell'interfaccia della riga di comando per Voce e alcune funzionalità e personalizzazioni avanzate sono semplificate nell'interfaccia della riga di comando per Voce. Per decidere quando usare l'interfaccia della riga di comando di Voce e quando usare Speech SDK, considerare le indicazioni seguenti.

Usare l'interfaccia della riga di comando per Voce se:

  • Si vogliono provare le funzionalità del servizio Voce con una configurazione minima e senza bisogno di scrivere codice.
  • Si hanno requisiti relativamente semplici per un'applicazione di produzione che usa il servizio Voce.

Usare Speech SDK se:

  • Si vuole integrare la funzionalità del servizio Voce all'interno di un linguaggio o una piattaforma specifici, ad esempio C#, Python o C++.
  • Si hanno requisiti complessi per cui occorrono richieste di servizio avanzate.
  • Si sta sviluppando un comportamento personalizzato, che include lo streaming delle risposte.

Funzionalità di base

  • Riconoscimento vocale: converte la voce in testo scritto da file audio o direttamente da un microfono o trascrive una conversazione registrata.

  • Sintesi vocale: converte il testo scritto in voce usando l'input di file di testo o immettendolo direttamente dalla riga di comando. È possibile personalizzare le caratteristiche dell'output vocale usando le configurazioni SSML (Speech Synthesis Markup Language).

  • Traduzione vocale: traduce l'audio in una lingua di origine in testo o audio in una lingua di destinazione.

  • Esecuzione sulle risorse di calcolo di Azure: è possibile inviare i comandi dell'interfaccia della riga di comando di Voce per l'esecuzione su una risorsa di calcolo remota di Azure usando spx webjob.

Operazioni preliminari

Per iniziare a usare l'interfaccia della riga di comando di Voce, vedere la guida di avvio rapido. Questo articolo mostra come eseguire alcuni comandi di base. Illustra anche alcuni comandi leggermente più avanzati per l'esecuzione di operazioni in batch per il riconoscimento vocale e la sintesi vocale. Dopo aver letto l'articolo sulle nozioni di base, si dovrebbe conoscere sufficientemente la sintassi da iniziare a scrivere alcuni comandi personalizzati o automatizzare semplici operazioni del servizio Voce.

Passaggi successivi