Condividi tramite


Che cos'è un assistente vocale?

Tramite gli assistenti vocali con il servizio Voce, gli sviluppatori possono creare interfacce per una conversazione naturale simile a quella umana per applicazioni ed esperienze personalizzate. Il servizio assistente vocale offre un'interazione rapida e affidabile tra un dispositivo e un'implementazione dell'assistente.

Scegliere una soluzione di assistente

Il primo passaggio per la creazione di un assistente vocale consiste nel decidere cosa si vuole che faccia. Il servizio Voce offre più soluzioni complementari per la creazione di interazioni con l'assistente. È possibile creare un'applicazione che supporti una conversazione aperta con frasi come "Devo andare a Seattle" o "Che tipo di pizza posso ordinare?" Per ottenere flessibilità e versatilità, è possibile aggiungere funzionalità vocali in ingresso e in uscita a un bot usando il servizio Azure AI Bot con il canale Direct Line Speech.

Se non si sa con certezza cosa deve fare l'assistente, è consigliabile scegliere Direct Line Speech. Questa soluzione offre l'integrazione con un set completo di strumenti e supporti per la creazione, ad esempio la soluzione Assistente virtuale e i modelli aziendali, nonché il servizio QnA Maker per creare modelli comuni e usare le origini di informazioni esistenti.

Architettura di riferimento per la creazione di un assistente vocale tramite Speech SDK

Diagramma concettuale del flusso del servizio di orchestrazione dell’assistente vocale.

Funzionalità di base

Sia che si scelga Direct Line Speech o un'altra soluzione per creare le interazioni con l'assistente, è possibile usare un set completo di funzionalità di personalizzazione per personalizzare l'assistente in base al marchio, al prodotto e alla personalità desiderati.

Categoria Funzionalità
Parola chiave personalizzata Gli utenti possono avviare conversazioni con gli assistenti usando una parola chiave personalizzata, ad esempio "Ehi Contoso". A tale scopo, un'app usa un motore di parole chiave personalizzate in Speech SDK, che è possibile configurare seguendo la procedura in Guida introduttiva: Creare una parola chiave personalizzata. Gli assistenti vocali possono usare la verifica delle parole chiave sul lato del servizio, anziché usando solo il dispositivo, per migliorare l'accuratezza dell'attivazione tramite parola chiave.
Riconoscimento vocale Gli assistenti vocali convertono in tempo reale l'audio in testo usando il riconoscimento vocale dal servizio Voce. Il testo trascritto è disponibile sia per l'implementazione dell'assistente che per l'applicazione client.
Sintesi vocale Le risposte in formato testuale dell'assistente vengono sintetizzate tramite la sintesi vocale del servizio Voce. Il risultato viene quindi reso disponibile per l'applicazione client come flusso audio. Microsoft offre la possibilità di creare una voce personalizzata e di alta qualità tramite sintesi vocale neurale per dare voce a un marchio.

Introduzione agli assistenti vocali

Il seguente articolo di avvio rapido è progettato per consentire di creare codice eseguibile in meno di 10 minuti: Avvio rapido: Creare un assistente vocale personalizzato con Direct Line Speech

Codice di esempio ed esercitazioni

Il codice di esempio per la creazione di un assistente vocale è disponibile in GitHub. Gli esempi riguardano l'applicazione client per la connessione all'assistente in diversi linguaggi di programmazione comuni.

Personalizzazione

Gli assistenti vocali creati tramite il servizio Voce possono usare un'ampia gamma di opzioni di personalizzazione.

Nota

Le opzioni di personalizzazione variano in base alla lingua e alle impostazioni locali. Per altre informazioni, vedere Lingue supportate.

Passaggi successivi