Qu’est-ce qu’un Assistant vocal ?

Article
01/22/2024

Avec les assistants vocaux qui utilisent le service Speech, les développeurs peuvent créer des interfaces conversationnelles naturelles pour leurs applications et leurs expériences. Le service d’assistant vocal permet une interaction rapide et fiable entre un appareil et une implémentation d’assistant.

Choix d’une solution d’Assistant

La première étape de la création d’un assistant vocal consiste à décider de ce que vous voulez faire. Le service Speech fournit plusieurs solutions complémentaires pour la création des interactions de votre Assistant. Supposons que vous souhaitez que votre application prenne en charge une conversation ouverte avec des expressions telles que « Je dois aller à Seattle » ou « Quel genre de pizza puis-je commander ? ». Pour plus de flexibilité et de polyvalence, vous pouvez ajouter des fonctionnalités d’entrée et de sortie de voix à un bot en utilisant Azure AI Bot Service avec le canal Direct Line Speech.

Si vous n’êtes pas encore sûr de ce que vous voulez que votre assistant fasse, nous vous recommandons d’utiliser Direct Line Speech comme option idéale. Il offre une intégration avec un ensemble complet d’outils et d’aides à la création, comme le modèle de solution d’Assistant virtuel et d’entreprise et le service QnA Maker pour créer des modèles courants et utiliser vos sources de connaissances existantes.

Architecture de référence pour la création d’un assistant vocal à l’aide du kit de développement logiciel (SDK) Speech

Conceptual diagram of the voice assistant orchestration service flow.

Fonctionnalités de base

Que vous choisissiez Direct Line Speech ou une autre solution pour créer les interactions de votre assistant, vous pouvez utiliser un ensemble complet de fonctionnalités de personnalisation pour personnaliser votre assistant avec votre marque, votre produit et votre personnalité.

Category	Fonctionnalités
Mot clé personnalisé	Les utilisateurs peuvent démarrer des conversations avec des assistants à l’aide d’un mot clé personnalisé, tel que « Hey contoso ». Une application fait cela avec un moteur de mots clés personnalisé dans le kit de développement logiciel (SDK) Speech, que vous pouvez configurer en vous rendant dans prise en main des mots clés personnalisés. Les assistants vocaux peuvent utiliser la vérification des mots clés côté service pour améliorer la précision de l’activation des mots clés (par rapport à l’appareil seul).
Reconnaissance vocale	Les assistants vocaux convertissent en temps réel le contenu audio en texte écrit à l’aide de la reconnaissance vocale du service Speech. Lors de sa transcription, ce texte est disponible pour l’implémentation de votre assistant et votre application cliente.
Synthèse vocale	Les réponses textuelles de votre assistant seront synthétisées à l’aide de la synthèse vocale du service Speech. Cette synthèse est ensuite disponible pour votre application cliente sous forme de flux audio. Microsoft offre la possibilité de créer votre propre Synthèse vocale neuronale (TTS neuronale) personnalisée et de haute qualité qui donne une voix à votre marque.

Prise en main des assistants vocaux

Nous proposons l’article de démarrage rapide suivant pour vous permettre d’exécuter du code en moins de 10 minutes : Démarrage rapide : Créer un assistant vocal personnalisé à l’aide de Direct Line Speech.

Exemple de code et tutoriels

Un exemple de code pour la création d’un assistant vocal est disponible sur GitHub. Les exemples couvrent l’application cliente pour la connexion à votre assistant dans plusieurs langages de programmation populaires.

Personnalisation

Les assistants vocaux que vous générez à l’aide du service Speech peuvent utiliser une gamme complète d’options de personnalisation.

Notes

Les options de personnalisation varient selon la langue et les paramètres régionaux. Pour en savoir plus, consultez Langages pris en charge.