Démarrage rapide : Écouter et parler avec des modèles de conversation dans le terrain de jeu de conversation du portail Azure AI Foundry
Dans le terrain de jeu de conversation du portail Azure AI Foundry, vous pouvez utiliser les fonctionnalités de reconnaissance vocale et synthèse vocale pour interagir avec les modèles de conversation. Vous pouvez essayer le même modèle que celui que vous utilisez pour la conversation textuelle dans une conversation vocale. Il s’agit simplement d’une autre façon d’interagir avec le modèle.
Dans ce guide de démarrage rapide, vous utilisez Azure OpenAI Service et Azure AI Speech pour :
- Parler à l’Assistant via la reconnaissance vocale.
- Entendre la réponse de l’Assistant par le biais de la synthèse vocale.
Les fonctionnalités de reconnaissance vocale et de synthèse vocale peuvent être utilisées ensemble ou séparément dans le terrain de jeu de conversation du portail Azure AI Foundry. Vous pouvez utiliser le terrain de jeu pour tester votre modèle de conversation avant de le déployer.
Prérequis
- Un abonnement Azure : créez-en un gratuitement.
- Un projet Azure AI Foundry.
- Modèle de conversation Azure OpenAI déployé. Ce guide est testé avec un modèle
gpt-4o-mini
.
Configurer le terrain de jeu de conversation
Avant de commencer une session de conversion, vous devez configurer le terrain de jeu de conversion pour utiliser les fonctionnalités de reconnaissance vocale et de synthèse vocale.
Connectez-vous à Azure AI Foundry.
Accédez à votre projet Azure AI Foundry. Si vous devez créer un projet, consultez Créer un projet Azure AI Foundry.
Sélectionnez Terrain de jeu dans le volet gauche, puis sélectionnez un terrain de jeu à utiliser. Dans cet exemple, sélectionnez Essayer le terrain de jeu de conversation.
Sélectionnez votre modèle de conversation déployé dans la liste déroulante Déploiement.
Sélectionnez le bouton Fonctionnalités de conversation.
Remarque
Vous devez également voir les options permettant de sélectionner les boutons microphone ou haut-parleur. Si vous sélectionnez l’un de ces boutons, mais que vous n’avez pas encore activé la reconnaissance vocale ou la synthèse vocale, vous êtes invité à les activer dans Fonctionnalités de conversation.
Dans la page Fonctionnalités de conversation, cochez la case pour confirmer que vous savez que l’utilisation de la fonctionnalité vocale entraîne des coûts supplémentaires. Pour plus d’informations, consultez Tarification d’Azure AI Speech.
Sélectionnez Activer la reconnaissance vocale et Activer la synthèse vocale.
Sélectionnez les paramètres régionaux de langue et la voix que vous souhaitez utiliser pour parler et entendre. La liste des voix disponibles dépend des paramètres régionaux que vous sélectionnez.
Si vous le souhaitez, vous pouvez essayer la voix avant de revenir à la session de conversation. Entrez un exemple de texte et sélectionnez Lire pour
Cliquez sur Enregistrer.
Démarrer une session de conversation
Dans cette session de conversation, vous utilisez à la fois la reconnaissance vocale et la synthèse vocale. Vous utilisez la fonctionnalité de reconnaissance vocale pour parler à l’Assistant et la fonctionnalité de synthèse vocale pour entendre la réponse de l’Assistant.
Suivez les étapes de la Configurer la section de terrain de jeu si vous ne l’avez pas déjà fait. Pour suivre ce guide de démarrage rapide, vous devez activer les fonctionnalités de reconnaissance vocale et de synthèse vocale.
Sélectionnez le bouton du microphone et parlez à l’Assistant. Par exemple, vous pouvez dire « Savez-vous où je peux obtenir une Xbox ? ».
Sélectionnez le bouton Envoyer (flèche droite) pour envoyer votre message à l’Assistant. La réponse de l’Assistant s’affiche dans le volet de session de conversation.
Remarque
Si le bouton haut-parleur est activé, vous entendez la réponse de l’Assistant. Si le bouton haut-parleur est désactivé, vous n’entendez pas la réponse de l’Assistant, mais la réponse s’affiche toujours dans le volet de session de conversation.
Vous pouvez modifier l’invite système pour modifier le format ou le style de réponse de l’Assistant.
Par exemple, entrez :
"You're an AI assistant that helps people find information. Answers shouldn't be longer than 20 words because you are on a phone. You could use 'um' or 'let me see' to make it more natural and add some disfluency."
Dis à nouveau : « Savez-vous où je peux obtenir une Xbox ». La réponse s’affiche dans le volet de session de conversation. Comme le bouton du haut-parleur est activé, vous entendez également la réponse.
Nettoyer les ressources
Pour éviter la facturation de coûts inutiles, vous devez supprimer les ressources créées dans ce guide de démarrage rapide si elles ne sont plus nécessaires. Pour gérer les ressources, vous pouvez utiliser le Portail Microsoft Azure.