Présentation
Les modèles de langage sont des outils puissants pour la création d’applications IA génératives, mais un modèle de base propre peut ne pas répondre à toutes vos exigences. La qualité, la précision et la cohérence des réponses qu’un modèle génère dépendent de la façon dont vous configurez et augmentez-la.
Imaginez que vous êtes développeur et que vous travaillez pour une agence de voyage. Vous créez une application de conversation pour aider les clients à répondre à leurs questions liées au voyage. Le modèle de base fournit des réponses décentes, mais votre équipe a des besoins spécifiques : les réponses doivent suivre le ton de voix de l’entreprise, inclure des informations précises sur votre catalogue d’hôtels et maintenir un format cohérent entre les interactions. Comment faire pour que le modèle atteigne ce niveau de performance ?
Il existe plusieurs stratégies complémentaires que vous pouvez utiliser pour optimiser les performances d’un modèle IA générative. Ces stratégies vont des ajustements rapides et à faible coût aux techniques plus impliquées qui nécessitent un temps et des ressources supplémentaires.
Tout au long de ce module, vous explorez chacune de ces stratégies et découvrez quand et comment les appliquer individuellement ou en combinaison.
Dans ce module, vous allez découvrir comment :
- Mettez en pratique des techniques d’ingénierie de prompts, notamment les messages système, l’apprentissage en quelques exemples et l’ajustement des paramètres du modèle pour optimiser les résultats générés.
- Comprendre quand et comment ancrer un modèle de langage à l’aide de la génération augmentée par récupération (RAG).
- Identifiez quand le réglage précis d’un modèle améliore la cohérence comportementale.
- Comparez les stratégies d’optimisation et déterminez quand les combiner.
Prerequisites
- Connaissance des concepts et services fondamentaux de l’IA dans Azure.
- Compréhension de base des modèles IA génératifs et de la façon dont ils génèrent des réponses.