Résumé

Effectué

Dans ce module, vous avez appris à optimiser les performances du modèle IA générative à l’aide de stratégies complémentaires dans Microsoft Foundry.

Vous avez appris à :

  • Mettez en pratique des techniques d’ingénierie de prompts, notamment les messages système, l’apprentissage en quelques exemples et l’ajustement des paramètres du modèle pour optimiser les résultats générés.
  • Comprendre quand et comment ancrer un modèle de langage à l’aide de la génération augmentée par récupération (RAG).
  • Identifiez quand le réglage précis d’un modèle améliore la cohérence comportementale.
  • Comparez les stratégies d’optimisation et déterminez quand les combiner.

L’essentiel est que l’ingénierie rapide, RAG et le réglage précis ne sont pas des approches concurrentes , elles sont des stratégies complémentaires qui répondent à différentes dimensions des performances du modèle. Adoptez d’abord l’ingénierie des requêtes afin d’orienter le comportement du modèle, intégrez le RAG lorsque l’exactitude factuelle requiert des données spécialisées, et envisagez le réglage fin si un style et un format homogènes doivent être assurés au-delà des capacités de l’ingénierie des requêtes seule.

Pour le scénario de l’agence de voyage, la solution la plus efficace peut combiner les trois : un modèle affiné qui maintient la voix de la marque, RAG qui base les réponses dans le catalogue d’hôtels réel et l’ingénierie rapide qui ajoute des instructions spécifiques aux conversations et des garde-fous de sécurité.

Learn more