Résumé
La génération augmentée par récupération connecte votre base de données aux capacités des grands modèles de langage. Au lieu de vous appuyer sur les données d’entraînement d’un modèle, vous fournissez des informations actuelles et pertinentes à partir de vos propres tables.
Le modèle RAG entier s’exécute dans T-SQL. Votre base de données orchestre le flux : recherche, format, invite, appel, analyse. Vous pouvez ajouter des fonctionnalités d’IA aux applications existantes en modifiant des procédures stockées, sans réarchitecturer votre pile d’applications.
Dans ce module, vous avez appris à :
- Identifier les cas d’usage DE RAG : reconnaître les scénarios dans lesquels la mise en place des réponses LLM (Large Language Model) dans le contenu de base de données améliore la précision et la pertinence
-
Préparer le contexte à partir de SQL : permet
FOR JSONde convertir les résultats de requête en texte que les modules LLM peuvent traiter efficacement - Créer des invites augmentées : générer des charges utiles de demande qui combinent des instructions système, un contexte récupéré et des questions utilisateur
-
Exécuter le pipeline RAG : appeler des points de terminaison Azure OpenAI à l’aide
sp_invoke_external_rest_endpointet analyser les réponses