Présentation
Les modèles de langage volumineux peuvent répondre aux questions, résumer le contenu et générer du texte. Mais ils savent seulement ce qu’ils ont appris pendant la formation. Demandez au sujet des produits de votre entreprise, des commandes client ou des composants compatibles, et vous constaterez que le modèle n’a pas de réponse utile. La récupération de génération augmentée (RAG) résout ce problème en donnant au modèle l’accès à vos données au moment de la requête. Au lieu d’espérer que le modèle connaît votre catalogue de produits, vous récupérez les produits pertinents de votre base de données et incluez-les dans l’invite. Le modèle génère ensuite une réponse fondée sur des informations réelles et actuelles.
RAG conserve le traitement de l’IA à l’intérieur de la couche de base de données, où vos données vivent déjà. Cette approche évite de déplacer des données entre les systèmes et vous permet d’utiliser Transact-SQL pour contrôler le contexte reçu par le modèle. Le résultat est une application qui peut répondre à des questions spécifiques en utilisant des informations à jour et réelles issues de vos tables.
Imaginez une équipe de vente au détail qui crée une application de support client au-dessus d’une base de données de produit. Un client demande « Quels gants fonctionnent le mieux pour le cyclisme froid ? » L’application doit rechercher dans le catalogue de produits, rechercher des accessoires correspondants et générer une réponse utile à l’aide d’un LLM. Ce flux de travail est RAG en pratique : récupérer les données pertinentes, enrichir l’invite avec ces données et générer une réponse fondée. En créant ce flux de travail dans SQL, l’équipe conserve l’étape de récupération près des données et évite de créer un service de récupération distinct.
Une fois ce module terminé, vous pourrez :
- Identifiez quand RAG est la bonne approche pour votre application.
- Convertissez les résultats de requête SQL en JSON pour le traitement LLM (Large Language Model).
- Créez des invites qui combinent des instructions avec le contexte de la base de données.
- Appelez des points de terminaison LLM à partir de SQL.
- Analysez les réponses GML et transmettez-les à votre application.