Introducción

Completado

Los modelos de lenguaje grande pueden responder a preguntas, resumir contenido y generar texto. Pero solo saben lo que han aprendido durante el entrenamiento. Pregunte sobre los productos, pedidos de cliente o componentes compatibles de su empresa, y el modelo no tiene ninguna respuesta útil. Retrieval Augmented Generation (RAG) resuelve este problema al darle al modelo acceso a tus datos en el momento de la consulta. En lugar de esperar que el modelo conozca el catálogo de productos, recupere los productos pertinentes de la base de datos e incluílos en el mensaje. A continuación, el modelo genera una respuesta con base en la información real y actual.

RAG mantiene el procesamiento de IA dentro de la capa de base de datos, donde ya se encuentran los datos. Este enfoque evita mover datos entre sistemas y permite usar Transact-SQL para controlar qué contexto recibe el modelo. El resultado es una aplicación que puede responder a preguntas específicas utilizando información real y actualizada de tus tablas.

Imagine que un equipo minorista crea una aplicación de soporte al cliente sobre una base de datos de productos. Un cliente pregunta "¿Qué guantes funcionan mejor para el ciclismo frío?" La aplicación debe buscar en el catálogo de productos, buscar accesorios coincidentes y generar una respuesta útil mediante un LLM. Este flujo de trabajo muestra a RAG en acción: recuperar datos pertinentes, ampliar la consigna con esos datos y generar una respuesta fundamentada. Al compilar este flujo de trabajo en SQL, el equipo mantiene el paso de recuperación cerca de los datos y evita la creación de un servicio de recuperación independiente.

Después de completar este módulo, podrá:

  • Identifique cuándo RAG es el enfoque adecuado para la aplicación.
  • Convierta los resultados de la consulta SQL en JSON para el procesamiento del modelo de lenguaje grande (LLM).
  • Construya avisos que combinen instrucciones con el contexto de la base de datos.
  • Llame a los endpoints LLM desde SQL.
  • Analice las respuestas del LLM y devuelva las respuestas a su aplicación.