Generación Aumentada de Recuperación (RAG) en Azure Databricks

2025-06-26

La generación aumentada por recuperación (RAG) es una técnica eficaz que combina modelos de lenguaje grandes (LLMs) con recuperación de datos en tiempo real para generar respuestas más precisas, up-to-date y contextualmente relevantes.

Este enfoque es especialmente útil para responder a preguntas sobre la propiedad, el cambio frecuente o la información específica del dominio.

¿Qué es la generación aumentada por recuperación?

En el formato más sencillo, un agente RAG hace lo siguiente:

Recuperación: la solicitud del usuario se usa para consultar una base de conocimiento externa, como un almacén de vectores, una búsqueda de palabras clave o una base de datos SQL. El objetivo es obtener datos auxiliares para la respuesta del LLM.
Aumento: los datos auxiliares se combinan con la solicitud del usuario, a menudo usando una plantilla con formato e instrucciones adicionales para el LLM, para crear una solicitud.
Generación: el mensaje se pasa al LLM para generar una respuesta a la solicitud del usuario.

Flujo de una aplicación RAG desde la solicitud del usuario a la recuperación y respuesta de datos.

Ventajas de RAG

RAG mejora las LLM de las maneras siguientes:

Conocimientos propietarios: RAG puede incluir información propietaria que no se usa inicialmente para entrenar el LLM, como las demostraciones, los correos electrónicos y los documentos para responder a preguntas específicas del dominio.
Información actualizada: Una aplicación RAG puede proporcionar a LLM información de una base de conocimiento actualizada.
Citar orígenes: RAG permite a los LLM citar fuentes específicas, lo que permite a los usuarios comprobar la precisión fáctica de las respuestas.
Seguridad de datos y listas de control de acceso (ACL): el paso de recuperación se puede diseñar para recuperar de manera selectiva información personal o propietaria basada en las credenciales del usuario.

Componentes de RAG

Una aplicación RAG típica implica varias fases:

Canalización de datos: preproceso e indexación de documentos, tablas u otros datos para una recuperación rápida y precisa.
Cadena RAG (recuperación, aumento y generación):: realiza una serie (o cadena) de pasos para:
- Comprenda la pregunta del usuario.
- Recuperar datos auxiliares.
- Aumentar la solicitud con datos auxiliares.
- Generar una respuesta de un LLM utilizando la solicitud aumentada.
Evaluación y supervisión: evalúe la aplicación RAG para determinar su calidad, costo y latencia para asegurarse de que cumple sus requisitos empresariales.
Gobernanza y LLMOps: Haga un seguimiento y gestione el ciclo de vida de cada componente, incluyendo el lineaje de datos y controles de acceso.

Diagrama de componentes de la aplicación RAG.

Tipos de datos RAG: estructurados y no estructurados

La arquitectura RAG puede funcionar con datos auxiliares no estructurados o estructurados. Los datos que use con RAG dependen de su caso de uso.

Datos no estructurados: datos sin una estructura u organización específicas.

Archivos PDF
Documentos de Google/Office
Sitios Wiki
Imágenes
Vídeos

Datos estructurados: datos tabulares organizados en filas y columnas con un esquema específico, como tablas de una base de datos.

Registros de clientes en un sistema de BI o Almacenamiento de datos
Datos de transacción de una base de datos SQL
Datos de las API de aplicación (por ejemplo, SAP, Salesforce, etc.)

Evaluación y supervisión

La evaluación y la supervisión ayudan a determinar si la aplicación RAG cumple los requisitos de calidad, costo y latencia. La evaluación se produce durante el desarrollo, mientras que la supervisión se produce una vez que la aplicación se implementa en producción.

El RAG sobre datos no estructurados tiene muchos componentes que afectan a la calidad. Por ejemplo, los cambios de formato de datos pueden influir en los fragmentos recuperados y la capacidad de LLM para generar respuestas pertinentes. Por lo tanto, es importante evaluar los componentes individuales además de la aplicación general.

Para obtener más información, consulte Mosaic AI Agent Evaluation (MLflow 2).

RAG en Databricks

Databricks ofrece una plataforma de un extremo a otro para el desarrollo de RAG, entre las que se incluyen:

Canalizaciones de datos integradas con Delta Lake y Canalizaciones declarativas de Lakeflow
Búsqueda vectorial escalable con Búsqueda vectorial de Databricks
Servicio de modelos y herramientas de orquestación
Evaluación de Gen AI para mejorar el rendimiento y la calidad
Supervisión de IA generativa para aplicaciones RAG desplegadas
Gobernanza y seguridad integradas, consulte Security and Trust Center and AI Gateway.

Pasos siguientes

Obtenga información sobre las canalizaciones de datos, un componente clave de las aplicaciones RAG. Consulte Compilación de una canalización de datos no estructurada para RAG.
Use AI Playground para crear prototipos de su propio agente RAG. Consulte Prototipo de agentes para invocar herramientas en AI Playground.

Usa Agent Bricks: Knowledge Assistant para crear un agente RAG como chatbot en tus documentos y como un punto de conexión que puedes usar en aplicaciones posteriores. Consulte Uso de Agent Bricks: Knowledge Assistant para crear un chatbot de alta calidad sobre sus documentos..