Eventos
Cree aplicaciones inteligentes
17 mar, 9 p.m. - 21 mar, 10 a.m.
Únete a la serie de encuentros para crear soluciones de IA escalables basadas en casos de uso del mundo real con otros desarrolladores y expertos.
Regístrese ahoraEste explorador ya no es compatible.
Actualice a Microsoft Edge para aprovechar las características, las actualizaciones de seguridad y el soporte técnico más recientes.
El patrón Retrieval-Augmented Generation (RAG) es un enfoque estándar del sector para crear aplicaciones que usan modelos de lenguaje para procesar datos específicos o propietarios que el modelo aún no conoce. La arquitectura es sencilla, pero diseñar, experimentar y evaluar soluciones RAG que caben en esta arquitectura implican muchas consideraciones complejas que se benefician de un enfoque riguroso y científico.
Este artículo es la introducción de una serie. Cada artículo de la serie trata una fase específica en el diseño de soluciones RAG.
Los otros artículos de esta serie tratan las siguientes consideraciones:
En el flujo de trabajo siguiente se describe un flujo de alto nivel para una aplicación RAG.
En el flujo de trabajo siguiente se describe un flujo de alto nivel para una canalización de datos que proporciona datos de base para una aplicación RAG.
Debe tomar varias decisiones de implementación a medida que diseñe la solución RAG. En el diagrama siguiente se muestran algunas de las preguntas que debe formular al tomar esas decisiones.
En la lista siguiente se proporciona una breve descripción de lo que debe hacer durante cada fase del desarrollo de soluciones RAG.
Durante la fase de preparación, debe:
Durante la fase de fragmentación, debe:
Durante la fase de enriquecimiento de los fragmentos, debe:
Durante la fase de inserción, debe:
Durante la fase de recuperación de información, debe:
Durante la fase de evaluación de extremo a extremo del modelo de lenguaje, debe:
Debido al número de pasos y variables, es importante seguir un proceso de evaluación estructurado para la solución RAG. Evalúe los resultados de cada paso y realice cambios en función de sus requisitos. Debe evaluar cada paso de forma independiente para la optimización, pero recuerde que el resultado final es lo que experimentan los clientes. Asegúrese de que comprende todos los pasos de este proceso antes de determinar sus propios criterios de aceptación para cada paso.
Microsoft mantiene este artículo. Originalmente fue escrito por los siguientes colaboradores.
Autores principales:
Para ver perfiles de LinkedIn no públicos, inicie sesión en LinkedIn.
Eventos
Cree aplicaciones inteligentes
17 mar, 9 p.m. - 21 mar, 10 a.m.
Únete a la serie de encuentros para crear soluciones de IA escalables basadas en casos de uso del mundo real con otros desarrolladores y expertos.
Regístrese ahoraFormación
Módulo
Implementación de la generación aumentada de recuperación (RAG) con Azure Databricks - Training
Implementación de la generación aumentada de recuperación (RAG) con Azure Databricks
Certificación
Microsoft Certified: Azure AI Engineer Associate - Certifications
Diseñe e implemente una solución de Azure AI mediante servicios de Azure AI, Búsqueda de Azure AI y Azure Open AI.
Documentación
Diseñar una solución de inferencia RAG multiinquilino segura - Azure Architecture Center
Conozca las consideraciones y recomendaciones para mejorar la seguridad que debe tener en cuenta al diseñar una solución de inferencia RAG multiinquilino.
Obtenga información sobre cómo evaluar la solución RAG de un extremo a otro calculando y evaluando métricas clave de lenguaje grande y de similitud.
Desarrollo de una solución RAG: fase deInformation-Retrieval - Azure Architecture Center
Obtenga información sobre cómo configurar un índice de búsqueda, los tipos de consultas que puede realizar, cómo dividir las consultas en subconsultas y por qué y cómo reordenar las consultas.
Utilice modelos de lenguaje grandes (LLM) y Azure OpenAI dentro del contexto del patrón de generación aumentada de recuperación (RAG) (versión preliminar).