Descripción de la recuperación de la generación aumentada (RAG) con el servicio Azure OpenAI

Completado

Una vez que haya configurado el servicio OpenAI de Azure, empiece a crear su propio agente copilot mediante Azure OpenAI Studio o Estudio de IA de Azure para implementar los modelos de Azure OpenAI y agregar sus propios datos mediante la implementación de la generación aumentada de recuperación (RAG) mediante la conexión de modelos de chat de IA compatibles a sus propios datos. Esos modelos pueden hacer referencia a orígenes de datos específicos para fundamentar la respuesta, lo que aumenta las capacidades del modelo de inteligencia artificial cuando crea una respuesta.

Azure OpenAI Studio es básicamente un subconjunto de Estudio de IA de Azure que se centra específicamente en los modelos y servicios de Azure OpenAI, aunque los conceptos que se describen aquí también son relevantes para Estudio de IA de Azure. RAG con Azure OpenAI permite a los desarrolladores usar modelos de chat de inteligencia artificial compatibles que pueden hacer referencia a orígenes específicos de información para fundamentar la respuesta. Agregar esta información permite al modelo hacer referencia tanto a los datos específicos proporcionados como a sus conocimientos previamente entrenados para proporcionar respuestas más eficaces.

Agregar su propio origen de datos

La adición de los datos se realiza a través de Azure OpenAI Studio, en el área de juegos de chat o especificando el origen de datos en una llamada API. A continuación, el origen de datos que agregue se usará para aumentar el mensaje enviado al modelo. Al configurar los datos en Studio, puede elegir cargar los archivos de datos, usar datos en una cuenta de almacenamiento de blobs o conectarse a un índice de búsqueda de inteligencia artificial existente. Si ya está cargando o usando archivos en una cuenta de almacenamiento, Azure OpenAI en los datos admite archivos .md, .txt, .html, .pdf y Microsoft Word o PowerPoint. Si alguno de estos archivos contiene gráficos o imágenes, la calidad de la respuesta depende del grado de extracción del texto del contenido visual. Al cargar datos o conectarse a archivos de una cuenta de almacenamiento, se recomienda usar Azure OpenAI Studio para crear el recurso de búsqueda y el índice. Agregar datos de esta manera permite que se produzca la fragmentación adecuada al insertar en el índice, lo que produce mejores respuestas. Si usa archivos o formularios de texto grandes, debe usar el script de preparación de datos disponible para mejorar la precisión del modelo de inteligencia artificial.

Habilitar la búsqueda semántica de la inteligencia artificial servicio Search puede mejorar el resultado de la búsqueda en el índice de datos y es probable que reciba respuestas y citas de mayor calidad. Sin embargo, habilitar la búsqueda semántica puede aumentar el costo del servicio de búsqueda. También puede usar el asistente en el recurso de búsqueda de inteligencia artificial para vectorizar los datos correctamente, lo que le guiará en el ejercicio de este módulo. Toma algunos pasos adicionales en comparación con hacerlo en AI Studio, pero sirve como un buen ejemplo del uso del patrón RAG con un conjunto de datos existente.

Conexión de los datos

Para conectar los datos, vaya al área de juegos de chat en Azure OpenAI Studio y seleccione la pestaña Agregar datos. Seleccione el botón Agregar un origen de datos para conectar los datos. Los avisos le guían a través de la configuración de la conexión a cada origen de datos y la obtención de esos datos en un índice de búsqueda.