Descripción de la generación aumentada de recuperación (RAG) con Azure OpenAI Service

Completado

RAG con Azure OpenAI permite a los desarrolladores usar modelos de chat de IA compatibles que pueden hacer referencia a orígenes específicos de información para basar la respuesta. La adición de esta información permite al modelo hacer referencia tanto a los datos específicos proporcionados como a sus conocimientos entrenados previamente para ofrecer respuestas más eficaces.

Azure OpenAI permite RAG mediante la conexión de modelos previamente entrenados a sus propios orígenes de datos. Azure OpenAI en los datos utiliza la capacidad de búsqueda de Búsqueda de Azure AI para agregar los fragmentos de datos pertinentes al mensaje. Una vez que los datos están en un índice de Búsqueda de Azure AI, Azure OpenAI en los datos recorre estos pasos:

  1. Recepción del mensaje del usuario.
  2. Determinación del contenido pertinente y la intención del mensaje.
  3. Consulta del índice de búsqueda con ese contenido e intención.
  4. Inserción del fragmento de resultados de la búsqueda en el mensaje de Azure OpenAI, junto con el mensaje del sistema y el mensaje del usuario.
  5. Envío de un mensaje completo a Azure OpenAI.
  6. Devolución de la respuesta y la referencia de datos (si existe) al usuario.

De forma predeterminada, Azure OpenAI en los datos recomienda, pero no requiere, que el modelo responda solo con los datos. Esta opción puede no seleccionarse al conectar los datos, lo que puede dar lugar a que el modelo elija usar su conocimiento previamente entrenado sobre los datos.

Optimización vs. RAG

El ajuste preciso es una técnica que se usa para crear un modelo personalizado mediante el entrenamiento de un modelo fundamental existente, como gpt-35-turbo, con un conjunto de datos de entrenamiento adicionales. El ajuste preciso puede dar lugar a solicitudes de mayor calidad que la ingeniería de mensajes por sí sola, personalizar el modelo en ejemplos más grandes de lo que puede caber en un mensaje y permitir que el usuario proporcione menos ejemplos para obtener la misma respuesta de alta calidad. Sin embargo, el proceso de ajuste preciso es costoso y requiere mucho tiempo, por lo que solo debe utilizarse en los casos en que sea necesario.

RAG con Azure OpenAI en los datos sigue usando la API sin estado para conectarse al modelo, lo que elimina el requisito de entrenar un modelo personalizado con los datos y simplifica la interacción con el modelo de IA. Búsqueda de Azure AI busca primero la información útil para responder a la solicitud, la agrega a la solicitud como datos de base y Azure OpenAI forma la respuesta en función de esa información.