Leer en inglés

Descripción de la recuperación de la generación aumentada (RAG) con el servicio Azure OpenAI

Completado

RAG con Azure OpenAI permite a los desarrolladores usar modelos de chat de inteligencia artificial compatibles que pueden hacer referencia a orígenes específicos de información para fundamentar la respuesta. Agregar esta información permite al modelo hacer referencia tanto a los datos específicos proporcionados como a sus conocimientos previamente entrenados para proporcionar respuestas más eficaces.

Azure OpenAI habilita RAG mediante la conexión de modelos previamente entrenados a sus propios orígenes de datos. Azure OpenAI en los datos usa la capacidad de búsqueda de Azure AI Search para agregar los fragmentos de datos pertinentes al símbolo del sistema. Una vez que los datos están en un índice de AI Search, Azure OpenAI en los datos realiza los pasos siguientes:

  1. Recibir mensaje de usuario.
  2. Determine el contenido y la intención pertinentes del símbolo del sistema.
  3. Consulte el índice de búsqueda con ese contenido y la intención.
  4. Inserte el fragmento de resultado de búsqueda en el símbolo del sistema de Azure OpenAI, junto con el mensaje del sistema y el símbolo del usuario.
  5. Envíe todo el mensaje a Azure OpenAI.
  6. Devolver la respuesta y la referencia de datos (si existe) al usuario.

De forma predeterminada, Azure OpenAI en los datos fomenta, pero no requiere, que el modelo responda solo con los datos. Esta configuración se puede anular al conectar los datos, lo que puede dar lugar a que el modelo elija usar su conocimiento previamente entrenado sobre los datos.

Ajuste preciso frente a RAG

El ajuste preciso es una técnica que se usa para crear un modelo personalizado mediante el entrenamiento de un modelo básico existente, como gpt-35-turbo con un conjunto de datos de datos de entrenamiento adicionales. El ajuste fino puede dar lugar a solicitudes de mayor calidad que la ingeniería de mensajes por sí sola, personalizar el modelo en ejemplos más grandes de lo que puede caber en un mensaje y permitir que el usuario proporcione menos ejemplos para obtener la misma respuesta de alta calidad. Sin embargo, el proceso de ajuste fino es costoso y intensivo en el tiempo, y solo se debe usar para los casos de uso en los que sea necesario.

RAG con Azure OpenAI en los datos sigue usando la API sin estado para conectarse al modelo, lo que elimina el requisito de entrenar un modelo personalizado con los datos y simplifica la interacción con el modelo de IA. Ai Search busca primero la información útil para responder al mensaje y, a continuación, agrega esa información a la solicitud como datos de base y Azure OpenAI, a continuación, forma la respuesta en función de esa información.