Compartir a través de


Almacenes vectoriales para la búsqueda de archivos

Los objetos de almacén de vectores proporcionan a la herramienta de búsqueda de archivos la capacidad de buscar archivos. Al agregar un archivo a un almacén de vectores, el servicio analiza, fragmenta, inserta e indexa para que la herramienta pueda ejecutar la búsqueda semántica y palabra clave.

Los almacenes de vectores se pueden asociar tanto a agentes como a conversaciones. Actualmente, puede asociar como máximo un almacén de vectores a un asistente y, como máximo, un almacén de vectores a una conversación. Para obtener información general conceptual sobre las conversaciones, consulte Componentes en tiempo de ejecución del agente.

En la experiencia actual del desarrollador de agentes, la generación de respuestas utiliza respuestas y conversaciones. Algunos SDK y ejemplos anteriores usan el término run. Si ve ambos términos, trate ejecución como generación de respuestas. Para obtener instrucciones sobre la migración, consulte Migración al nuevo servicio de agente.

Para obtener una lista de los límites de búsqueda vectorial (por ejemplo, tamaños máximos de archivo permitidos), consulte el artículo cuotas y límites .

Prerrequisitos

Límites clave y valores predeterminados

Los almacenes vectoriales suelen ser el primer lugar donde fallan los flujos de trabajo de recuperación en producción, por lo que ayuda conocer los valores predeterminados y los límites máximos.

  • Archivos por almacén de vectores: cada almacén de vectores puede contener hasta 10 000 archivos.
  • Anexos: puede asociar como máximo un almacén de vectores a un agente y, como máximo, un almacén de vectores a una conversación.
  • Configuración de recuperación predeterminada (búsqueda de archivos):
    • Tamaño del fragmento: 800 tokens
    • Superposición de fragmentos: 400 tokens
    • Modelo de inserción: inserción de texto-3-large a 256 dimensiones
    • Número máximo de fragmentos agregados al contexto: 20

Para conocer los límites de tamaño de archivo y token, consulte cuotas y límites.

Conceptos clave

Término Meaning
Almacén de vectores Un contenedor para el contenido de archivo que se puede buscar (fragmentos e incrustaciones) que usa la herramienta de búsqueda de archivos.
Ingestión Proceso asincrónico que analiza, fragmenta, inserta e indexa un archivo para la búsqueda.
Preparación Indica si la ingesta se ha completado y si el almacén de vectores está disponible para búsqueda.
Directiva de expiración Directiva de ciclo de vida que elimina un almacén de vectores tras un período de inactividad.

La búsqueda de archivos aplica procedimientos recomendados de recuperación para ayudar al agente a encontrar el contenido correcto de los archivos. Según la consulta y los datos, la herramienta puede:

  • Vuelva a escribir consultas de usuario para mejorar la recuperación.
  • Divida las consultas complejas en varias búsquedas.
  • Ejecute búsquedas semánticas y palabras clave en almacenes de vectores de conversación y agente.
  • Reordene los resultados antes de agregarlos al contexto del modelo.

Para obtener la configuración de recuperación predeterminada actual (tamaño de fragmento y superposición, insertar modelo y el número máximo de fragmentos agregados al contexto), consulte Funcionamiento.

Dónde residen los datos (configuración básica frente a agente estándar)

La ubicación de los archivos y los recursos de búsqueda depende de la configuración del agente:

  • Basic agent setup: La búsqueda de archivos usa recursos de búsqueda y storage administrados por Microsoft.
  • Configuración estándar del agente: La búsqueda de archivos utiliza los recursos de Azure Blob Storage y Azure AI Search que se conectan durante la configuración, por lo que los archivos permanecen en su almacenamiento.

Para configurar el entorno, consulte Configuración del entorno del agente. Para obtener más información, consulte Dependencia de la configuración del agente.

Asegúrese de que el almacén de vectores esté preparado antes de crear respuestas

Asegúrese de que todos los archivos de un almacén de vectores se procesan completamente antes de crear una respuesta. Este paso garantiza que todos los datos del almacén de vectores se puedan buscar.

Para comprobar la preparación, use los asistentes de sondeo del SDK (por ejemplo, create-and-poll y upload-and-poll) o sondee el objeto de almacén de vectores hasta que se complete su estado. Para obtener ejemplos de código, consulte Herramienta de búsqueda de archivos para agentes.

Durante la ingesta, un almacén de vectores puede estar en estado in_progress. Cuando se completa la ingesta, el estado cambia a completado.

Como mecanismo de respaldo, la generación de respuestas incluye una espera máxima de 60 segundos cuando el almacenamiento de vectores de la conversación contiene archivos que todavía se están procesando. Esta espera de reserva no se aplica al almacén de vectores del agente.

Lista de comprobación de flujo de trabajo de un extremo a otro

Use esta lista de comprobación para validar un flujo de trabajo de almacenamiento de vectores desde la ingesta hasta la gestión del ciclo de vida.

  1. Decida si usa la configuración básica del agente o la configuración estándar del agente, en función de dónde desea que los archivos y los recursos de búsqueda residan. Consulte Dónde residen los datos (configuración básica frente a agente estándar).
  2. Cargue los archivos y cree un almacén de vectores. Para obtener un ejemplo paso a paso, consulte Carga de archivos y agréguelos a un almacén de vectores.
  3. Espere a que finalice la ingesta antes de generar respuestas. Use los ayudantes de sondeo del SDK o sondee el almacenamiento de vectores hasta que el estado esté completado y no haya archivos en in_progress. Consulte Garantizar la preparación del almacenamiento de vectores antes de generar respuestas.
  4. Adjunte el almacén de vectores al agente o a la conversación que utiliza para la búsqueda de archivos. Tenga en cuenta los límites de los anexos. Consulte Almacenes vectoriales.
  5. Cree una respuesta que use la búsqueda de archivos y compruebe que la herramienta obtiene datos de los orígenes esperados. Consulte Create response with file search (Crear respuesta con búsqueda de archivos ) y Verify results (Comprobar resultados).
  6. Administrar el ciclo de vida: quite los archivos que ya no necesite y planee las directivas de expiración (especialmente para los almacenes de vectores creados por los asistentes de conversación). Consulte Almacenes de vectores y Almacenes de vectores de conversación tienen directivas de expiración predeterminadas.

Agregar archivos y administrar almacenes de vectores

Agregar archivos a almacenes vectoriales es una operación asincrónica. Para asegurarse de que se complete el proceso de ingesta, use las herramientas de creación y sondeo en los SDK oficiales. Si no está utilizando un SDK, realice una consulta al almacén de vectores hasta que su estado sea completado y no haya archivos en in_progress.

Los archivos también se pueden agregar a un almacén de vectores después de crearlos mediante la creación de archivos de almacén vectorial. Como alternativa, puede agregar varios archivos a un almacén de vectores mediante la creación de lotes de hasta 500 archivos.

Al cargar un archivo para crear un almacén de vectores, el sistema hace lo siguiente automáticamente:

  1. Fragmenta el contenido en partes administrables.
  2. Convierte cada fragmento en vectores de alta dimensión mediante modelos de inserción.
  3. Almacena estos vectores en un índice de búsqueda optimizado.
  4. Crea asociaciones entre los vectores y el contenido original.

Eliminar archivos de almacenes vectoriales

Puede quitar archivos de un almacén de vectores de dos maneras diferentes:

  • Elimine el objeto de archivo de almacén vectorial.
  • Elimine el objeto de archivo subyacente. Esto elimina el archivo de todas las configuraciones de almacenamiento de vectores en todos los agentes y conversaciones de su organización.

Administración del ciclo de vida con políticas de expiración

Las políticas de expiración le ayudan a administrar el ciclo de vida del almacén de vectores. Puede establecer estas directivas al crear o actualizar el objeto de almacén de vectores.

Los almacenes de vectores de conversaciones tienen directivas de expiración predeterminadas

Los almacenes de vectores creados mediante asistentes de conversación tienen una directiva de expiración predeterminada de siete días después de que estuvieran activas por última vez (definida como la última vez que se usó el almacén de vectores durante la generación de respuestas).

Cuando expira un almacén de vectores, se produce un error en la generación de respuestas para esa conversación. Para corregir el problema, vuelva a crear un nuevo almacén de vectores con los mismos archivos y vuelva a adjuntarlo a la conversación. Para obtener más información, consulte Los almacenes de vectores de conversación tienen directivas de expiración predeterminadas.

Tipos de archivo admitidos y límites de clave

Para obtener la lista de tipos de archivo admitidos y los requisitos de codificación, consulte Tipos de archivo admitidos.

Límites clave que debe tener en cuenta:

  • Puede asociar como máximo un almacén de vectores a un asistente y, como máximo, un almacén de vectores a una conversación.
  • Los límites de tamaño de archivo y token varían según la característica. Consulte Cuotas y límites.

Solución de problemas

  • El almacén de vectores aún no está disponible para búsqueda: espere a que finalice el proceso de ingestión. Utilice los asistentes de sondeo del SDK o sondee el almacenamiento de vectores hasta que su estado sea completado.
  • Se produce un error en la generación de respuestas después de unos días: es posible que el almacén de vectores de conversación haya expirado. Vuelva a crear un nuevo almacén de vectores con los mismos archivos y vuelva a adjuntarlo.
  • Un archivo desapareció de varios agentes o conversaciones: es posible que haya eliminado el objeto de archivo subyacente, que quita el archivo de todas las configuraciones del almacén de vectores de toda la organización.
  • Error de carga o ingesta: compruebe los límites de tamaño de archivo y token en Cuotas y límites.

Pasos siguientes