¿Qué es la búsqueda vectorial?

Completado

Vector de búsqueda es una nueva funcionalidad disponible en Búsqueda de Azure AI que se usa para indexar, almacenar y recuperar la inserción de vectores desde un índice de búsqueda. Puede usarlo para impulsar aplicaciones que implementan la arquitectura de generación aumentada de recuperación (RAG), la similitud y los motores de recomendaciones o búsquedas multimodales.

A continuación se muestra una ilustración de los flujos de trabajo de indexación y consulta para los vectores de búsqueda.

Diagram of the indexing and query workflows.

Se puede usar una consulta vectorial para que coincida con criterios en distintos tipos de datos de origen proporcionando una representación matemática del contenido generado por modelos de aprendizaje automático. Esto elimina las limitaciones de las búsquedas basadas en texto que devuelven resultados relevantes mediante la intención de la consulta.

Estos son algunos escenarios en los que debe usar el vector de búsqueda:

  • Use modelos OpenAI o de código abierto para codificar texto y use consultas codificadas como vectores para recuperar documentos.
  • Realice una búsqueda de similitud entre imágenes codificadas, texto, vídeo y audio, o una combinación de estas (multimodal).
  • Represente documentos en diferentes idiomas mediante un modelo incrustado multilingüe para buscar documentos en cualquier idioma.
  • Cree búsquedas híbridas desde el vector y campos de texto de búsqueda híbridos a medida que se implementan los vectores de búsqueda en el nivel de campo. Los resultados se combinarán para devolver una sola respuesta.
  • Aplique filtros a los campos de texto y numéricos e incluya esto en la consulta para reducir los datos que el vector de búsqueda necesita procesar.
  • Para crear una base de datos vectorial para proporcionar una knowledge base externa o usar como memoria a largo plazo.

Limitaciones

Hay algunas limitaciones al usar el vector de búsqueda que debe tener en cuenta:

  • Deberá proporcionar las incrustaciones mediante Azure OpenAI o una solución de código abierto similar, ya que Búsqueda de Azure AI no los genera para el contenido.
  • No se admiten claves administradas por el cliente (CMK).
  • Existen limitaciones de almacenamiento aplicables, por lo que debe comprobar lo que proporciona la cuota de servicio.

Nota:

Si los documentos son grandes, considere la posibilidad de fragmentar. Use la documentación sobre Fragmentación de documentos grandes para las soluciones de vector de búsqueda en Búsqueda de Azure AI para obtener más información.