Descripción de las bases de datos vectoriales, la generación de aumento de recuperación y las inserciones en IA

Completado

Las bases de datos vectoriales, las inserciones y la RAG (Retrieval Augmentation Generation) son tecnologías cruciales para mejorar las aplicaciones controladas por IA, especialmente en el contexto de Azure Cosmos DB for MongoDB basado en núcleo virtual. Comprender estos conceptos es esencial para implementar funcionalidades avanzadas, como la búsqueda vectoriales consultando sus propios datos.

Comprender las inserciones en la inteligencia artificial

Antes de analizar las bases de datos vectoriales o los sistemas RAG, es necesario comprender las inserciones y su rol en las aplicaciones de inteligencia artificial. Las inserciones convierten elementos como palabras, oraciones o documentos completos en vectores numéricos que reflejan sus significados. Por ejemplo, un vector que representa la palabra "gato" podría representarse de la siguiente manera:

[0.1, 0.2, 0.3, 0.4, 0.5]

Estos vectores, creados a través de técnicas de aprendizaje automático, ayudan a los modelos de inteligencia artificial a comprender y trabajar con datos de forma más eficaz. Los modelos de IA pueden usar estos vectores para realizar tareas como la clasificación, la agrupación en clústeres o la coincidencia de similitud. Desempeñan un papel crucial en aplicaciones que van desde el análisis de textos a la visión por ordenador, apoyando tareas como la clasificación de textos o la generación de imágenes y código.

En plataformas como Azure OpenAI, las inserciones son fundamentales para ayudar a los modelos de lenguaje grandes a procesar y producir texto que refleje la comunicación humana. Convierten datos complejos en una forma estructurada con la que los modelos pueden trabajar, mejorando la capacidad de estos para generar respuestas pertinentes y coherentes. Las inserciones también son esenciales para las bases de datos vectoriales, que almacenan y recuperan datos basados en estas representaciones numéricas.

Explorar bases de datos vectoriales

Cada valor del vector se considera una dimensión de los datos que representa. Ese vector representa su posición en un espacio muy multidimensional en relación con todos los demás vectores. Estos vectores suelen tener muchas dimensiones, mientras que algunos de los modelos de inserción "más pequeños" de Azure OpenAI tienen 1536 dimensiones.

Las bases de datos vectoriales guardan datos como estos vectores altamente multidimensionales creados a través de transformaciones o inserciones a partir de varios tipos de datos, como texto, imágenes o vídeos. Estas bases de datos son excelentes para encontrar rápidamente datos que coincidan semánticamente, no solo mediante consultas exactas. Esta funcionalidad es valiosa para aplicaciones como la localización de imágenes, documentos o productos similares.

Por ejemplo, en una base de datos vectorial, puede buscar utilizando una imagen o un fragmento de texto como consulta para encontrar otros que coincidan en estilo o contenido. Este proceso implica buscar un vector de consulta (incrustación) para la entrada de búsqueda y usar medidas de similitud como la similitud de coseno o la distancia euclidiana para encontrar la distancia entre vectores.

Así, si se busca la palabra "gato", la base de datos devolverá los vectores más parecidos a la palabra "gato" en función de la medida de similitud utilizada. Estas medidas de similitud se basan en las transformaciones o inserciones para clasificar los resultados en función de su grado de coincidencia con la consulta.

Las bases de datos vectoriales pueden ser un componente esencial de un sistema RAG (Retrieval Augmentation Generation), donde almacenan y recuperan datos para los modelos de inteligencia artificial para generar respuestas. Mediante el uso de bases de datos vectoriales, puede asegurarse de que los modelos de inteligencia artificial recuperan y generan respuestas basadas en los datos relevantes y conscientes del contexto, mejorando la precisión y relevancia de las respuestas.

Explorar RAG (Retrieval Augmented Generation)

Los sistemas RAG mejoran los modelos de lenguaje grande agregando un sistema de recuperación de información. Este sistema basa las respuestas de la IA en datos relevantes y específicos, como documentos vectorizados e imágenes creadas a partir de los datos de su empresa.

Normalmente, un sistema RAG que usa bases de datos vectoriales sigue estos pasos:

  1. Inserta la pregunta o consulta de entrada y recupera los datos pertinentes de una base de datos vectorial.
  2. Genera una solicitud que incluye la entrada inicial y los datos recuperados para proporcionar contexto.
  3. Consulta el modelo de IA generativa con la solicitud combinada para generar una respuesta.

Diagrama de un sistema de generación de aumento de recuperación (RAG)

La integración de sistemas RAG permite controlar con precisión los datos que usan los modelos de lenguaje, lo que hace que sus respuestas sean más precisas y personalizadas. Cuando se vincula con bases de datos vectoriales que contienen los datos, el modelo de inteligencia artificial puede usar los datos, mejorando sus respuestas y haciendo que esas respuestas sean más aplicables y conscientes del contexto de su empresa.

En los sistemas RAG, las aplicaciones de inteligencia artificial se adaptan y administran por sus datos y no al revés.

Las bases de datos vectoriales, las inserciones y la RAG (Retrieval Augmentation Generation) son esenciales para mejorar las aplicaciones controladas por IA, especialmente en el contexto de Azure Cosmos DB for MongoDB basado en núcleo virtual Azure OpenAI. Las inserciones convierten datos complejos en vectores numéricos que mejoran la comprensión de un modelo de IA, que es fundamental para tareas como la clasificación de texto y la recuperación de datos. Las bases de datos vectoriales usan estas inserciones para realizar búsquedas rápidas y semánticamente controladas, lo que mejora considerablemente las funcionalidades de recuperación de datos. Cuando se combinan estas tecnologías en un sistema RAG, permiten que la IA ofrezca respuestas que no solo son precisas, sino que también se adaptan a sus datos específicos, mejorando tanto la relevancia como la eficacia de sus aplicaciones.