Base de datos vectorial

Se aplica a: ✅ NoSQL, ✅ PostgreSQL

Tip

Para obtener los ejemplos más recientes de bases de datos vectoriales y patrones RAG en aplicaciones, visite la Galería de ejemplos de Azure Cosmos DB.

Las bases de datos vectoriales se usan en muchos dominios y situaciones de la inteligencia artificial analítica y generativa, como el procesamiento del lenguaje natural, el reconocimiento de imágenes y vídeo, el sistema de recomendaciones, la búsqueda, etc.

Una tendencia notable en el software en 2023 fue la integración de mejoras de inteligencia artificial, a menudo logradas mediante la incorporación de bases de datos vectoriales autónomas especializadas en las pilas tecnológicas existentes. En este artículo se explica lo que son las bases de datos vectoriales y se presenta una arquitectura alternativa que puede ser conveniente tener en cuenta: el uso de una base de datos vectorial integrada en la base de datos NoSQL o relacional que ya utiliza, sobre todo al trabajar con datos multimodales. Este enfoque no solo le permite reducir el coste, sino también lograr una mayor coherencia, escalabilidad y rendimiento de los datos.

Tip

La coherencia de los datos, la escalabilidad y el rendimiento son fundamentales para las aplicaciones que consumen muchos datos, por lo que OpenAI eligió crear el servicio ChatGPT sobre Azure Cosmos DB. También puede aprovechar su base de datos vectorial integrada, así como sus tiempos de respuesta de menos de 10 milisegundos, la escalabilidad automática e instantánea y la velocidad garantizada a cualquier escala. Consulte ejemplos de implementación y pruébelo de forma gratuita.

¿Qué es una base de datos de vectores?

Una base de datos vectorial es una base de datos diseñada para almacenar y administrar inserciones de vectores, que son representaciones matemáticas de datos en un espacio dimensional. En este espacio, cada dimensión corresponde a una característica de los datos y es posible que se usen decenas de miles de dimensiones para representar datos sofisticados. La posición de un vector en este espacio representa sus características. Se pueden vectorizar palabras, frases o documentos completos e imágenes, audio y otros tipos de datos. Estas incrustaciones vectoriales se usan en la búsqueda de similitudes, la búsqueda multimodal, en los motores de recomendaciones, en los modelos de lenguajes grandes (LLM), etc.

En una base de datos vectorial, las incrustaciones se indexan y consultan a través de algoritmos de vector de búsqueda en función de su distancia vectorial o similitud. Se necesita un mecanismo sólido para identificar los datos más relevantes. Algunos algoritmos de búsqueda vectorial conocidos son Jerárquico Navigable Small World (HNSW), Archivo Invertido (IVF) y DiskANN.

Base de datos vectorial integrada frente a base de datos vectorial pura

Hay dos tipos comunes de implementaciones de base de datos vectoriales: base de datos vectorial pura y base de datos vectorial integrada en una base de datos NoSQL o relacional.

Una base de datos vectorial pura está diseñada para almacenar y administrar eficazmente incrustaciones de vectores, junto con una pequeña cantidad de metadatos; es independiente del origen de datos del que se derivan las incrustaciones.
Una base de datos vectorial integrada en una base de datos NoSQL o relacional altamente eficaz proporciona funcionalidades adicionales. La base de datos vectorial integrada en una base de datos NoSQL o relacional puede almacenar, indexar e insertar consultas junto con los datos originales correspondientes. Este enfoque elimina el coste adicional de replicar datos en una base de datos de vectores pura independiente. Además, mantener juntos las incrustaciones de vectores y los datos originales facilita mejor las operaciones de datos multi modal y permite una mayor coherencia, escala y rendimiento de los datos. Una base de datos de alto rendimiento con flexibilidad de esquema y base de datos vectorial integrada es especialmente óptima para los agentes de IA.

Casos de uso de las base de datos vectoriales

Las bases de datos vectoriales se usan en numerosos dominios y situaciones en inteligencia artificial analítica y generativa, como el procesamiento de lenguaje natural, el reconocimiento de vídeo e imágenes, el sistema de recomendaciones y la búsqueda. Por ejemplo, puede usar una base de datos vectorial para:

Identificar imágenes, documentos y canciones similares en función de su contenido, temas, sentimientos y estilos
Identificar productos similares en función de sus características, características y grupos de usuarios
Recomendar contenido, productos o servicios en función de las preferencias de las personas
Recomendar contenido, productos o servicios en función de las similitudes de los grupos de usuarios
Identificar las opciones potenciales más adecuadas de un gran grupo de opciones para cumplir los requisitos complejos
Identificar anomalías de datos o actividades fraudulentas que no son similares a los patrones predominantes o normales
Implementación de la memoria persistente para agentes de IA

Tip

Además de para estos casos de uso típicos de las bases de datos vectoriales, nuestra base de datos vectorial integrada es también una solución ideal para el almacenamiento en caché de LLM de nivel de producción gracias a su baja latencia y su alta escalabilidad y disponibilidad.

Es especialmente popular usar bases de datos vectoriales para habilitar la generación aumentada de recuperación (RAG) que aprovecha los LLM y los datos personalizados o la información específica de un dominio. Este enfoque le permite:

Generación de respuestas contextualmente relevantes y precisas a las solicitudes del usuario a partir de modelos de inteligencia artificial
Superar los límites de tokens de los LLM
Reducción de los costos del ajuste frecuente de los datos actualizados

Este proceso implica extraer información pertinente de un origen de datos personalizado e integrarla en la solicitud del modelo a través de la ingeniería de indicaciones. Antes de enviar una solicitud al LLM, la entrada de usuario, consulta o solicitud también se transforma en una incrustación y se emplean técnicas de búsqueda vectorial para localizar las incrustaciones más similares dentro de la base de datos. Esta técnica permite identificar los registros de datos más relevantes de la base de datos. A continuación, estos registros recuperados se proporcionan como entrada para la solicitud de los LLM mediante la ingeniería de indicaciones.

Note

¿Te interesan las funcionalidades de búsqueda de vectores de ultra alto rendimiento? Azure Cosmos DB está desarrollando características mejoradas de búsqueda vectorial diseñadas para conjuntos de datos vectoriales grandes emparejados con inserciones y búsquedas de rendimiento ultra alto. Puede manejar millones de consultas por segundo (QPS) con baja latencia predecible y una eficiencia de costos inigualable. Regístrese para obtener más información sobre las oportunidades de acceso anticipado y recibir notificaciones cuando estas funcionalidades estén disponibles.

Regístrese para obtener la versión preliminar privada expandida.

Embeddings

Una inserción es un formato especial de representación de datos que los modelos y algoritmos de Machine Learning pueden usar fácilmente. La inserción es una representación densa de información del significado semántico de un fragmento de texto. Cada incrustración es un vector de números de punto flotante, de modo que la distancia entre dos incrustraciones en el espacio vectorial está correlacionada con la similitud semántica entre dos entradas en el formato original. Por ejemplo, si hay dos textos similares, sus representaciones vectoriales también deberían ser similares. Una extensión de base de datos vectorial que le permite almacenar las inserciones con los datos originales garantiza la coherencia, la escala y el rendimiento de los datos.

Búsqueda de vectores

La búsqueda vectorial es un método que ayuda a encontrar elementos similares en función de sus características de datos en lugar de coincidencias exactas en un campo de propiedad. Esta técnica es útil en aplicaciones como la búsqueda de texto similar, la búsqueda de imágenes relacionadas, la realización de recomendaciones o incluso la detección de anomalías.

Funciona tomando las representaciones vectoriales (listas de números) de los datos que ha creado con un modelo de aprendizaje automático mediante una API de embeddings, como Azure OpenAI Embeddings o Hugging Face en Azure. A continuación, mide la distancia entre los vectores de datos y el vector de consulta. Los vectores de datos más cercanos al vector de consulta son los más similares semánticamente.

El uso de una característica de vector de búsqueda nativo ofrece una manera eficaz de almacenar, indexar y buscar datos vectoriales de alta dimensión directamente junto con otros datos de la aplicación. Este enfoque elimina la necesidad de migrar tus datos a bases de datos vectoriales alternativas más costosas y proporciona una integración perfecta de tus aplicaciones impulsadas por IA.

Indicaciones e ingeniería de indicaciones

Una solicitud se refiere a un texto o información específicos que pueden servir como una instrucción para un LLM, o como datos contextuales sobre los que el LLM puede basarse. Una solicitud puede adoptar varias formas, como una pregunta, una instrucción o incluso un fragmento de código. Las indicaciones pueden tener estos fines:

Instrucciones que proporcionan directivas al LLM
Contenido principal que proporciona información al LLM para su procesamiento
Ejemplos para ayudar a condicionar el modelo a una tarea o proceso determinado
Indicaciones para dirigir la salida del LLM en la dirección correcta
Apoyo en el contenido que representa información complementaria que el LLM puede usar para generar el resultado

El proceso de creación de buenas indicaciones para un escenario se denomina ingeniería de indicaciones. Para obtener más información sobre las indicaciones y los procedimientos recomendados para la ingeniería de indicaciones, consulte Diseño de mensajes del sistema.

Tokens

Los tokens son pequeños fragmentos de texto que se generan al dividir el texto de entrada en segmentos más pequeños. Estos segmentos pueden ser palabras o grupos de caracteres, que varían en longitud de un solo carácter a una palabra completa. Por ejemplo, la palabra hamburguesa se dividiría en tokens como ham, bur, gue y sa, mientras que una palabra corta y común como pera se consideraría un único token. Los LLM como ChatGPT, GPT-3.5 o GPT-4 dividen palabras en tokens para su procesamiento. [Volver]

Generación aumentada de recuperación

La generación aumentada por recuperación (RAG) es una arquitectura que aumenta las capacidades de los LLM como ChatGPT, GPT-3.5 o GPT-4 agregando un sistema de recuperación de información como el vector de búsqueda que proporciona datos de base de datos, como los almacenados en una base de datos vectorial. Este enfoque permite a la LLM generar respuestas contextualmente relevantes y precisas basadas en los datos personalizados procedentes de documentos vectorizados, imágenes, audio, vídeo, etc.

Un patrón RAG sencillo con Azure Cosmos DB para NoSQL podría:

Habilitación del índice de vectores noSQL de Azure Cosmos DB
Configuración de una base de datos y un contenedor con una directiva de vectores de contenedor e índice de vectores
Insertar datos en una base de datos y contenedor NoSQL de Azure Cosmos DB.
Creación de embebidos a partir de una propiedad de datos mediante Azure OpenAI Embeddings
Vincular a Azure Cosmos DB para NoSQL.
Creación de un índice de vector sobre las propiedades de inserción
Creación de una función para realizar la búsqueda de similitud de vectores en función de un mensaje de usuario
Realizar respuesta a preguntas sobre los datos mediante un modelo de completaciones de OpenAI de Azure.

El patrón RAG, con ingeniería de indicaciones, sirve para aumentar la calidad de las respuestas al ofrecer más información contextual al modelo. RAG permite al modelo aplicar una knowledge base más amplia al incorporar orígenes externos relevantes en el proceso de generación, lo que da lugar a respuestas más completas e informadas. Para obtener más información, consulte Modelos de Lenguaje de Gran Escala.

Cómo implementar funcionalidades de base de datos vectorial integrada

Puede implementar funcionalidades de base de datos vectoriales integradas para Azure Cosmos DB y sus diversas API de compatibilidad.

API de NoSQL

Azure Cosmos DB for NoSQL es la primera base de datos vectorial NoSQL sin servidor del mundo. Almacene los vectores y los datos juntos en Azure Cosmos DB para NoSQL con funcionalidades de base de datos vectoriales integradas donde puede crear un índice vectorial basado en DiskANN, un conjunto de algoritmos de indexación de vectores de alto rendimiento desarrollados por Microsoft Research.

DiskANN le permite realizar consultas de alta precisión y baja latencia a cualquier escala, al tiempo que aprovecha todas las ventajas de Azure Cosmos DB para NoSQL, como el SLA del 99,999% (con alta disponibilidad habilitada), la replicación geográfica, y la transición sin problemas de sin servidor a rendimiento aprovisionado (RU), todo en un solo almacén de datos.

Vínculos y ejemplos

Ejemplos de código

Utiliza Azure Cosmos DB para el nivel gratuito de por vida para MongoDB

API para PostgreSQL

Use la base de datos vectorial integrada de forma nativa en Azure Cosmos DB for PostgreSQL, que ofrece una manera eficaz de almacenar, indexar y buscar datos vectoriales de alta dimensión directamente junto con otros datos de la aplicación. Este enfoque elimina la necesidad de migrar tus datos a bases de datos vectoriales alternativas más costosas y proporciona una integración perfecta de tus aplicaciones impulsadas por IA.

Ejemplo de código

Python: Tutorial de cuadernos de Python: bot de chat de reseñas de alimentos

Paso siguiente

Utiliza el nivel gratuito de por vida de Azure Cosmos DB

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-27