Integración de IA y Vectores

Completado

SQL Server 2025 presenta un nuevo conjunto de funciones de inteligencia artificial y vector que permiten a los desarrolladores de bases de datos integrar funcionalidades con tecnología de inteligencia artificial directamente en T-SQL. Estas nuevas funcionalidades permiten generar incrustaciones, calcular la similitud de vectores y buscar datos enriquecidos con IA sin salir de SQL Server. Este nivel de integración reduce la necesidad de servicios externos, simplifica la arquitectura de la aplicación y admite cargas de trabajo inteligentes en tiempo real.

Introducción a las funciones de Inteligencia Artificial y Vectoriales

Las nuevas características de IA de SQL Server 2025 se dividen en tres categorías principales: generación de IA, operaciones vectoriales e indexación y búsqueda de vectores.

Funciones de generación de IA

  • AI_GENERATE_CHUNKS : divide texto grande o documentos en fragmentos semánticamente coherentes que se pueden insertar o almacenar posteriormente para escenarios de generación aumentada por recuperación (RAG).
  • AI_GENERATE_EMBEDDINGS : genera incrustaciones a partir de la entrada de texto mediante un modelo externo registrado en SQL Server. Estas incrustaciones se pueden almacenar en tablas para su uso en la búsqueda vectorial, el análisis de similitud o la clasificación semántica.

Operaciones con vectores

  • VECTOR_DISTANCE : calcula la distancia entre dos valores vectoriales, lo que admite métricas de distancia como coseno, euclidano y producto de puntos.
  • VECTOR_NORM : devuelve la norma vectorial (magnitud) de un vector determinado.
  • VECTOR_NORMALIZE : devuelve una versión normalizada de un vector, que normalmente se usa antes de las búsquedas de comparación o similitud.
  • VECTORPROPERTY : devuelve metadatos sobre un vector, como sus dimensiones o tipo de elemento.

Modelos externos e índices vectoriales

SQL Server 2025 permite registrar y administrar modelos de inteligencia artificial externos mediante T-SQL.

  • CREATE EXTERNAL MODEL/ALTER EXTERNAL MODEL/DROP EXTERNAL MODEL: administre modelos de IA hospedados localmente o a través de proveedores de modelos admitidos.
  • CREATE VECTOR INDEX : crea un índice optimizado para los datos vectoriales para acelerar las búsquedas de similitud.
  • VECTOR_SEARCH : realiza operaciones de búsqueda de similitud en datos vectoriales mediante el índice de vectores, devolviendo las coincidencias más cercanas en función de la métrica de distancia seleccionada.

Estas funcionalidades permiten a SQL Server servir como base para la generación aumentada de recuperación, motores de recomendaciones y aplicaciones de búsqueda semántica completamente dentro del motor de base de datos.

Almacenamiento de vectores de media precisión y entrada binaria

Los vectores ahora pueden usar elementos de punto flotante de media precisión (fp16) para reducir el uso de memoria y mejorar el rendimiento de escaneo en cargas de trabajo con mucha carga de incrustación.
También puede cargar vectores en bloque en formato binario mediante BULK INSERT o OPENROWSET(BULK ...), lo que simplifica la importación de grandes conjuntos de inserción creados fuera de SQL Server.

Escenario de ejemplo: Creación de una consulta de recomendación de producto

Imagine que trabaja para una empresa minorista que almacena descripciones de productos en una base de datos de SQL Server 2025. El equipo de marketing quiere crear una característica de recomendación que sugiere productos semánticamente similares a un elemento seleccionado. Con las nuevas características de ia y vector, puede generar incrustaciones para descripciones de productos, almacenarlas en una tabla y realizar búsquedas de similitud sin procesamiento externo.

Crear y registrar el modelo

Antes de generar incrustaciones, debe registrar un modelo externo.

CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
      API_KEY = SECRET('openai_key'),
      MODEL_NAME = 'text-embedding-3-small');

Generar y almacenar incrustaciones

Una vez registrado el modelo, puede generar incrustaciones para las descripciones del producto y almacenarlas en una nueva tabla.

CREATE TABLE ProductEmbeddings
(
    ProductID INT PRIMARY KEY,
    Description NVARCHAR(MAX),
    Embedding VECTOR(1536)
);

INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
       Description,
       AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;

Para mejorar el rendimiento de la búsqueda, cree un índice vectorial para acelerar las búsquedas de similitud.

CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');

Ahora puede realizar una búsqueda semántica de productos relacionados:

DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);

SELECT TOP 5 ProductID, Description,
       VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;

Results

Id. de producto Description Puntuación de Similitud
105 "Mochila de viaje impermeable ligera" 0.07
116 "Paquete de senderismo con cubierta de lluvia y ranura de hidratación" 0,10
117 "Paquete compacto de día exterior con resistencia al agua" 0.12
101 "Mochila preparada para el sendero con correas externas" 0.15
119 "Bolsa impermeable para viaje y acampada" 0.18

En este ejemplo se muestra cómo integrar un modelo de IA externo, generar incrustaciones directamente dentro de T-SQL y realizar una búsqueda de similitud mediante funciones vectoriales integradas. Todo se ejecuta dentro de SQL Server, lo que simplifica el desarrollo y permite que las cargas de trabajo inteligentes permanezcan seguras y controladas en las directivas de base de datos existentes.

Resumen

SQL Server 2025 presenta funcionalidades nativas de inteligencia artificial que permiten a los desarrolladores crear aplicaciones de base de datos inteligentes directamente en T-SQL. Funciones como AI_GENERATE_EMBEDDINGS, VECTOR_DISTANCEy simplifican la VECTOR_SEARCH integración con modelos de INTELIGENCIA ARTIFICIAL al tiempo que mantienen el rendimiento y la seguridad. Juntas, estas características hacen de SQL Server 2025 una plataforma segura para la búsqueda semántica, las recomendaciones y el análisis contextual sin depender de canalizaciones de proceso externas.