IA e integração vetorial
O SQL Server 2025 apresenta um novo conjunto de funções de IA e vetor que permitem que os desenvolvedores de banco de dados integrem recursos alimentados por IA diretamente ao T-SQL. Esses novos recursos possibilitam gerar inserções, calcular a similaridade de vetor e pesquisar dados enriquecidos com IA sem sair do SQL Server. Esse nível de integração reduz a necessidade de serviços externos, simplifica a arquitetura do aplicativo e dá suporte a cargas de trabalho inteligentes em tempo real.
Visão geral das funções de IA e vetor
Os novos recursos de IA no SQL Server 2025 se enquadram em três categorias principais: geração de IA, operações de vetor e indexação e pesquisa de vetores.
Funções de geração de IA
- AI_GENERATE_CHUNKS – Divide textos grandes ou documentos em partes semanticamente coerentes que podem ser inseridas ou armazenadas posteriormente para cenários de RAG (geração aumentada de recuperação).
- AI_GENERATE_EMBEDDINGS – gera inserções da entrada de texto usando um modelo externo registrado no SQL Server. Essas inserções podem ser armazenadas em tabelas para uso na pesquisa de vetor, análise de similaridade ou classificação semântica.
Operações de vetor
- VECTOR_DISTANCE – calcula a distância entre dois valores de vetor, oferecendo suporte a métricas de distância, como cosseno, euclidiano e produto de ponto.
- VECTOR_NORM – retorna a norma de vetor (magnitude) para um determinado vetor.
- VECTOR_NORMALIZE – retorna uma versão normalizada de um vetor, normalmente usada antes de pesquisas de comparação ou similaridade.
- VECTORPROPERTY – Retorna metadados sobre um vetor, como suas dimensões ou tipo de elemento.
Modelos externos e índices de vetor
O SQL Server 2025 permite que você registre e gerencie modelos externos de IA usando o T-SQL.
- CREATE EXTERNAL MODEL/ALTER EXTERNAL MODEL/DROP EXTERNAL MODEL – Gerenciar modelos de IA hospedados localmente ou por meio de provedores de modelo com suporte.
- CREATE VECTOR INDEX – Cria um índice otimizado para dados de vetor para acelerar pesquisas de similaridade.
- VECTOR_SEARCH – executa operações de pesquisa de similaridade em dados de vetor usando o índice de vetor, retornando as correspondências mais próximas com base na métrica de distância selecionada.
Esses recursos permitem que o SQL Server atenda como uma base para geração aumentada de recuperação, mecanismos de recomendação e aplicativos de pesquisa semântica inteiramente dentro do mecanismo de banco de dados.
Armazenamento de vetor de meia precisão e ingestão binária
Os vetores agora podem usar elementos de ponto flutuante de meia precisão (fp16) para reduzir o uso de memória e melhorar o desempenho da verificação em cargas de trabalho pesadas de inserção.
Você também pode carregar vetores em massa no formato binário usando BULK INSERT ou OPENROWSET(BULK ...), o que simplifica a importação de grandes conjuntos de inserção criados fora do SQL Server.
Cenário de exemplo: criando uma consulta de recomendação de produto
Imagine que você trabalhe para uma empresa de varejo que armazena descrições de produtos em um banco de dados do SQL Server 2025. A equipe de marketing deseja criar um recurso de recomendação que sugira produtos semanticamente semelhantes a um item selecionado. Usando os novos recursos de IA e vetor, você pode gerar inserções para descrições de produtos, armazená-las em uma tabela e executar pesquisas de similaridade sem processamento externo.
Criar e registrar o modelo
Antes de gerar inserções, você deve registrar um modelo externo.
CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
API_KEY = SECRET('openai_key'),
MODEL_NAME = 'text-embedding-3-small');
Gerar e armazenar inserções
Depois que o modelo for registrado, você poderá gerar inserções para as descrições do produto e armazená-las em uma nova tabela.
CREATE TABLE ProductEmbeddings
(
ProductID INT PRIMARY KEY,
Description NVARCHAR(MAX),
Embedding VECTOR(1536)
);
INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
Description,
AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;
Criar um índice de vetor e executar uma pesquisa
Para melhorar o desempenho da pesquisa, crie um índice de vetor para acelerar pesquisas de similaridade.
CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');
Agora você pode executar uma pesquisa semântica para produtos relacionados:
DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);
SELECT TOP 5 ProductID, Description,
VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;
Resultados
| ID do Produto | DESCRIÇÃO | Pontuação de Similaridade |
|---|---|---|
| 105 | "Mochila de viagem leve impermeável" | 0.07 |
| 116 | "Pacote de caminhadas com cobertura de chuva e slot de hidratação" | 0,10 |
| 117 | "Pacote de dia ao ar livre compacto com resistência à água" | 0.12 |
| 101 | "Mochila pronta para trilha com correias externas" | 0.15 |
| 119 | "Bolsa para viagem e acampamento impermeável" | 0.18 |
Este exemplo demonstra como integrar um modelo de IA externo, gerar inserções diretamente no T-SQL e executar uma pesquisa de similaridade usando funções de vetor internas. Tudo é executado dentro do SQL Server, que simplifica o desenvolvimento e permite que cargas de trabalho inteligentes permaneçam seguras e governadas nas políticas de banco de dados existentes.
Resumo
O SQL Server 2025 apresenta recursos nativos de IA que permitem aos desenvolvedores criar aplicativos de banco de dados inteligentes diretamente no T-SQL. Funções como AI_GENERATE_EMBEDDINGS, VECTOR_DISTANCEe VECTOR_SEARCH simplificar a integração com modelos de IA, mantendo o desempenho e a segurança. Juntos, esses recursos tornam o SQL Server 2025 uma plataforma forte para pesquisa semântica, recomendações e análises com reconhecimento de contexto sem depender de pipelines de computação externos.