AI och vektorintegrering

Slutförd

SQL Server 2025 introducerar en ny uppsättning AI- och vektorfunktioner som gör det möjligt för databasutvecklare att integrera AI-baserade funktioner direkt i T-SQL. Dessa nya funktioner gör det möjligt att generera inbäddningar, beräkna vektorlikhet och söka i AI-berikade data utan att lämna SQL Server. Den här integreringsnivån minskar behovet av externa tjänster, förenklar programarkitekturen och stöder intelligenta arbetsbelastningar i realtid.

Översikt över AI- och vektorfunktioner

De nya AI-funktionerna i SQL Server 2025 ingår i tre huvudkategorier: AI-generering, vektoråtgärder och vektorindexering och sökning.

AI-generationsfunktioner

  • AI_GENERATE_CHUNKS – delar upp stor text eller dokument i semantiskt sammanhängande segment som senare kan bäddas in eller lagras för hämtningsförhöjda scenarier (RAG).
  • AI_GENERATE_EMBEDDINGS – Genererar inbäddningar från textindata med hjälp av en extern modell som registrerats i SQL Server. Dessa inbäddningar kan lagras i tabeller för användning i vektorsökning, likhetsanalys eller semantisk rangordning.

Vektoråtgärder

  • VECTOR_DISTANCE – beräknar avståndet mellan två vektorvärden, som stöder avståndsmått som cosinus, Euklidiska och punktprodukt.
  • VECTOR_NORM – Returnerar vektornormen (magnituden) för en given vektor.
  • VECTOR_NORMALIZE – Returnerar en normaliserad version av en vektor, som vanligtvis används före jämförelse eller likhetssökningar.
  • VECTORPROPERTY – Returnerar metadata om en vektor, till exempel dess dimensioner eller elementtyp.

Externa modeller och vektorindex

Med SQL Server 2025 kan du registrera och hantera externa AI-modeller med hjälp av T-SQL.

  • SKAPA EXTERN MODELL/ÄNDRA EXTERN MODELL/SLÄPP EXTERN MODELL – Hantera AI-modeller som finns lokalt eller via modellprovidrar som stöds.
  • CREATE VECTOR INDEX – Skapar ett index som är optimerat för vektordata för att påskynda likhetssökningar.
  • VECTOR_SEARCH – Utför likhetssökningsåtgärder på vektordata med hjälp av vektorindexet och returnerar de närmaste matchningarna baserat på det valda avståndsmåttet.

Dessa funktioner gör att SQL Server kan fungera som en grundplattform för hämtning med förstärkt generering, rekommendationsmotorer och semantiska sökprogram direkt i databasmotorn.

Lagring av halvprecisionsvektorer och binär inmatning

Vektorer kan nu använda flyttalselement med halv precision (fp16) för att minska minnesanvändningen och förbättra skanningsprestanda i inbäddningsintensiva arbetsflöden.
Du kan också massinläsa vektorer i binärt format med hjälp av BULK INSERT eller OPENROWSET(BULK ...), vilket förenklar importen av stora inbäddningsuppsättningar skapade utanför SQL Server.

Exempelscenario: Skapa en produktrekommendationsfråga

Anta att du arbetar för ett detaljhandelsföretag som lagrar produktbeskrivningar i en SQL Server 2025-databas. Marknadsföringsteamet vill skapa en rekommendationsfunktion som föreslår produkter som semantiskt liknar ett markerat objekt. Med hjälp av de nya AI- och vektorfunktionerna kan du generera inbäddningar för produktbeskrivningar, lagra dem i en tabell och utföra likhetssökningar utan extern bearbetning.

Skapa och registrera modellen

Innan du genererar inbäddningar måste du registrera en extern modell.

CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
      API_KEY = SECRET('openai_key'),
      MODEL_NAME = 'text-embedding-3-small');

Skapa och lagra inbäddningar

När modellen har registrerats kan du generera inbäddningar för dina produktbeskrivningar och lagra dem i en ny tabell.

CREATE TABLE ProductEmbeddings
(
    ProductID INT PRIMARY KEY,
    Description NVARCHAR(MAX),
    Embedding VECTOR(1536)
);

INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
       Description,
       AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;

För att förbättra sökprestandan skapar du ett vektorindex för att påskynda likhetssökningar.

CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');

Nu kan du utföra en semantisk sökning efter relaterade produkter:

DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);

SELECT TOP 5 ProductID, Description,
       VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;

Results

Produkt-ID Description Likhetspoäng
105 "Lätt vattentät reseryggsäck" 0.07
116 "Vandringspaket med regnskydd och hydreringsfack" 0.10
117 "Kompakt utomhusdagpaket med vattenbeständighet" 0,12
101 Ryggsäck för vandring med externa remmar 0.15
119 "Vattentät duffelväska för resa och camping" 0.18

Det här exemplet visar hur du integrerar en extern AI-modell, genererar inbäddningar direkt i T-SQL och utför en likhetssökning med hjälp av inbyggda vektorfunktioner. Allt körs i SQL Server, vilket förenklar utvecklingen och gör det möjligt för intelligenta arbetsbelastningar att förbli säkra och styrs under befintliga databasprinciper.

Sammanfattning

SQL Server 2025 introducerar inbyggda AI-funktioner som gör det möjligt för utvecklare att skapa intelligenta databasprogram direkt i T-SQL. Funktioner som , AI_GENERATE_EMBEDDINGSoch VECTOR_DISTANCE effektivisera integrering med AI-modeller samtidigt som VECTOR_SEARCHprestanda och säkerhet upprätthålls. Tillsammans gör dessa funktioner SQL Server 2025 till en stark plattform för semantisk sökning, rekommendationer och sammanhangsmedveten analys utan att förlita sig på externa beräkningspipelines.