Intégration de l’IA et des vecteurs mathématiques

Effectué

SQL Server 2025 introduit un nouvel ensemble de fonctions IA et vectorielles qui permettent aux développeurs de bases de données d’intégrer des fonctionnalités basées sur l’IA directement dans T-SQL. Ces nouvelles fonctionnalités permettent de générer des incorporations, de calculer la similarité des vecteurs et de rechercher des données enrichies par l’IA sans quitter SQL Server. Ce niveau d’intégration réduit le besoin de services externes, simplifie l’architecture des applications et prend en charge les charges de travail intelligentes en temps réel.

Vue d'ensemble des fonctions d'intelligence artificielle et des fonctions vectorielles

Les nouvelles fonctionnalités IA de SQL Server 2025 se trouvent dans trois catégories principales : génération d’IA, opérations vectorielles et indexation et recherche de vecteurs.

Fonctions de génération d’IA

  • AI_GENERATE_CHUNKS : fractionne le texte volumineux ou les documents en blocs sémantiquement cohérents qui peuvent être incorporés ou stockés ultérieurement pour les scénarios de génération augmentée de récupération (RAG).
  • AI_GENERATE_EMBEDDINGS : génère des incorporations à partir d’une entrée de texte à l’aide d’un modèle externe inscrit dans SQL Server. Ces incorporations peuvent être stockées dans des tables à utiliser dans la recherche vectorielle, l’analyse de similarité ou le classement sémantique.

Opérations vectorielles

  • VECTOR_DISTANCE : calcule la distance entre deux valeurs vectorielles, prenant en charge les métriques de distance telles que le cosinus, l’euclide et le produit point.
  • VECTOR_NORM : retourne la norme de vecteur (magnitude) d’un vecteur donné.
  • VECTOR_NORMALIZE : retourne une version normalisée d’un vecteur, généralement utilisée avant les recherches de comparaison ou de similarité.
  • VECTORPROPERTY : retourne des métadonnées sur un vecteur, telles que ses dimensions ou son type d’élément.

Modèles externes et index vectoriels

SQL Server 2025 vous permet d’inscrire et de gérer des modèles IA externes à l’aide de T-SQL.

  • CREATE EXTERNAL MODEL / ALTER EXTERNAL MODEL / DROP EXTERNAL MODEL – Gérez les modèles IA hébergés localement ou via des fournisseurs de modèles pris en charge.
  • CREATE VECTOR INDEX : crée un index optimisé pour les données vectorielles afin d’accélérer les recherches de similarité.
  • VECTOR_SEARCH : effectue des opérations de recherche de similarité sur les données vectorielles à l’aide de l’index vectoriel, en retournant les correspondances les plus proches en fonction de la métrique de distance sélectionnée.

Ces fonctionnalités permettent à SQL Server de servir de base pour la génération augmentée de récupération, les moteurs de recommandation et les applications de recherche sémantique entièrement au sein du moteur de base de données.

Stockage vectoriel de demi-précision et ingestion binaire

Les vecteurs peuvent désormais utiliser des éléments à format virgule flottante demi-précision (fp16) pour réduire l’utilisation de la mémoire et améliorer les performances d’analyse dans les environnements exigeants en imbrication.
Vous pouvez également charger en bloc des vecteurs au format binaire à l’aide BULK INSERT ou OPENROWSET(BULK ...), ce qui simplifie l’importation de jeux d’incorporation volumineux créés en dehors de SQL Server.

Exemple de scénario : création d’une requête de recommandation de produit

Imaginez que vous travaillez pour une entreprise de vente au détail qui stocke les descriptions de produits dans une base de données SQL Server 2025. L’équipe marketing souhaite créer une fonctionnalité de recommandation qui suggère des produits sémantiquement similaires à un élément sélectionné. À l’aide des nouvelles fonctionnalités d’IA et de vecteur, vous pouvez générer des incorporations pour les descriptions de produits, les stocker dans une table et effectuer des recherches de similarité sans traitement externe.

Créer et inscrire le modèle

Avant de générer des incorporations, vous devez inscrire un modèle externe.

CREATE EXTERNAL MODEL embedding_model
FROM OPENAI
WITH (ENDPOINT = 'https://api.openai.com/v1/embeddings',
      API_KEY = SECRET('openai_key'),
      MODEL_NAME = 'text-embedding-3-small');

Générer et stocker des embeddings

Une fois le modèle inscrit, vous pouvez générer des incorporations pour vos descriptions de produits et les stocker dans une nouvelle table.

CREATE TABLE ProductEmbeddings
(
    ProductID INT PRIMARY KEY,
    Description NVARCHAR(MAX),
    Embedding VECTOR(1536)
);

INSERT INTO ProductEmbeddings (ProductID, Description, Embedding)
SELECT ProductID,
       Description,
       AI_GENERATE_EMBEDDINGS('embedding_model', Description)
FROM Products;

Pour améliorer les performances de recherche, créez un index vectoriel pour accélérer les recherches de similarité.

CREATE VECTOR INDEX idx_ProductEmbedding
ON ProductEmbeddings (Embedding)
WITH (DISTANCE_METRIC = 'cosine');

Vous pouvez maintenant effectuer une recherche sémantique pour les produits associés :

DECLARE @query NVARCHAR(MAX) = 'waterproof hiking backpack';
DECLARE @vector VECTOR(1536) = AI_GENERATE_EMBEDDINGS('embedding_model', @query);

SELECT TOP 5 ProductID, Description,
       VECTOR_DISTANCE(Embedding, @vector, 'cosine') AS SimilarityScore
FROM ProductEmbeddings
ORDER BY SimilarityScore ASC;

Results

Identifiant produit Descriptif Score de similarité
105 « Sac à dos de voyage étanche léger » 0.07
116 « Pack de randonnée avec couverture de pluie et emplacement d’hydratation » 0.10
117 « Compact sac à dos de plein air imperméable » 0,12
101 « Sac à dos prêt à la piste avec sangles externes » 0.15
119 Sac de sport étanche pour voyage et camping 0.18

Cet exemple montre comment intégrer un modèle IA externe, générer des incorporations directement dans T-SQL et effectuer une recherche de similarité à l’aide de fonctions vectorielles intégrées. Tout s’exécute à l’intérieur de SQL Server, ce qui simplifie le développement et permet aux charges de travail intelligentes de rester sécurisées et régies sous les stratégies de base de données existantes.

Résumé

SQL Server 2025 introduit des fonctionnalités d’IA natives qui permettent aux développeurs de créer des applications de base de données intelligentes directement dans T-SQL. Fonctions telles que AI_GENERATE_EMBEDDINGS, VECTOR_DISTANCEet VECTOR_SEARCH simplifier l’intégration avec les modèles IA tout en conservant les performances et la sécurité. Ensemble, ces fonctionnalités rendent SQL Server 2025 une plateforme forte pour la recherche sémantique, les recommandations et l’analytique prenant en charge le contexte sans compter sur des pipelines de calcul externes.