Comprendre et évaluer des modèles pour les charges de travail de base de données SQL

Effectué

Les modèles de langage volumineux (LLMs) permettent aux applications de générer des réponses, de synthétiser des informations et de raisonner sur l’entrée de l’utilisateur. Leur utilité augmente lorsqu’elles peuvent accéder aux données d’application stockées dans une base de données.

Azure SQL Database et Fabric SQL Database prennent en charge la création d’applications intelligentes en intégrant des fonctionnalités IA telles que les incorporations, les types de données vectorielles et la recherche vectorielle. Ces fonctionnalités permettent aux modèles de travailler directement avec des données relationnelles, ce qui permet des modèles courants tels que la recherche sémantique et la génération augmentée de récupération (RAG).

Avant d’intégrer un modèle dans une solution SQL, il est important de comprendre comment les différents modèles se comportent et comment leurs caractéristiques affectent la conception d’application.

Identifier les caractéristiques du modèle pour les charges de travail de base de données SQL

Les modèles diffèrent dans leurs fonctionnalités, caractéristiques de performances et formats d’entrée et de sortie pris en charge. Lors de l’évaluation des modèles à utiliser avec Azure SQL Database ou Fabric SQL Database, tenez compte des facteurs suivants.

Modalités
Certains modèles traitent uniquement du texte, tandis que d’autres prennent en charge d’autres entrées telles que des images ou des données structurées. La modalité requise dépend du type de données stockées dans la base de données et du scénario d’application prévu.

Prise en charge linguistique
La prise en charge multilingue est importante lorsque les applications servent des utilisateurs dans des régions ou lorsque le contenu stocké s’étend sur plusieurs langues.

Taille et capacité du modèle
Les modèles plus volumineux fournissent généralement un raisonnement plus fort et une sortie plus nuanceuse, mais ils consomment également davantage de jetons et peuvent introduire une latence et un coût plus élevés. Des modèles de taille réduite peuvent se révéler plus appropriés pour des tâches ciblées, comme la génération d’intégrations.

Sortie structurée
Les modèles qui peuvent produire une sortie structurée, telle que JSON, sont plus faciles à intégrer dans des flux de travail SQL où les réponses doivent être traitées par programmation.

Ces caractéristiques influencent si un modèle est adapté à la génération d’incorporations, à la prise en charge des modèles RAG ou à l’activation de l’accès conversationnel au contenu de la base de données.

Décrire comment les modèles interagissent avec les données Azure SQL

Azure SQL Database et Fabric SQL Database prennent en charge les modèles d’application intelligents en combinant le stockage relationnel avec des fonctionnalités IA telles que les types de données vectorielles et les fonctions vectorielles.

Un modèle courant est la récupération d’une génération augmentée (RAG), où les données pertinentes sont récupérées de la base de données et fournies à un modèle en tant que contexte avant de générer une réponse. Cette étape permet aux réponses d’être ancrées dans les données d’application plutôt que de s’appuyer uniquement sur les connaissances préentraînées d’un modèle.

Plusieurs concepts affectent la façon dont les modèles interagissent avec les données de base de données :

  • Jetons, qui sont les modèles d’unités utilisés pour traiter du texte
  • Incorporations, qui représentent des données en tant que vecteurs
  • Recherche vectorielle, qui compare les incorporations pour identifier la similarité sémantique

Étant donné que les vecteurs vivent en même temps que les données relationnelles dans Azure SQL Database, vous pouvez combiner la recherche de similarité vectorielle avec n’importe quelle fonctionnalité SQL standard dans une requête unique. Par exemple, vous pouvez affiner les résultats de recherche vectorielle avec une WHERE clause, les joindre à des tables associées ou fusionner des classements de cosinus vectoriels avec des scores BM25 de texte intégral. Cette combinaison de recherche vectorielle avec des opérations SQL régulières est appelée recherche hybride. Au lieu d’envoyer des requêtes à un service de recherche distinct et de rapprocher les résultats, vous interrogez une base de données qui gère à la fois la similarité sémantique et le filtrage relationnel.

La compréhension de ces concepts vous aide à concevoir des applications SQL qui utilisent efficacement les fonctionnalités d’IA tout en gérant les performances et les coûts.

Expliquer comment les jetons affectent les coûts et la conception

Les modèles ne traitent pas le texte en tant que caractères bruts. Au lieu de cela, ils décomposent le texte en jetons. Les jetons sont de petits blocs qui peuvent être des mots, des parties de mots ou une ponctuation. Par exemple, le mot « hamburger » peut devenir trois jetons : « ham », « bur » et « ger », tandis qu’un mot commun comme « the » est généralement un seul jeton.

Le nombre de jetons compte pour deux raisons. Tout d’abord, les modèles ont des limites d’entrée. Un modèle peut accepter un maximum de 8 000 ou 128 000 jetons dans une seule requête. Cette limite limite limite la quantité de contenu de base de données que vous pouvez inclure en tant que contexte dans un modèle RAG. Deuxièmement, les fournisseurs de modèles facturent généralement en fonction des jetons traités. D’autres jetons signifient des coûts plus élevés, de sorte que la gestion efficace du texte affecte directement les dépenses d’exploitation.

Lorsque vous concevez des solutions d’IA basées sur SQL, les limites de jeton influencent la façon dont vous segmentez du contenu pour les incorporations et le contexte que vous pouvez transmettre à un modèle pendant la génération.

Étant donné que les modèles imposent des limites de jetons et diffèrent quant à la manière dont les embeddings sont générés, ces caractéristiques affectent la conception des schémas, les stratégies de fragmentation et le comportement des requêtes.

Explorer les modèles avec Microsoft Foundry

Microsoft Foundry Models fournit un catalogue de modèles IA qui peuvent être utilisés avec les services Azure. Le catalogue inclut des modèles qui prennent en charge des tâches telles que le traitement de texte, la génération d’incorporation, le raisonnement et l’entrée modale.

Pour les charges de travail de base de données SQL, Foundry vous aide à évaluer les modèles appropriés pour l’intégration à Azure SQL Database ou à la base de données SQL Fabric. Les types d’entrée, la couverture linguistique et les options de déploiement pris en charge influencent tous les modèles qui correspondent à votre scénario.

Le catalogue de modèles expose des informations telles que les fonctionnalités du modèle, les benchmarks, les détails de version et l’état du cycle de vie. Ces informations aident les développeurs à comprendre les contraintes opérationnelles et les performances avant de connecter un modèle aux flux de travail de base de données.

L’utilisation de Foundry pendant la conception permet de s’assurer que le modèle sélectionné s’aligne sur les exigences d’application sql et peut être intégré de manière prévisible aux données relationnelles.

Sélectionner un modèle pour votre solution

La sélection d’un modèle est une décision de conception qui affecte les performances, le coût et la facilité de maintenance. Lorsque vous choisissez un modèle à utiliser avec Azure SQL Database ou Fabric SQL Database, envisagez les éléments suivants :

  • Type et format des données stockées dans la base de données
  • Exigences en matière de performances et d’extensibilité
  • Exigences en matière de langue ou de modalité
  • Considérations relatives au déploiement et au cycle de vie

La compréhension de ces compromis permet de s’assurer que les fonctionnalités d’IA sont intégrées aux solutions de base de données SQL d’une manière prévisible, évolutive et alignée sur les objectifs de l’application.

Points clés à prendre

Les modèles diffèrent dans les modalités, la prise en charge du langage, la taille et les fonctionnalités de sortie structurée, et ces différences affectent la façon dont ils s’intègrent aux charges de travail de base de données SQL. RAG récupère le contenu de base de données approprié et le fournit à un modèle en tant que contexte, tandis que les jetons déterminent la façon dont le texte d’entrée et de sortie est traité. Les incorporations représentent des données en tant que vecteurs qui permettent des comparaisons de similarité sémantique. Microsoft Foundry Models fournit un catalogue permettant d’évaluer et de sélectionner des modèles qui s’alignent sur vos exigences d’application SQL.