Modellen voor SQL-databaseworkloads begrijpen en evalueren

Voltooid

Met grote taalmodellen (LLM's) kunnen toepassingen antwoorden genereren, informatie samenvatten en reden voor gebruikersinvoer. De bruikbaarheid neemt toe wanneer ze toegang hebben tot toepassingsgegevens die zijn opgeslagen in een database.

Azure SQL Database en Fabric SQL Database ondersteunen het bouwen van intelligente toepassingen door AI-mogelijkheden te integreren, zoals insluitingen, vectorgegevenstypen en vectorzoekopdrachten. Met deze functies kunnen modellen rechtstreeks met relationele gegevens werken, waardoor veelvoorkomende patronen zoals semantische zoekopdrachten en rag (Retrieval Augmented Generation) mogelijk zijn.

Voordat u een model integreert in een op SQL gebaseerde oplossing, is het belangrijk om te begrijpen hoe verschillende modellen zich gedragen en hoe hun kenmerken van invloed zijn op het toepassingsontwerp.

Modelkenmerken identificeren voor SQL-databaseworkloads

Modellen verschillen in hun mogelijkheden, prestatiekenmerken en ondersteunde invoer- en uitvoerindelingen. Houd rekening met de volgende factoren bij het evalueren van modellen voor gebruik met Azure SQL Database of Fabric SQL Database.

Modaliteiten
Sommige modellen verwerken alleen tekst, terwijl andere andere invoergegevens ondersteunen, zoals afbeeldingen of gestructureerde gegevens. De vereiste modaliteit is afhankelijk van het type gegevens dat is opgeslagen in de database en het beoogde toepassingsscenario.

Taalondersteuning
Meertalige ondersteuning is belangrijk wanneer toepassingen gebruikers in verschillende regio's bedienen of wanneer opgeslagen inhoud meerdere talen omvat.

Modelgrootte en -capaciteit
Grotere modellen bieden doorgaans sterkere redeneringen en meer genuanceerde uitvoer, maar ze verbruiken ook meer tokens en kunnen leiden tot hogere latentie en kosten. Kleinere modellen zijn mogelijk geschikter voor gerichte taken, zoals embedding-generatie.

Gestructureerde uitvoer
Modellen die gestructureerde uitvoer kunnen produceren, zoals JSON, zijn eenvoudiger te integreren in op SQL gebaseerde werkstromen waar reacties programmatisch moeten worden verwerkt.

Deze kenmerken beïnvloeden of een model geschikt is voor het genereren van insluitingen, het ondersteunen van RAG-patronen of het inschakelen van gesprekstoegang tot database-inhoud.

Beschrijven hoe modellen communiceren met Azure SQL-gegevens

Azure SQL Database en Fabric SQL Database ondersteunen intelligente toepassingspatronen door relationele opslag te combineren met AI-functies zoals vectorgegevenstypen en vectorfuncties.

Een veelvoorkomend patroon is Rag (Retrieval Augmented Generation), waarbij relevante gegevens worden opgehaald uit de database en als context aan een model worden geleverd voordat een antwoord wordt gegenereerd. Met deze stap kunnen antwoorden worden gebaseerd op toepassingsgegevens in plaats van alleen te vertrouwen op de vooraf getrainde kennis van een model.

Verschillende concepten zijn van invloed op de interactie van modellen met databasegegevens:

  • Tokens, die de eenheden zijn die worden gebruikt om tekst te verwerken
  • Insluitingen, die gegevens vertegenwoordigen als vectoren
  • Vectorzoekopdrachten, waarmee insluitingen worden vergeleken om semantische overeenkomsten te identificeren

Omdat vectoren naast relationele gegevens in Azure SQL Database leven, kunt u vector-overeenkomsten combineren met elke standaard SQL-functie in één query. U kunt bijvoorbeeld zoekresultaten voor vectoren beperken met een WHERE clausule, deze koppelen aan gerelateerde tabellen of vector cosinusrangschikkingen verweven met BM25-scores in volledige tekst. Deze combinatie van vectorzoekopdrachten met reguliere SQL-bewerkingen wordt hybride zoekopdrachten genoemd. In plaats van aanvragen naar een afzonderlijke zoekservice te verzenden en de resultaten te afstemmen, voert u een query uit op een database die zowel semantische overeenkomsten als relationele filtering samen verwerkt.

Als u deze concepten begrijpt, kunt u op SQL gebaseerde toepassingen ontwerpen die effectief gebruikmaken van AI-mogelijkheden tijdens het beheren van prestaties en kosten.

Uitleggen hoe tokens van invloed zijn op kosten en ontwerpen

Modellen verwerken tekst niet als onbewerkte tekens. In plaats daarvan splitsen ze tekst in tokens op. Tokens zijn kleine segmenten die kunnen bestaan uit woorden, delen van woorden of leestekens. Het woord 'hamburger' kan bijvoorbeeld drie tokens worden: 'ham', 'bur' en 'ger', terwijl een gemeenschappelijk woord zoals 'the' meestal één token is.

Tokens tellen om twee redenen. Ten eerste hebben modellen invoerlimieten. Een model kan maximaal 8.000 of 128.000 tokens in één aanvraag accepteren. Deze limiet beperkt de hoeveelheid database-inhoud die u kunt opnemen als context in een RAG-patroon. Ten tweede brengen modelproviders doorgaans kosten in rekening op basis van verwerkte tokens. Meer tokens betekenen hogere kosten, dus een efficiënte tekstafhandeling is rechtstreeks van invloed op de operationele kosten.

Wanneer u AI-oplossingen op basis van SQL ontwerpt, beïnvloeden tokenlimieten hoe u inhoud segmenteert voor insluitingen en hoeveel context u tijdens het genereren aan een model kunt doorgeven.

Omdat modellen tokenlimieten opleggen en verschillen in hoe insluitingen worden gegenereerd, zijn deze kenmerken van invloed op het schemaontwerp, segmenteringsstrategieën en querygedrag.

Modellen verkennen met Microsoft Foundry

Microsoft Foundry Models biedt een catalogus met AI-modellen die kunnen worden gebruikt met Azure-services. De catalogus bevat modellen die ondersteuning bieden voor taken zoals tekstverwerking, het insluiten van generatie, redenering en multimodale invoer.

Voor SQL-databaseworkloads helpt Foundry u te evalueren welke modellen geschikt zijn voor integratie met Azure SQL Database of Fabric SQL Database. Ondersteunde invoertypen, taaldekking en implementatieopties zijn allemaal van invloed op welk model past bij uw scenario.

De modelcatalogus bevat informatie zoals modelmogelijkheden, benchmarks, versiedetails en levenscyclusstatus. Deze informatie helpt ontwikkelaars inzicht te hebben in de prestaties en operationele beperkingen voordat ze een model verbinden met databasewerkstromen.

Het gebruik van Foundry tijdens het ontwerp helpt ervoor te zorgen dat het geselecteerde model overeenkomt met toepassingsvereisten op basis van SQL en voorspelbaar kan worden geïntegreerd met relationele gegevens.

Selecteer een model voor uw oplossing

Het selecteren van een model is een ontwerpbeslissing die van invloed is op de prestaties, kosten en onderhoudbaarheid. Wanneer u een model kiest voor gebruik met Azure SQL Database of Fabric SQL Database, kunt u het volgende overwegen:

  • Het type en de indeling van gegevens die zijn opgeslagen in de database
  • Vereisten voor prestaties en schaalbaarheid
  • Taal- of modaliteitsvereisten
  • Overwegingen voor implementatie en levenscyclus

Als u deze afwegingen begrijpt, zorgt u ervoor dat AI-mogelijkheden worden geïntegreerd in SQL Database-oplossingen op een manier die voorspelbaar, schaalbaar en afgestemd is op toepassingsdoelen.

Belangrijke punten

Modellen verschillen in modaliteiten, taalondersteuning, grootte en gestructureerde uitvoermogelijkheden. Deze verschillen zijn van invloed op de integratie met SQL-databaseworkloads. RAG haalt relevante database-inhoud op en levert deze als context aan een model, terwijl tokens bepalen hoe invoer- en uitvoertekst wordt verwerkt. Insluitingen vertegenwoordigen gegevens als vectoren die vergelijkingen met semantische overeenkomsten mogelijk maken. Microsoft Foundry Models biedt een catalogus voor het evalueren en selecteren van modellen die overeenkomen met uw sql-toepassingsvereisten.