Verstehen und Bewerten von Modellen für SQL-Datenbankworkloads.
Mit großen Sprachmodellen (LLMs) können Anwendungen Antworten generieren, Informationen zusammenfassen und aus Benutzereingaben schließen. Ihre Nützlichkeit erhöht sich, wenn sie auf anwendungsdaten zugreifen können, die in einer Datenbank gespeichert sind.
Azure SQL-Datenbank und Fabric SQL-Datenbank unterstützen das Erstellen intelligenter Anwendungen, indem KI-Funktionen wie Einbettungen, Vektordatentypen und Vektorsuche integriert werden. Diese Features ermöglichen es Modellen, direkt mit relationalen Daten zu arbeiten und allgemeine Muster wie semantische Suche und Generierung von Abruferweiterungen (Retrieval Augmented Generation, RAG) zu ermöglichen.
Bevor Sie ein Modell in eine SQL-basierte Lösung integrieren, ist es wichtig zu verstehen, wie sich verschiedene Modelle verhalten und wie sich ihre Merkmale auf das Anwendungsdesign auswirken.
Identifizieren von Modellmerkmalen für SQL-Datenbankworkloads
Modelle unterscheiden sich in ihren Funktionen, Leistungsmerkmalen und unterstützten Eingabe- und Ausgabeformaten. Berücksichtigen Sie bei der Auswertung von Modellen für die Verwendung mit Azure SQL-Datenbank oder Fabric SQL-Datenbank die folgenden Faktoren.
Modalitäten
Einige Modelle verarbeiten nur Text, während andere Eingaben wie Bilder oder strukturierte Daten unterstützen. Die erforderliche Modalität hängt vom Typ der in der Datenbank gespeicherten Daten und dem beabsichtigten Anwendungsszenario ab.
Sprachunterstützung
Die mehrsprachige Unterstützung ist wichtig, wenn Anwendungen Benutzern über Regionen hinweg dienen oder wenn gespeicherte Inhalte mehrere Sprachen umfassen.
Modellgröße und -kapazität
Größere Modelle bieten in der Regel eine stärkere Begründung und eine differenziertere Ausgabe, aber sie verbrauchen auch mehr Token und können höhere Latenz und Kosten mit sich bringen. Kleinere Modelle eignen sich möglicherweise besser für spezialisierte Aufgaben wie die Einbettungserstellung.
Strukturierte Ausgabe
Modelle, die strukturierte Ausgaben wie JSON erzeugen können, sind einfacher in SQL-basierte Workflows zu integrieren, bei denen Antworten programmgesteuert verarbeitet werden müssen.
Diese Merkmale beeinflussen, ob ein Modell gut geeignet ist, um Einbettungen zu erzeugen, RAG-Muster zu unterstützen oder einen konversationellen Zugriff auf Datenbankinhalte zu ermöglichen.
Beschreiben der Interaktion von Modellen mit Azure SQL-Daten
Azure SQL-Datenbank und Fabric SQL-Datenbank unterstützen intelligente Anwendungsmuster, indem relationaler Speicher mit KI-Features wie Vektordatentypen und Vektorfunktionen kombiniert wird.
Ein gängiges Muster ist die Generierung von Abruferweiterungen (Retrieval Augmented Generation, RAG), wobei relevante Daten aus der Datenbank abgerufen und als Kontext an ein Modell übermittelt werden, bevor eine Antwort generiert wird. Mit diesem Schritt können Antworten in Anwendungsdaten geerdet werden, anstatt nur auf das vortrainierte Wissen eines Modells zu vertrauen.
Mehrere Konzepte wirken sich auf die Interaktion von Modellen mit Datenbankdaten aus:
- Token, bei denen es sich um die Einheitenmodelle handelt, die zum Verarbeiten von Text verwendet werden
- Einbettungen, die Daten als Vektoren darstellen
- Vektorsuche, die Einbettungen vergleicht, um semantische Ähnlichkeit zu identifizieren
Da Vektoren zusammen mit relationalen Daten in der Azure SQL-Datenbank leben, können Sie die Vektorähnlichkeitssuche mit einer beliebigen STANDARD-SQL-Funktion in einer einzelnen Abfrage kombinieren. Sie können z. B. Vektorsuchergebnisse mit einer WHERE Klausel einschränken, sie mit verwandten Tabellen verknüpfen oder Vektorkosinusbewertungen mit Volltext-BM25-Bewertungen kombinieren. Diese Kombination der Vektorsuche mit regulären SQL-Vorgängen wird als Hybridsuche bezeichnet. Anstatt Anforderungen an einen separaten Suchdienst zu senden und die Ergebnisse abzugleichen, fragen Sie eine Datenbank ab, die sowohl die semantische Ähnlichkeit als auch die relationale Filterung zusammen behandelt.
Wenn Sie diese Konzepte verstehen, können Sie SQL-basierte Anwendungen entwerfen, die KI-Funktionen effektiv nutzen, während Sie Leistung und Kosten verwalten.
Erläutern, wie Token sich auf Kosten und Entwurf auswirken
Modelle verarbeiten Text nicht als unformatierte Zeichen. Stattdessen unterteilen sie Text in Token. Token sind kleine Einheiten, die Wörter, Wortteile oder Zeichen sein können. Beispielsweise kann das Wort "Hamburger" zu drei Token werden: "Ham", "bur" und "ger", während ein gemeinsames Wort wie "das" in der Regel ein einzelnes Token ist.
Tokenzahlen sind aus zwei Gründen wichtig. Zunächst weisen Modelle Eingabegrenzwerte auf. Ein Modell akzeptiert möglicherweise maximal 8.000 oder 128.000 Token in einer einzigen Anforderung. Dieser Grenzwert beschränkt die Anzahl der Datenbankinhalte, die Sie als Kontext in ein RAG-Muster einschließen können. Zweitens berechnen Modellanbieter in der Regel basierend auf verarbeiteten Token. Mehr Token bedeuten höhere Kosten, sodass sich eine effiziente Textverarbeitung direkt auf Betriebskosten auswirkt.
Wenn Sie SQL-basierte KI-Lösungen entwerfen, beeinflussen Tokengrenzwerte, wie Sie Inhalte für Einbettungen blöcken und wie viel Kontext Sie während der Generierung an ein Modell übergeben können.
Da Modelle Token-Limits auferlegen und sich bei der Erstellung von Einbettungen unterscheiden, beeinflussen diese Eigenschaften den Schemaentwurf. Zudem haben sie Auswirkungen auf die Chunking-Strategien und das Abfrageverhalten.
Erkunden von Modellen mit Microsoft Foundry
Microsoft Foundry Models bietet einen Katalog von KI-Modellen, die mit Azure-Diensten verwendet werden können. Der Katalog enthält Modelle, die Aufgaben wie Textverarbeitung, Einbettungsgenerierung, Begründung und multimodale Eingabe unterstützen.
Bei SQL-Datenbank-Workloads hilft Foundry dabei, zu bewerten, welche Modelle für die Integration mit Azure SQL-Datenbank oder Fabric SQL-Datenbank geeignet sind. Unterstützte Eingabetypen, Sprachabdeckung und Bereitstellungsoptionen beeinflussen alle, welches Modell Zu Ihrem Szenario passt.
Der Modellkatalog macht Informationen wie Modellfunktionen, Benchmarks, Versionsdetails und Lebenszyklusstatus verfügbar. Diese Informationen helfen Entwicklern, Leistungs- und Betriebseinschränkungen zu verstehen, bevor Sie ein Modell mit Datenbankworkflows verbinden.
Die Verwendung von Foundry während des Entwurfs trägt dazu bei, sicherzustellen, dass das ausgewählte Modell den SQL-basierten Anwendungsanforderungen entspricht und vorhersehbar mit relationalen Daten integriert werden kann.
Auswählen eines Modells für Ihre Lösung
Das Auswählen eines Modells ist eine Entwurfsentscheidung, die sich auf Leistung, Kosten und Wartung auswirkt. Berücksichtigen Sie bei der Auswahl eines Modells für die Verwendung mit Azure SQL-Datenbank oder Fabric SQL-Datenbank Folgendes:
- Der Typ und das Format der in der Datenbank gespeicherten Daten
- Leistungs- und Skalierbarkeitsanforderungen
- Sprach- oder Modalitätsanforderungen
- Überlegungen zur Bereitstellung und zum Lebenszyklus
Das Verständnis dieser Kompromisse trägt dazu bei, sicherzustellen, dass KI-Funktionen in SQL-Datenbanklösungen auf eine Weise integriert werden, die vorhersagbar, skalierbar und mit den Anwendungszielen übereinstimmt.
Wichtige Erkenntnisse
Modelle unterscheiden sich in Modalitäten, Sprachunterstützung, Größe und strukturierte Ausgabefunktionen, und diese Unterschiede wirken sich auf die Integration in SQL-Datenbankworkloads aus. RAG ruft relevante Datenbankinhalte ab und stellt ihn als Kontext an ein Modell bereit, während Token bestimmen, wie Eingabe- und Ausgabetext verarbeitet wird. Einbettungen stellen Daten als Vektoren dar, die semantische Ähnlichkeitsvergleiche ermöglichen. Microsoft Foundry Models bietet einen Katalog zum Auswerten und Auswählen von Modellen, die ihren SQL-basierten Anwendungsanforderungen entsprechen.