Einleitung

Abgeschlossen

KI-Anwendungen erfordern effiziente Speicherung und Abruf von Vektoreinbettungen, um die semantische Suche, Empfehlungen und die Generierung von Abruferweiterungen zu ermöglichen. Dieses Modul führt Sie durch die Implementierung von Vektorsuchfunktionen in Azure Database for PostgreSQL mithilfe der pgvector-Erweiterung, mit der Sie KI-Lösungen erstellen können, die semantisch ähnliche Inhalte aus Ihren Daten finden.

Stellen Sie sich vor, Sie sind Entwickler, der ein Knowledge Base-Suchsystem für eine Rechtsberatungskanzlei erstellt. Das System muss Anwälten helfen, relevante Falldokumente, Verträge und rechtliche Präzedenzfälle basierend auf der Bedeutung ihrer Abfragen zu finden, anstatt genaue Schlüsselwort-Übereinstimmungen zu finden. Wenn ein Anwalt nach "Verletzung der Treuhänderpflicht bei der Unternehmenszusammenführung" sucht, muss das System Dokumente zurückgeben, die ähnliche Konzepte besprechen, auch wenn sie unterschiedliche Terminologie verwenden.

Ihr Team hat Azure Database für PostgreSQL ausgewählt, da das Unternehmen dort bereits Dokumentmetadaten und Clientinformationen speichert. Anstatt eine separate Vektordatenbank einzuführen und die Datensynchronisierung zu verwalten, möchten Sie der vorhandenen PostgreSQL-Instanz Vektorsuchfunktionen direkt hinzufügen. Das System muss Hunderte von Tausenden von Rechtsdokumenten verarbeiten, Echtzeitabfragen mit Unter-Sekunden-Antwortzeiten unterstützen und Einbettungen aktualisieren, wenn neue Dokumente täglich eingehen.

Sie müssen die pgvector-Erweiterung aktivieren, ein Schema entwerfen, das Einbettungen zusammen mit Dokumentmetadaten speichert, Indizes erstellen, die suchgeschwindigkeit mit Genauigkeit in Einklang bringen, und Abfragen erstellen, die die relevantesten Dokumente für RAG-gestützte rechtswissenschaftliche Assistenten abrufen.

Nach Abschluss dieses Moduls werden Sie zu Folgendem in der Lage sein:

  • Speichern und Abfragen von Vektoreinbettungen mithilfe der pgvector-Erweiterung in Azure Database for PostgreSQL
  • Ausführen von Vektorgleichheitssuchen mit unterschiedlichen Entfernungsmetriken und Operatoren
  • Erstellen und Verwalten von Vektorindizes zur Optimierung der Suchleistung
  • Implementieren Sie Einbettungsaktualisierungs- und Aktualisierungsstrategien für sich entwickelnde Datensätze
  • Erstellen von Abrufmustern, die die Suchfunktion des PostgreSQL-Vektors in RAG-Pipelines integrieren