Codebeispiele für den semantischen Kernelvektorspeicher (Vorschau)

End-to-End-RAG-Beispiel mit Vector Stores

Dieses Beispiel ist eine eigenständige Konsolenanwendung, die RAG mithilfe des semantischen Kernels veranschaulicht. Das Beispiel weist die folgenden Merkmale auf:

Ermöglicht die Auswahl von Chat- und Einbettungsdiensten
Ermöglicht die Auswahl von Vektordatenbanken.
Liest den Inhalt einer oder mehrerer PDF-Dateien und erstellt für jeden Abschnitt einen Block.
Generiert Einbettungen für jeden Textabschnitt und führt sie in die ausgewählte Vektordatenbank ein.
Registriert den Vector Store als Textsuche-Plug-In mit dem Kernel.
Ruft das Plug-In auf, um die vom KI-Modell bereitgestellte Eingabeaufforderung mit mehr Kontext zu erweitern

Ende-zu-Ende RAG-Demonstration

Einfache Datenaufnahme und Vektorsuche

Für zwei sehr einfache Beispiele, wie man Daten in einen Vektorspeicher aufnimmt und Vektorsuche durchführt, schauen Sie sich diese zwei Beispiele an, die Qdrant- und InMemory-Vektorspeicher nutzen, um ihre Nutzung zu zeigen.

Allgemeiner Code mit mehreren Geschäften

Vektorspeicher können sich in bestimmten Aspekten unterscheiden, z. B. im Hinblick auf die Typen ihrer Schlüssel oder die Typen von Feldern, die jeweils unterstützt werden. Dennoch ist es möglich, Code zu schreiben, der für diese Unterschiede agnostisch ist.

Ein Datenaufnahmebeispiel, das dies veranschaulicht, finden Sie unter:

MultiStore-Datenaufnahme

Ein Vektorsuchbeispiel, das dasselbe Konzept veranschaulicht, finden Sie in den folgenden Beispielen. Jedes dieser Beispiele verweist auf denselben gemeinsamen Code und unterscheidet sich einfach vom Typ des Vektorspeichers, den sie für die Verwendung mit dem gemeinsamen Code erstellen.

Unterstützen mehrerer Vektoren im selben Datensatz

Die Vektorspeicherabstraktionen unterstützen mehrere Vektoren im selben Datensatz für Vektordatenbanken, die dies unterstützen. Im folgenden Beispiel wird gezeigt, wie Sie einige Datensätze mit mehreren Vektoren erstellen und beim Ausführen einer Vektorsuche den gewünschten Zielvektor auswählen.

Auswählen eines Vektors für die Suche in einem Datensatz mit mehreren Vektoren

Vektorsuche mit Paginierung

Wenn Sie die Vektorsuche mit den Vektorspeicherabstraktionen durchführen, können Sie top- und skip-Parameter verwenden, um paging zu unterstützen, z. B. müssen Sie einen Dienst erstellen, der mit einer kleinen Gruppe von Ergebnissen pro Anforderung antwortet.

Vektorsuche mit Seiteneinteilung

Warnung

Nicht alle Vektordatenbanken unterstützen systemeigene Skip-Funktionalität für Vektorsuchen, daher müssen einige Connectors möglicherweise Skip + Top-Datensätze abrufen und auf der Clientseite überspringen, um dieses Verhalten zu simulieren.

Verwenden des generischen Datenmodells im Vergleich zu einem benutzerdefinierten Datenmodell

Es ist möglich, die Vektorspeicherabstraktionen zu verwenden, ohne ein Datenmodell zu definieren und stattdessen Ihr Schema über eine Datensatzdefinition zu definieren. In diesem Beispiel wird gezeigt, wie Sie einen Vektorspeicher mit einem benutzerdefinierten Modell erstellen und mithilfe des generischen Datenmodells lesen oder umgekehrt lesen können.

Generische Datenmodell-Interoperabilität

Tipp

Weitere Informationen zur Verwendung des generischen Datenmodells finden Sie unter Verwendung von Vector Store-Abstraktionen, ohne ihr eigenes Datenmodell zu definieren.

Verwenden von Sammlungen, die mit Langchain erstellt und integriert wurden

Es ist möglich, mithilfe der Vector Store-Abstraktionen auf Sammlungen zuzugreifen, die mit einem anderen System erstellt und aufgenommen wurden, z. B. Langchain. Es gibt mehrere Ansätze, die befolgt werden können, um die Interoperabilität ordnungsgemäß zu gestalten. Zum Beispiel.

Erstellen eines Datenmodells, das dem von der Langchain-Implementierung verwendeten Speicherschema entspricht.
Verwenden einer Datensatzdefinition mit speziellen Speichereigenschaftennamen für Felder.

Im folgenden Beispiel zeigen wir, wie Sie diese Ansätze verwenden, um Langchain-kompatible Vector Store-Implementierungen zu erstellen.

VectorStore Langchain Interop

Für jeden Vektorspeicher gibt es eine Factoryklasse, die zeigt, wie der langchainkompatible Vector Store erstellt wird. Siehe z.B.

End-to-End-RAG-Beispiel mit Azure AI Search Vector Store

Dieses Beispiel ist eine Reihe von zwei Skripts, die erste zeigt die Grundlagen der Einrichtung des Azure AI Search Vector Store und das zweite zeigt, wie sie ein Plug-In daraus erstellen und verwenden, um RAG auszuführen.

Einfache Datenaufnahme und Vektorsuche

Darüber hinaus gibt es ein Beispiel, in dem die Grundlagen zum Erstellen der Sammlung, zum Hinzufügen von Datensätzen, zum Schluss bei der Suche gezeigt werden, dies kann mit verschiedenen Vektorspeichern gestartet werden.

Einfache Vektorsuche

Einfache Datenaufnahme und Vektorsuche

Für einfache Beispiele, wie man Daten in einen Vektorspeicher einspeist und eine Vektorsuche durchführt, schauen Sie sich diese Beispiele an, die Azure AI Search, JDBC mit PostgreSQL, Redis und In-Memory-Vektorspeicher verwenden.

Freigeben über

Codebeispiele für den semantischen Kernelvektorspeicher (Vorschau)

End-to-End-RAG-Beispiel mit Vector Stores

Einfache Datenaufnahme und Vektorsuche

Allgemeiner Code mit mehreren Geschäften

Unterstützen mehrerer Vektoren im selben Datensatz

Vektorsuche mit Paginierung

Verwenden des generischen Datenmodells im Vergleich zu einem benutzerdefinierten Datenmodell

Verwenden von Sammlungen, die mit Langchain erstellt und integriert wurden

End-to-End-RAG-Beispiel mit Azure AI Search Vector Store

Einfache Datenaufnahme und Vektorsuche

Einfache Datenaufnahme und Vektorsuche

Zusätzliche Ressourcen