Integrierter Vektorspeicher in Azure DocumentDB

Verwenden Sie die integrierte Vektordatenbank in Azure DocumentDB, um KI-basierte Anwendungen nahtlos mit Ihren in Azure DocumentDB gespeicherten Daten zu verbinden. Diese Integration kann Apps umfassen, die Sie mithilfe von Azure OpenAI-Einbettungen erstellt haben. Mit der systemeigenen integrierten Vektordatenbank können Sie hochdimensionale Vektordaten effizient speichern, indizieren und abfragen, die direkt in Azure DocumentDB gespeichert sind, sowie die ursprünglichen Daten, aus denen die Vektordaten erstellt werden. Es entfällt die Notwendigkeit, Ihre Daten in alternative Vektorspeicher zu übertragen und zusätzliche Kosten zu verursachen.

Was ist ein Vektorspeicher?

Ein Vektorspeicher oder eine Vektordatenbank ist eine Datenbank zum Speichern und Verwalten von Vektoreinbettungen, die mathematische Darstellungen von Daten in einem hochdimensionalen Raum sind. In diesem Raum entspricht jede Dimension einem Merkmal der Daten, und zehntausende Dimensionen können verwendet werden, um komplexe Daten darzustellen. Die Position eines Vektors in diesem Raum stellt seine Merkmale dar. Wörter, Ausdrücke oder ganze Dokumente sowie Bilder, Audioinhalte und andere Datentypen können vektorisiert werden.

Wie funktioniert ein Vektorspeicher?

In einem Vektorspeicher werden Vektorsuchalgorithmen verwendet, um Einbettungen zu indizieren und abzufragen. Einige bekannte Vektorsuchalgorithmen sind hierarchische Navigable Small World (HNSW), Inverted File (IVF) und DiskANN. Die Vektorsuche ist eine Methode, mit der Sie ähnliche Elemente basierend auf ihren Datenmerkmalen und nicht auf exakten Übereinstimmungen in einem Eigenschaftenfeld finden können. Diese Technik ist nützlich für Anwendungsfälle wie die Suche nach ähnlichem Text, das Suchen ähnlicher Bilder, das Abgeben von Empfehlungen oder sogar das Erkennen von Anomalien. Es wird verwendet, um die Vektoreinbettungen (Listen mit Zahlen) Ihrer Daten abzufragen, die Sie mithilfe eines Machine Learning-Modells mithilfe einer Einbettungs-API erstellt haben. Beispiele für Einbettungs-APIs sind Azure OpenAI Embeddings oder Hugging Face in Azure. Anschließend misst die Vektorsuche den Abstand zwischen den Datenvektoren und Ihrem Abfragevektor. Die Datenvektoren, die Ihrem Abfragevektor am nächsten liegen, sind semantisch am ähnlichsten.

In der integrierten Vektordatenbank in Azure DocumentDB können Sie Einbettungen zusammen mit den ursprünglichen Daten speichern, indizieren und abfragen. So vermeiden Sie zusätzliche Kosten für die Replikation der Daten in einer separaten reinen Vektordatenbank. Darüber hinaus behält diese Architektur die Vektoreinbettungen und originalen Daten bei, wodurch die multimodalen Datenvorgänge besser erleichtert werden und eine größere Datenkonsistenz, Skalierung und Leistung ermöglicht werden.

Anwendungsfälle für Vektordatenbanken

Vektordatenbanken werden in vielen Bereichen der KI und Datenanalyse verwendet. Sie helfen bei Aufgaben wie dem Verständnis natürlicher Sprache, dem Erkennen von Bildern und Videos, dem Aufbau von Empfehlungssystemen und dem Betreiben von Suchfunktionen. Sie finden sie sowohl in analytischen KI- als auch in generativen KI-Anwendungen.

Sie können eine Vektordatenbank unter anderem für Folgendes verwenden:

Identifizieren Sie ähnliche Bilder, Dokumente und Lieder basierend auf ihren Inhalten, Themen, Stimmungen und Stilen.
Identifizieren ähnlicher Produkte basierend auf ihren Merkmalen, Features und Benutzergruppen.
Empfehlen Sie Inhalte, Produkte oder Dienste basierend auf den Vorlieben von Einzelpersonen.
Empfehlen Sie Inhalte, Produkte oder Dienste basierend auf den Ähnlichkeiten von Benutzergruppen.
Identifizieren Sie die am besten geeigneten Optionen aus einem großen Auswahlpool, um komplexe Anforderungen zu erfüllen.
Identifizieren von Datenanomalien oder betrügerischen Aktivitäten, die sich von überwiegenden oder normalen Mustern unterscheiden.
Implementieren Sie beständigen Speicher für KI-Agents.
Aktivieren von Abruf-augmentierter Generation (RAG).

Integrierte Vektordatenbank im Vergleich zur reinen Vektordatenbank

Es gibt zwei gängige Typen von Vektordatenbankimplementierungen: reine Vektordatenbank und integrierte Vektordatenbank in einer NoSQL- oder relationalen Datenbank.

Eine reine Vektordatenbank speichert und verwaltet Vektoreinbettungen effizient zusammen mit einer kleinen Menge von Metadaten. Sie unterscheidet sich von der Datenquelle, von der die Einbettungen abgeleitet werden.

Eine Vektordatenbank, die in eine leistungsfähige NoSQL- oder relationale Datenbank integriert wird, bietet zusätzliche Funktionen. Die integrierte Vektordatenbank in einer NoSQL- oder relationalen Datenbank kann zusammen mit den entsprechenden Originaldaten Einbettungen speichern, indizieren und abfragen. So vermeiden Sie zusätzliche Kosten für die Replikation der Daten in einer separaten reinen Vektordatenbank. Darüber hinaus erleichtert das Zusammenhalten von Vektoreinbettungen und Originaldaten die multimodalen Datenvorgänge und ermöglicht eine höhere Datenkonsistenz, Skalierung und Leistung.

Open-Source-Vektordatenbanken

Wenn Entwickler Vektordatenbanken auswählen, bieten die Open-Source-Optionen zahlreiche Vorteile. Open Source bedeutet, dass der Quellcode der Software frei verfügbar ist, sodass Benutzer die Datenbank entsprechend ihren spezifischen Anforderungen anpassen können. Diese Flexibilität ist von Vorteil für Organisationen, die speziellen gesetzlichen Anforderungen für Daten unterliegen, z. B. Unternehmen in der Finanzdienstleistungsbranche.

Ein weiterer Vorteil von Open-Source-Vektordatenbanken ist die starke Unterstützung durch die Community. Aktive Benutzercommunitys beteiligen sich häufig an der Entwicklung dieser Datenbanken, bieten Support, teilen bewährte Methoden und treiben so Innovationen voran.

Einige Personen entscheiden sich für Open-Source-Vektordatenbanken, da sie "kostenlos" sind, was bedeutet, dass es keine Kosten gibt, die Software zu erwerben oder zu verwenden. Eine Alternative ist die Verwendung der kostenlosen Tarife, die von verwalteten Vektordatenbankdiensten angeboten werden. Diese verwalteten Dienste bieten nicht nur kostenfreien Zugriff bis zu einem bestimmten Nutzungslimit, sondern kümmern sich auch um Wartung, Updates und Skalierbarkeit, was den Betrieb vereinfacht. Daher können Sie mithilfe der kostenlosen Ebene von verwalteten Vektordatenbankdiensten Kosteneinsparungen erzielen und gleichzeitig den Verwaltungsaufwand reduzieren. Mit diesem Ansatz können Sie sich mehr auf Ihre Kernaktivitäten konzentrieren als auf die Datenbankverwaltung.

Auswählen der besten Open Source-Vektordatenbank

Bei der Wahl der besten Open-Source-Vektordatenbank müssen mehrere Faktoren berücksichtigt werden. Die Leistung und Skalierbarkeit der Datenbank sind entscheidend, da sie sich darauf auswirken, ob die Datenbank Ihre spezifischen Workloadanforderungen verarbeiten kann. Datenbanken mit effizienten Indizierungs- und Abfragefunktionen bieten in der Regel eine optimale Leistung. Ein weiterer Faktor sind die Communityunterstützung und die Dokumentation, die für die Datenbank zur Verfügung stehen. Eine robuste Community und eine umfangreiche Dokumentation können wertvolle Unterstützung bieten. DocumentDB ist beispielsweise eine beliebte Open Source-Vektordatenbank:

Die am häufigsten verwendete Option ist möglicherweise nicht die beste Option für Sie. Daher sollten Sie verschiedene Optionen basierend auf Features, unterstützten Datentypen und Kompatibilität mit vorhandenen Tools und Frameworks vergleichen, die Sie verwenden. Sie sollten auch die Herausforderungen von Open-Source-Vektordatenbanken berücksichtigen.

Herausforderungen von Open-Source-Vektordatenbanken

Die meisten Open-Source-Vektordatenbanken, einschließlich der zuvor aufgeführten, sind reine Vektordatenbanken. Mit anderen Worten, sie sind so konzipiert, dass nur Vektoreinbettungen gespeichert und verwaltet werden, zusammen mit einer kleinen Menge von Metadaten. Da sie getrennt von Den ursprünglichen Daten funktionieren, müssen Sie Daten zwischen verschiedenen Diensten verschieben. Diese Komplexität erhöht zusätzliche Kosten, macht Dinge komplexer und kann Ihre Produktionssysteme verlangsamen.

Sie stellen auch die Herausforderungen dar, die für Open-Source-Datenbanken typisch sind:

Setup: Sie benötigen fundierte Kenntnisse, um die Datenbank zu installieren, zu konfigurieren und zu betreiben, insbesondere für komplexe Bereitstellungen. Die Optimierung der Ressourcen und der Konfiguration beim Hochskalieren des Betriebs erfordert eine sorgfältige Überwachung und entsprechende Anpassungen.
Wartung: Sie müssen Ihre eigenen Updates, Patches und Wartung verwalten. Maschinelles Lernen reicht nicht aus; Sie müssen auch umfangreiche Erfahrung in der Datenbankverwaltung haben.
Support: Verglichen mit verwalteten Diensten ist der offizielle Support ggf. eingeschränkt, und es wird stärker auf Unterstützung durch die Community gesetzt.

Daher verursachen Open-Source-Vektordatenbanken beim Hochskalieren unter Umständen erhebliche Kosten, auch wenn sie zunächst kostenlos sind. Der Ausbau des Betriebs erfordert mehr Hardware, qualifizierte IT-Mitarbeiter und eine komplexere Infrastrukturverwaltung, was höhere Hardware-, Personal- und Betriebskosten zur Folge hat. Die Skalierung von Open-Source-Vektordatenbanken kann trotz nicht vorhandener Lizenzgebühren eine finanzielle Herausforderung darstellen.

Bewältigung der Herausforderungen von Open-Source-Vektordatenbanken

Eine vollverwaltete Vektordatenbank, die in eine leistungsfähige NoSQL- oder relationale Datenbank integriert wird, vermeidet die zusätzlichen Kosten und Komplexität von Open-Source-Vektordatenbanken. Eine solche Datenbank speichert, indiziert und fragt Einbettungen neben den entsprechenden Originaldaten ab. So vermeiden Sie zusätzliche Kosten für die Replikation der Daten in einer separaten reinen Vektordatenbank. Darüber hinaus erleichtert das Zusammenhalten von Vektoreinbettungen und Originaldaten die multimodalen Datenvorgänge und ermöglicht eine höhere Datenkonsistenz, Skalierung und Leistung. Der vollständig verwaltete Dienst hilft Entwicklerinnen und Entwicklern, die Schwierigkeiten bei der Einrichtung und Wartung einer Open-Source-Vektordatenbank zu vermeiden und sich auf die Unterstützung der Community zu verlassen. Darüber hinaus bieten einige verwaltete Vektordatenbankdienste eine lebenslange kostenlose Stufe.

Ein Beispiel ist die integrierte Vektordatenbank in Azure DocumentDB. Mit diesem Setup können Entwickler Wie bei Open-Source-Vektordatenbanken Geld sparen. Im Gegensatz zu Open-Source-Optionen kümmert sich der Dienstanbieter jedoch um Wartung, Updates und Skalierung für Sie. Das Upgrade ist schnell und einfach, während geringe Gesamtbetriebskosten (Total Cost of Ownership, TCO) beibehalten werden, wenn es an der Zeit ist, die Operationen hochzuskalieren. Sie können diesen Dienst auch verwenden, um MongoDB-Anwendungen, die bereits in der Produktion sind, bequem zu skalieren.

Durchführen der Vektorähnlichkeitssuche

Azure DocumentDB bietet robuste Vektorsuchfunktionen, sodass Sie schnell Ähnlichkeitssuchen in komplexen Datasets durchführen können. Zum Ausführen der Vektorsuche in Azure DocumentDB müssen Sie zuerst einen Vektorindex erstellen. Während Azure DocumentDB mehrere Optionen bietet, finden Sie hier einige allgemeine Richtlinien, die Ihnen bei den ersten Schritten basierend auf der Größe Ihres Datasets helfen:

	IVF	HNSW	DiskANN (empfohlen)
Beschreibung	Ein IVFFlat-Index teilt Vektoren in Listen auf und durchsucht dann eine Teilmenge, die dem Abfragevektor am nächsten kommt.	Ein HNSW-Index erstellt ein Mehrschichtdiagramm.	DiskANN ist ein ungefährer Nachbarsuchalgorithmus, der für eine effiziente Vektorsuche in jedem Maßstab entwickelt wurde.
Wichtige Trade-Offs	Profis: Schnellere Erstellungszeiten, geringerer Arbeitsspeichereinsatz. Nachteile: Geringere Abfrageleistung (im Hinblick auf den Geschwindigkeitsrückruf-Kompromiss).	Vorteile: Eine bessere Abfrageleistung (im Hinblick auf den Geschwindigkeits-Erinnerungs-Kompromiss) kann auf einer leeren Tabelle erreicht werden. Nachteile: Langsamere Buildzeiten, höhere Arbeitsspeichernutzung.	Vorteile: Effizient auf jeder Ebene, hoher Recall, hoher Durchsatz, niedrige Latenz.
Vektoranzahl	Unter 10.000	Bis zu 50.000	Bis zu 500.000+
Empfohlene Clusterebene	M10 oder M20	M30 und höher	M30 und höher

Sie können DiskANN-Indizes auf M30 und höheren Ebenen verwenden. Um den DiskANN-Index zu erstellen, legen Sie den "kind"-Parameter auf "vector-diskann" gemäß dieser Vorlage fest:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

Feld	Typ	Description
`index_name`	Schnur	Eindeutiger Name des Indexes
`path_to_property`	Schnur	Pfad zur Eigenschaft, die den Vektor enthält. Dieser Pfad kann eine allgemeine Eigenschaft oder ein Punktnotationspfad zur Eigenschaft sein. Vektoren müssen vom Typ `number[]` sein, damit sie indiziert und in den Vektorsuchergebnissen verwendet werden. Ein Vektor, der einen anderen Typ verwendet, wie z. B. `double[]`, verhindert, dass das Dokument indiziert wird. Nicht indizierte Dokumente werden nicht im Ergebnis einer Vektorsuche zurückgegeben.
`kind`	Schnur	Art des zu erstellenden Vektorindexes. Als Optionen sind `vector-ivf`, `vector-hnsw` und `vector-diskann` verfügbar.
`dimensions`	integer	Anzahl der Dimensionen für Vektorähnlichkeit. DiskANN unterstützt bis zu 16.000 Dimensionen (mit Produktquantisierung), wobei zukünftige Unterstützung für 40.000+ geplant ist.
`similarity`	Schnur	Ähnlichkeitsmetrik, die mit dem Index verwendet werden soll. Mögliche Optionen sind `COS` (Kosinusabstand), `L2` (euklidischer Abstand) oder `IP` (inneres Produkt).
`maxDegree`	integer	Maximale Anzahl von Kanten pro Knoten im Graph. Dieser Parameter liegt zwischen 20 und 2.048 (Standardwert ist 32). Höhere `maxDegree`-Werte eignen sich für Datasets mit hohen Dimensionalitäts- und/oder hohen Genauigkeitsanforderungen.
`lBuild`	integer	Legt die Anzahl der in Frage kommenden Nachbarn fest, die während der DiskANN-Indexerstellung ausgewertet werden. Dieser Parameter, der zwischen 10 und 500 liegt (Standardwert ist 50), gleicht Genauigkeit und Rechenaufwand aus: Höhere Werte verbessern die Indexqualität und Genauigkeit, erhöhen aber die Buildzeit.

Durchführen einer Vektorsuche mit DiskANN

Um eine Vektorsuche durchzuführen, verwenden Sie die $search-Phase der Aggregationspipeline und führen Sie eine Abfrage mit dem cosmosSearch-Operator aus. DiskANN ermöglicht leistungsstarke Suchvorgänge in umfangreichen Datasets mit optionaler Filterung wie Geospatial- oder textbasierten Filtern.

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

Feld	Typ	Description
`lSearch`	integer	Gibt die Größe der dynamischen Kandidatenliste für die Suche an. Der Standardwert ist 40, mit einem konfigurierbaren Bereich von 10 bis 1000. Das Erhöhen des Werts verbessert das Erinnerungsvermögen, kann aber die Suchgeschwindigkeit verringern.
`k`	integer	Definiert die Anzahl der zurückzugebenden Suchergebnisse. Der `k`-Wert muss kleiner oder gleich `lSearch` sein.

Beispiel für die Verwendung eines DiskANN-Indexes mit Filterung

Hinzufügen von Vektoren zu Ihrer Datenbank

Um die Vektorsuche mit räumlichen Filtern zu verwenden, fügen Sie Dokumente hinzu, die sowohl Vektoreinbettungen als auch Standortkoordinaten enthalten. Sie können die Einbettungen mithilfe Ihres eigenen Modells, Azure OpenAI-Einbettungen oder einer API wie Hugging Face in Azure erstellen.

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

Erstellen eines DiskANN-Vektorindex

Im folgenden Beispiel wird veranschaulicht, wie Sie einen DiskANN-Vektorindex mit Filterfunktionen einrichten. Dieses Beispiel umfasst das Erstellen des Vektorindex für die Ähnlichkeitssuche, das Hinzufügen von Dokumenten mit Vektor- und Geospatialeigenschaften sowie indizierende Felder für weitere Filterung.

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

Mit diesem Befehl wird ein DiskANN-Vektorindex für das contentVector-Feld in exampleCollectionerstellt, wodurch Ähnlichkeitssuchen aktiviert werden. Außerdem wird Folgendes hinzugefügt:

Ein Index für das is_open Feld, sodass Sie Ergebnisse basierend darauf filtern können, ob Unternehmen geöffnet sind.
Ein räumlicher Index für das location-Feld, um nach geografischer Nähe zu filtern.

Durchführen einer Vektorsuche

Um Dokumente mit ähnlichen Vektoren innerhalb eines bestimmten geografischen Radius zu finden, geben Sie queryVector für die Ähnlichkeitssuche an, und fügen Sie einen räumlichen Filter ein.

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

In diesem Beispiel gibt die Vektorähnlichkeitssuche die obersten k nächstgelegenen Vektoren basierend auf der angegebenen COS-Ähnlichkeitsmetrik zurück und filtert Ergebnisse, um nur geöffnete Unternehmen innerhalb eines Radius von 100 Meilen einzuschließen.

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

Dieses Ergebnis zeigt die ähnlichsten Dokumente zu queryVector, beschränkt auf einen Umkreis von 160 Kilometern und geöffnete Geschäfte. Jedes Ergebnis enthält die Ähnlichkeitsbewertung und Metadaten, die zeigen, wie DiskANN in Azure DocumentDB kombinierte Vektor- und Geospatialabfragen für erweiterte, standortabhängige Sucherfahrungen unterstützt.

Sie können HNSW-Indizes auf M30- und höheren Clusterebenen erstellen. Um den hierarchischen navigierbaren Kleinen Weltindex (HNSW) zu erstellen, müssen Sie einen Vektorindex erstellen, wobei der Parameter "kind" gemäß diesem Muster auf "vector-hnsw" eingestellt wird:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

Feld	Typ	Description
`m`	integer	Die maximale Anzahl von Verbindungen pro Ebene (standardmäßig 16, Mindestwert ist 2, Maximalwert ist 100). Höhere m eignen sich für Datasets mit hoher Dimensionalität und/oder hohen Genauigkeitsanforderungen.
`efConstruction`	integer	Die Größe der dynamischen Kandidatenliste zum Erstellen des Diagramms (64 standardmäßig ist der Mindestwert 4, der Maximalwert ist 1000). Höhere `efConstruction` Ergebnisse führen zu besserer Indexqualität und höherer Genauigkeit, aber es erhöht auch die Zeit, die für den Aufbau des Indexes benötigt wird. `efConstruction` muss mindestens `2 * m` sein

Durchführen einer Vektorsuche mit HNSW

Verwenden Sie zum Ausführen einer Vektorsuche die $search Aggregationspipelinephase und den cosmosSearch Operator.

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

Feld	Typ	Description
`efSearch`	integer	Die Größe der dynamischen Kandidatenliste für die Suche (standardmäßig 40). Ein höherer Wert verbessert das Erinnerungsvermögen auf Kosten von Geschwindigkeit.

Hinweis

Das Erstellen eines HNSW-Indexes mit großen Datasets kann dazu führen, dass Ihre Azure DocumentDB-Ressource nicht genügend Arbeitsspeicher hat, oder die Leistung anderer Vorgänge, die in Ihrer Datenbank ausgeführt werden, einschränken kann. Wenn solche Probleme auftreten, skalieren Sie Ihre Ressource auf eine höhere Clusterebene, oder erstellen Sie einen neuen DiskANN-Vektorindex.

Beispiel für die Verwendung eines HNSW-Index

In den folgenden Beispielen wird gezeigt, wie Sie Vektoren indizieren, Dokumente mit Vektoreigenschaften hinzufügen, eine Vektorsuche durchführen und die Indexkonfiguration abrufen.

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

Dieser Befehl erstellt einen HNSW-Index anhand der Eigenschaft contentVector in den Dokumenten, die in der angegebenen Sammlung exampleCollection gespeichert sind. Die cosmosSearchOptions-Eigenschaft gibt die Parameter für den HNSW-Vektorindex an. Wenn in Ihrem Dokument der Vektor in einer geschachtelten Eigenschaft gespeichert ist, können Sie diese Eigenschaft mithilfe eines Punktnotationspfads festlegen. Verwenden Sie beispielsweise text.contentVector, wenn contentVector eine Untereigenschaft von text ist.

Hinzufügen von Vektoren zu Ihrer Datenbank

Um ihrer Datenbanksammlung Vektoren hinzuzufügen, müssen Sie zunächst die Einbettungen mithilfe Ihres eigenen Modells, Azure OpenAI-Einbettungen oder einer API wie Hugging Face auf Azure erstellen. In diesem Beispiel fügen Sie neue Dokumente über Beispieleinbettungen hinzu:

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", contentVector: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", contentVector: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", contentVector: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", contentVector: [0.91, 0.76, 0.83]},
]);

Durchführen einer Vektorsuche

Fahren Sie mit dem letzten Beispiel fort, und erstellen Sie einen weiteren Vektor: queryVector. Die Vektorsuche misst den Abstand zwischen queryVector und den Vektoren im contentVector-Pfad Ihrer Dokumente. Sie können die Anzahl der Ergebnisse festlegen, die die Suche zurückgibt, indem Sie den Parameter kfestlegen, der hier auf 2 festgelegt ist. Sie können auch eine ganze Zahl, efSearch, festlegen, die die Größe der Kandidatenvektorliste steuert. Ein höherer Wert kann die Genauigkeit verbessern, aber die Suche ist dadurch langsamer. Dieser Parameter ist optional mit dem Standardwert 40.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": queryVector,
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

In diesem Beispiel führen Sie eine Vektorsuche mithilfe der Eingabe queryVector über die Mongo-Shell aus. Das Suchergebnis ist eine Liste aus zwei Elemente, die dem Abfragevektor am ähnlichsten sind, sortiert nach ihren Ähnlichkeitswerten.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Um einen Vektorindex mithilfe des IVF-Algorithmus zu erstellen, verwenden Sie die folgende createIndexes Vorlage, und legen Sie den "kind" Parameter auf :"vector-ivf"

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

Feld	Typ	Description
`numLists`	integer	Diese ganze Zahl ist die Anzahl der Cluster, die der IVF-Index verwendet, um die Vektordaten zu gruppieren. Legen Sie `numLists` für bis zu eine Million Dokumente auf `documentCount/1000` und für mehr als 1 Million Dokumente auf `sqrt(documentCount)` fest. Die Verwendung eines `numLists` Werts von 1 ähnelt dem Ausführen der Brute-Force-Suche, die eingeschränkte Leistung hat.

Von Bedeutung

Das korrekte Festlegen des numLists Parameters ist wichtig, um eine gute Genauigkeit und Leistung zu erzielen. Setze numLists auf documentCount/1000 für bis zu eine Million Dokumente. Verwenden Sie für mehr als 1 Millionen Dokumente den DiskANN-Vektorindex, um optimale Ergebnisse zu erzielen.

Wenn die Anzahl der Elemente in Ihrer Datenbank wächst, sollten Sie numLists so anpassen, dass er größer ist, um bei der Vektorsuche eine gute Latenz zu erzielen.

Wenn Sie mit einem neuen Szenario experimentieren oder eine kleine Demo erstellen, können Sie mit numLists "1" beginnen, um eine Brute-Force-Suche über alle Vektoren hinweg auszuführen. Diese Einstellung bietet die genauesten Ergebnisse aus der Vektorsuche, aber die Suchgeschwindigkeit und Latenz sind langsamer. Nach dem anfänglichen Setup optimieren Sie den numLists Parameter entsprechend der vorherigen Anleitung.

Durchführen einer Vektorsuche mit IVF

Verwenden Sie zum Durchführen einer Vektorsuche die Aggregationspipelinephase $search in einer MongoDB-Abfrage. Um den Index cosmosSearch zu verwenden, verwenden Sie den neuen cosmosSearch-Operator.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Um den Ähnlichkeitswert (searchScore) zusammen mit den von der Vektorsuche gefundenen Dokumenten abzurufen, verwenden Sie den $project-Operator, um searchScore einzuschließen und in <custom_name_for_similarity_score> in den Ergebnissen umzubenennen. Anschließend wird das Dokument auch als geschachteltes Objekt projiziert. Die Ähnlichkeitsbewertung wird mithilfe der im Vektorindex definierten Metrik berechnet.

Von Bedeutung

Vektoren müssen ein number[] sein, um indiziert zu werden. Ein Vektor, der einen anderen Typ verwendet, wie z. B. double[], verhindert, dass das Dokument indiziert wird. Nicht indizierte Dokumente werden nicht im Ergebnis einer Vektorsuche zurückgegeben.

Beispiel für die Verwendung eines IVF-Indexes

Invertierte Dateiindizierung (IVF) ist eine Methode, die Vektoren in Cluster organisiert. Während einer Vektorsuche wird der Abfragevektor zuerst mit den Mittelpunkten dieser Cluster verglichen. Die Suche wird dann innerhalb des Clusters durchgeführt, dessen Mittelpunkt dem Abfragevektor am nächsten liegt.

Der numLists Parameter bestimmt die Anzahl der zu erstellenden Cluster. Ein einzelner Cluster impliziert, dass die Suche für alle Vektoren in der Datenbank durchgeführt wird; ähnlich einer Brute-Force- oder kNN-Suche. Diese Einstellung bietet die höchste Genauigkeit, aber auch die größte Latenz.

Das Erhöhen des Werts numLists resultiert in mehr Clustern, die jeweils weniger Vektoren enthalten. Wenn er beispielsweise numLists=2 lautet, enthält jeder Cluster mehr Vektoren als wenn er numLists=3 lautet usw. Weniger Vektoren pro Cluster beschleunigen die Suche (niedrigere Latenz, höhere Abfragen pro Sekunde). Dadurch wird jedoch die Wahrscheinlichkeit erhöht, dass der am ähnlichsten Vektor in Ihrer Datenbank dem Abfragevektor fehlt. Dieses Problem liegt an der unvollkommenen Art von Clustering, bei der sich die Suche möglicherweise auf einen Cluster konzentriert, während sich der tatsächliche "nächstgelegene" Vektor in einem anderen Cluster befindet.

Der nProbes Parameter steuert die Anzahl der zu durchsuchenden Cluster. Der Wert ist standardmäßig 1, d. h. er durchsucht nur den Cluster mit der Mitte, die dem Abfragevektor am nächsten kommt. Durch das Erhöhen dieses Werts kann die Suche mehr Cluster abdecken, wodurch die Genauigkeit verbessert, aber auch die Latenz erhöht wird (wodurch Anzahl von Abfragen pro Sekunde verringert wird), da mehr Cluster und Vektoren durchsucht werden.

In den folgenden Beispielen wird gezeigt, wie Sie Vektoren indizieren, Dokumente mit Vektoreigenschaften hinzufügen, eine Vektorsuche durchführen und die Indexkonfiguration abrufen.

Erstellen eines Vektorindexes

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

Dieser Befehl erstellt einen vector-ivf-Index anhand der Eigenschaft vectorContent in den Dokumenten, die in der angegebenen Sammlung (exampleCollection) gespeichert sind. Die cosmosSearchOptions-Eigenschaft gibt die Parameter für den IVF-Vektorindex an. Wenn in Ihrem Dokument der Vektor in einer geschachtelten Eigenschaft gespeichert ist, können Sie diese Eigenschaft mithilfe eines Punktnotationspfads festlegen. Verwenden Sie beispielsweise text.vectorContent, wenn vectorContent eine Untereigenschaft von text ist.

Hinzufügen von Vektoren zu Ihrer Datenbank

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

Durchführen einer Vektorsuche

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Abfragevektoren und Vektorabstände (Ähnlichkeitsbewertungen) mithilfe von $search

Fahren Sie mit dem letzten Beispiel fort, und erstellen Sie einen weiteren Vektor: queryVector. Die Vektorsuche misst den Abstand zwischen queryVector und den Vektoren im vectorContent-Pfad Ihrer Dokumente. Sie können die Anzahl der Ergebnisse festlegen, die die Suche zurückgibt, indem Sie den Parameter kfestlegen, der hier auf 2 festgelegt ist. Sie können auch den Integerwert nProbes festlegen, der die Anzahl der sich in der Nähe befindlichen Cluster steuert, die in den einzelnen Suchvorgängen überprüft werden. Ein höherer Wert kann die Genauigkeit verbessern, die Suche ist jedoch langsamer als Ergebnis. Dieser Parameter ist optional mit einem Standardwert von 1 und kann nicht größer als der numLists im Vektorindex angegebene Wert sein.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

In diesem Beispiel führen Sie eine Vektorsuche mit queryVector als Eingabe über die Mongo-Shell aus. Das Suchergebnis ist eine Liste aus zwei Elemente, die dem Abfragevektor am ähnlichsten sind, sortiert nach ihren Ähnlichkeitswerten.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Abrufen von Vektorindexdefinitionen

Verwenden Sie den Befehl listIndexes, um Ihre Vektorindexdefinition aus der Sammlung abzurufen:

db.exampleCollection.getIndexes();

In diesem Beispiel wird vectorIndex mit allen cosmosSearch-Parametern zurückgegeben, die zum Erstellen des Index verwendet wurden:

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

Gefilterte Vektorsuche

Sie können jetzt Vektorsuchen mit jedem unterstützten Abfragefilter wie $lt, $lte, $eq, $neq$gte, $gt, $in, $nin und $regex durchführen.

Um die Vorfilterung zu verwenden, müssen Sie zunächst zusätzlich zum Vektorindex einen Standardindex für die Eigenschaft definieren, nach der Sie filtern möchten. Hier ist ein Beispiel für das Erstellen eines Filterindexes:

db.runCommand({
  "createIndexes": "<collection_name>",
  "indexes": [ {
    "key": {
      "<property_to_filter>": 1
    },
    "name": "<name_of_filter_index>"
  }
  ]
});

Sobald der Filterindex vorhanden ist, können Sie die "filter" Klausel direkt zu Ihrer Vektorsuchabfrage hinzufügen. In diesem Beispiel wird gezeigt, wie Sie Ergebnisse filtern, in denen der Wert der "title" Eigenschaft in der bereitgestellten Liste nicht vorhanden ist:

db.exampleCollection.aggregate([
  {
    '$search': {
      "cosmosSearch": {
        "vector": "<query_vector>",
        "path": <path_to_vector>,
        "k": num_results,
        "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
      },
      "returnStoredSource": True }},
  {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

Von Bedeutung

Um die Leistung und Genauigkeit Ihrer vorfilterten Vektorsuchen zu optimieren, sollten Sie die Vektorindexparameter anpassen. Bei DiskANN-Indizes kann das Erhöhen von maxDegree oder lBuild zu besseren Ergebnissen führen. Für HNSW-Indizes können Sie mit höheren Werten für m, efConstructionoder efSearch die Leistung verbessern. Ebenso können bei IVF-Indizes optimierungen numLists oder nProbes zu zufriedenstellenderen Ergebnissen führen. Es ist wichtig, Ihre spezifische Konfiguration mit Ihren Daten zu testen, um sicherzustellen, dass die Ergebnisse Ihren Anforderungen entsprechen. Diese Parameter beeinflussen die Indexstruktur und das Suchverhalten, und optimale Werte können je nach Ihren Datenmerkmalen und Abfragemustern variieren.

Verwenden von LLM-Orchestrierungstools (Large Language Model)

Verwenden als Vektordatenbank mit semantischem Kernel

Verwenden Sie den semantischen Kernel, um Ihren Informationsabruf aus Azure DocumentDB und Ihrem LLM zu koordinieren. Weitere Informationen finden Sie im GitHub-Repository.

Verwenden als Vektordatenbank mit LangChain

Verwenden Sie LangChain, um Ihren Informationsabruf aus Azure DocumentDB und Ihrem LLM zu koordinieren. Weitere Informationen finden Sie unter LangChain-Integrationen für Azure DocumentDB.

Verwenden als semantischer Cache mit LangChain

Verwenden Sie LangChain und Azure DocumentDB, um die semantische Zwischenspeicherung zu koordinieren, indem Sie zuvor aufgezeichnete LLM-Antworten verwenden, mit denen Sie DIE KOSTEN der LLM-API sparen und die Latenz für Antworten reduzieren können. Weitere Informationen finden Sie unter LangChain-Integration in Azure DocumentDB.

Funktionen und Einschränkungen

Unterstützte Abstandsmetriken: L2 (euklidisch), inneres Produkt und Kosinus.
Unterstützte Indizierungsmethoden: IVFFLAT, HNSW und DiskANN.
Mit diskANN und produktquantisierung können Sie Vektoren bis zu 16.000 Dimensionen indizieren.
Die Verwendung von HNSW oder IVF mit halber Genauigkeit ermöglicht die Indizierung von Vektoren bis zu 4.000 Dimensionen.
Ohne Komprimierung beträgt die standardmäßige maximale Vektordimension für die Indizierung 2.000.
Die Indizierung gilt nur für einen Vektor pro Pfad.
Sie können nur einen Index pro Vektorpfad erstellen.

Zusammenfassung

In diesem Leitfaden wird gezeigt, wie Sie einen Vektorindex erstellen, Dokumente mit Vektordaten hinzufügen, eine Ähnlichkeitssuche durchführen und die Indexdefinition abrufen. Mithilfe unserer integrierten Vektordatenbank können Sie hochdimensionale Vektordaten effizient in Azure DocumentDB speichern, indizieren und abfragen. Sie ermöglicht es Ihnen, das volle Potenzial Ihrer Daten mithilfe von Vektoreinbettungen zu nutzen und präzisere, effizientere und leistungsfähigere Anwendungen zu erstellen.

Nächster Schritt

Erstellen eines lebenslangen Free-Tier-Clusters für Azure DocumentDB

Feedback

War diese Seite hilfreich?

Last updated on 2025-11-19

Freigeben über

Integrierter Vektorspeicher in Azure DocumentDB

Was ist ein Vektorspeicher?

Wie funktioniert ein Vektorspeicher?

Anwendungsfälle für Vektordatenbanken

Integrierte Vektordatenbank im Vergleich zur reinen Vektordatenbank

Open-Source-Vektordatenbanken

Auswählen der besten Open Source-Vektordatenbank

Herausforderungen von Open-Source-Vektordatenbanken

Bewältigung der Herausforderungen von Open-Source-Vektordatenbanken

Durchführen der Vektorähnlichkeitssuche

Durchführen einer Vektorsuche mit DiskANN

Beispiel für die Verwendung eines DiskANN-Indexes mit Filterung

Hinzufügen von Vektoren zu Ihrer Datenbank

Erstellen eines DiskANN-Vektorindex

Durchführen einer Vektorsuche

Abrufen von Vektorindexdefinitionen

Gefilterte Vektorsuche

Verwenden von LLM-Orchestrierungstools (Large Language Model)

Verwenden als Vektordatenbank mit semantischem Kernel

Verwenden als Vektordatenbank mit LangChain

Verwenden als semantischer Cache mit LangChain

Funktionen und Einschränkungen

Zusammenfassung

Verwandte Inhalte

Nächster Schritt

Feedback

Zusätzliche Ressourcen