Integrované úložiště vektorů v Azure DocumentDB

Využijte integrovanou vektorovou databázi v Azure DocumentDB k bezproblémovému propojení aplikací založených na umělé inteligenci s daty uloženými v Azure DocumentDB. Tato integrace může zahrnovat aplikace vytvořené pomocí Azure OpenAI embedding. Nativní integrovaná vektorová databáze umožňuje efektivně ukládat, indexovat a dotazovat vysoce dimenzionální vektorová data uložená přímo v Azure DocumentDB spolu s původními daty, ze kterých se vektorová data vytvářejí. Eliminuje nutnost přenášet data do alternativních úložišť vektorů a vyžadovat další náklady.

Co je úložiště vektorů?

Vektorové úložiště nebo vektorová databáze je databáze určená k ukládání a správě vkládání vektorů, což jsou matematické reprezentace dat ve vysokodimenzionálním prostoru. V tomto prostoru každá dimenze odpovídá funkci dat a desítky tisíc dimenzí se můžou použít k reprezentaci sofistikovaných dat. Pozice vektoru v tomto prostoru představuje jeho vlastnosti. Slova, fráze nebo celé dokumenty a obrázky, zvuk a další typy dat můžou být vektorizovány.

Jak funguje úložiště vektorů?

V úložišti vektorů se algoritmy vektorového vyhledávání používají k indexování a vkládání dotazů. Mezi dobře známé algoritmy vektorového vyhledávání patří Hierarchical Navigable Small World (HNSW), Inverted File (IVF) a DiskANN. Vektorové vyhledávání je metoda, která vám pomůže najít podobné položky na základě jejich charakteristik dat, nikoli přesných shod v poli vlastnosti. Tato technika je užitečná v aplikacích, jako je hledání podobného textu, hledání souvisejících obrázků, vytváření doporučení nebo dokonce zjišťování anomálií. Používá se k dotazování na vektorová zakódování (seznamy čísel) dat, která jste vytvořili modelem strojového učení pomocí rozhraní API pro zakódování. Příklady rozhraní API pro embeddingy jsou embeddingy služby Azure OpenAI nebo Hugging Face na Azure. Vektorové vyhledávání měří vzdálenost mezi datovými vektory a vektorem dotazu. Datové vektory, které jsou nejblíže vašemu vektoru dotazu, jsou ty, které jsou nalezeny nejvíce podobné sémanticky.

V integrované vektorové databázi v Azure DocumentDB můžete ukládat, indexovat a dotazovat vkládání společně s původními daty. Tento přístup eliminuje dodatečné náklady na replikaci dat v samostatné čistě vektorové databázi. Tato architektura navíc udržuje vektorové vkládání a původní data společně, což usnadňuje operace s vícemodálními daty a umožňuje větší konzistenci dat, škálování a výkon.

Případy použití vektorové databáze

Vektorové databáze se používají v mnoha oblastech umělé inteligence a analýzy dat. Pomáhají s úlohami, jako je pochopení přirozeného jazyka, rozpoznávání obrázků a videí, vytváření systémů doporučení a výkon funkcí vyhledávání. Najdete je v analytických AI i generovaných aplikacích AI.

Vektorovou databázi můžete použít například k:

Identifikujte podobné obrázky, dokumenty a skladby na základě jejich obsahu, motivů, mínění a stylů.
Identifikujte podobné produkty na základě jejich charakteristik, funkcí a skupin uživatelů.
Doporučte obsah, produkty nebo služby na základě preferencí jednotlivců.
Doporučte obsah, produkty nebo služby na základě podobností skupin uživatelů.
Identifikujte nejvhodnější možnosti z velkého souboru voleb, které vyhovují složitým požadavkům.
Identifikujte datové anomálie nebo podvodné aktivity, které se liší od převládajících nebo normálních vzorů.
Implementujte trvalou paměť pro agenty AI.
Povolte generování rozšířené vyhledáváním (RAG).

Integrovaná vektorová databáze vs. databáze čistých vektorů

Existují dva běžné typy implementací vektorové databáze: databáze čistých vektorů a integrovaná vektorová databáze v NoSQL nebo relační databázi.

Databáze čistých vektorů efektivně ukládá a spravuje vkládání vektorů spolu s malým množstvím metadat. Je oddělená od zdroje dat, ze kterého jsou vložené objekty odvozeny.

Vektorová databáze, která se integruje do vysoce výkonné NoSQL nebo relační databáze, poskytuje další možnosti. Integrovaná vektorová databáze v NoSQL nebo relační databázi může ukládat, indexovat a dotazovat vkládání společně s odpovídajícími původními daty. Tento přístup eliminuje dodatečné náklady na replikaci dat v samostatné čistě vektorové databázi. Navíc udržování vektorových vkládání a původních dat společně usnadňuje operace s vícemodálními daty a umožňuje větší konzistenci dat, škálování a výkon.

Opensourcové vektorové databáze

Když vývojáři vyberou vektorové databáze, nabízí opensourcové možnosti řadu výhod. Open source znamená, že zdrojový kód softwaru je volně dostupný a umožňuje uživatelům přizpůsobit databázi podle svých konkrétních potřeb. Tato flexibilita je výhodná pro organizace, které podléhají jedinečným zákonným požadavkům na data, jako jsou společnosti v odvětví finančních služeb.

Další výhodou open-source vektorových databází je silná podpora komunity, kterou využívají. Aktivní komunity uživatelů často přispívají k vývoji těchto databází, poskytují podporu a sdílejí osvědčené postupy a podporují inovace.

Někteří jednotlivci se rozhodnou pro opensourcové vektorové databáze, protože jsou "zdarma", což znamená, že neexistuje žádné náklady na získání nebo použití softwaru. Alternativou je použití úrovní Free nabízených službami spravované databáze vektorů. Tyto spravované služby poskytují nejen bezplatný přístup k určitému limitu využití, ale také zjednodušují provozní zátěž zpracováním údržby, aktualizací a škálovatelnosti. Díky použití bezplatné úrovně spravovaných vektorových databázových služeb můžete dosáhnout úspor nákladů a zároveň snížit režii správy. Tento přístup vám umožní soustředit se spíše na základní aktivity než na správu databáze.

Výběr nejlepší opensourcové vektorové databáze

Volba nejlepší opensourcové vektorové databáze vyžaduje zvážení několika faktorů. Výkon a škálovatelnost databáze jsou zásadní, protože ovlivňují, jestli databáze dokáže zpracovat vaše konkrétní požadavky na úlohy. Databáze s efektivními funkcemi indexování a dotazování obvykle nabízejí optimální výkon. Dalším faktorem je podpora komunity a dostupná dokumentace pro databázi. Robustní komunita a dokumentace vám mohou poskytnout cennou pomoc. DocumentDB je například oblíbená opensourcová vektorová databáze:

Nejoblíbenější možnost pro vás nemusí být nejlepší. Měli byste tedy porovnat různé možnosti založené na funkcích, podporovaných datových typech a kompatibilitě s existujícími nástroji a architekturami, které používáte. Měli byste také pamatovat na výzvy opensourcových databází vektorů.

Výzvy opensourcových vektorových databází

Většina opensourcových vektorových databází, včetně dříve uvedených databází, jsou čistě vektorové databáze. Jinými slovy, jsou navržené tak, aby ukládaly a spravovaly pouze vkládání vektorů spolu s malým množstvím metadat. Vzhledem k tomu, že fungují odděleně od původních dat, je potřeba přesouvat data mezi různými službami. Tato složitost zvyšuje dodatečné náklady, zkompiluje věci a může zpomalit produkční systémy.

Představují také výzvy, které jsou typické pro opensourcové databáze:

Nastavení: Potřebujete podrobné znalosti pro instalaci, konfiguraci a provoz databáze, zejména pro složitá nasazení. Optimalizace prostředků a konfigurace při škálování provozu vyžaduje pečlivé sledování a úpravy.
Údržba: Musíte spravovat vlastní aktualizace, opravy a údržbu. Odborné znalosti strojového učení nestačí; musíte mít také rozsáhlé zkušenosti se správou databáze.
Podpora: Oficiální podpora může být v porovnání se spravovanými službami omezena a spoléhá se na pomoc komunity.

Ačkoli jsou tedy zpočátku zdarma, vznikají u open-source vektorových databází při zvyšování rozsahu značné náklady. Rozšíření provozu vyžaduje více hardwaru, kvalifikovaných pracovníků IT a pokročilé správy infrastruktury, což vede k vyšším nákladům na hardware, personál a provozní náklady. Škálování opensourcových vektorových databází může být finančně náročné i přes nedostatek licenčních poplatků.

Řešení problémů opensourcových vektorových databází

Plně spravovaná vektorová databáze, která se integruje do vysoce výkonné NoSQL nebo relační databáze, zabraňuje dodatečným nákladům a složitosti opensourcových vektorových databází. Taková databáze ukládá, indexuje a dotazy vkládá spolu s odpovídajícími původními daty. Tento přístup eliminuje dodatečné náklady na replikaci dat v samostatné čistě vektorové databázi. Kromě toho je lepší udržovat vektorové vkládání a původní data společně, což usnadňuje operace s vícemodálními daty a umožňuje větší konzistenci dat, škálování a výkon. Mezitím plně spravovaná služba vývojářům pomáhá vyhnout se potížím v nastavování, údržbě a spoléhat se na komunitní pomoc s opensourcovou vektorovou databází. Některé spravované služby vektorových databází navíc nabízejí úroveň, která je zdarma na dobu životnosti.

Příkladem je integrovaná vektorová databáze v Azure DocumentDB. Toto nastavení umožňuje vývojářům ušetřit peníze stejně jako u opensourcových vektorových databází. Na rozdíl od opensourcových možností se ale poskytovatel služeb stará o údržbu, aktualizace a škálování za vás. Modernizace je rychlá a snadná a současně udržuje nízké celkové náklady na vlastnictví (TCO), když je čas rozšířit operace. Pomocí této služby můžete také pohodlně škálovat aplikace MongoDB, které jsou již v produkčním prostředí.

Hledání vektorové podobnosti

Azure DocumentDB poskytuje robustní funkce vektorového vyhledávání, které umožňují provádět vysokorychlostní vyhledávání podobností napříč komplexními datovými sadami. Pokud chcete ve službě Azure DocumentDB provádět vektorové vyhledávání, musíte nejprve vytvořit vektorový index. Azure DocumentDB sice nabízí několik možností, ale tady jsou některé obecné pokyny, které vám pomůžou začít na základě velikosti datové sady:

	IVF	HNSW	DiskANN (doporučeno)
Description	Index IVFFlat rozděluje vektory do seznamů a pak prohledá podmnožinu nejblíže vektoru dotazu.	Index HNSW vytvoří vícevrstevný graf.	DiskANN je přibližný vyhledávací algoritmus nejbližšího souseda navržený pro efektivní vektorové vyhledávání v libovolném měřítku.
Klíčové kompromisy	Profesionálové: Rychlejší časy sestavení, nižší využití paměti. Nevýhody: Nižší výkon dotazů (z hlediska kompromisu mezi rychlostí a odvoláním).	Výhody: Lepší výkon dotazů (z hlediska kompromisu mezi rychlostí a přesností) lze vytvořit na prázdné tabulce. Nevýhody: Pomalejší časy sestavení, vyšší využití paměti.	Výhody: Efektivní v jakémkoli měřítku, vysoká přesnost, vysoká propustnost, nízká latence.
Počet vektorů	Méně než 10 000	Až 50 000	Až 500 000+
Doporučená úroveň clusteru	M10 nebo M20	M30 a vyšší	M30 a vyšší

Indexy DiskANN můžete použít na úrovních M30 a vyšších úrovních. Pokud chcete vytvořit index DiskANN, nastavte "kind" parametr na "vector-diskann" následující šablonu:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-diskann", 
                "dimensions": <integer_value>,
                "similarity": <string_value>,
                "maxDegree" : <integer_value>, 
                "lBuild" : <integer_value>, 
            } 
        } 
    ] 
}

Pole	Typ	Description
`index_name`	řetězec	Jedinečný název indexu
`path_to_property`	řetězec	Cesta k vlastnosti, která obsahuje vektor. Tato cesta může být vlastností nejvyšší úrovně nebo cestou pomocí notace s tečkami k vlastnosti. Vektory musí být `number[]` před tím, než jsou indexovány a použity ve výsledcích vyhledávání vektorů. Vektor používající jiný typ, například `double[]`, zabraňuje indexování dokumentu. Neindexované dokumenty se nevracejí ve výsledku vektorového hledání.
`kind`	řetězec	Typ vektorového indexu, který chcete vytvořit. Možnosti jsou `vector-ivf`, `vector-hnsw`a `vector-diskann`.
`dimensions`	integer	Počet dimenzí pro podobnost vektorů DiskANN podporuje až 16 000 dimenzí (s kvantací produktu) s budoucí podporou plánovanou na 40 000 +.
`similarity`	řetězec	Metrika podobnosti, která se má použít s indexem Možné možnosti jsou `COS` (kosinusová vzdálenost), `L2` (euklidová vzdálenost) a `IP` (vnitřní součin).
`maxDegree`	integer	Maximální počet hran na uzel v grafu Tento parametr se pohybuje od 20 do 2048 (výchozí hodnota je 32). Vyšší `maxDegree` je vhodný pro datové sady s vysokou dimenzionalitou a/nebo požadavky na vysokou přesnost.
`lBuild`	integer	Nastaví počet kandidátských sousedů vyhodnocených během sestavování indexu DiskANN. Tento parametr, který se pohybuje od 10 do 500 (výchozí hodnota je 50), vyrovnává přesnost a výpočetní režii: vyšší hodnoty zlepšují kvalitu a přesnost indexu, ale zvyšují dobu sestavování.

Provedení vektorového vyhledávání pomocí DiskANN

K provedení vektorového vyhledávání použijte $search fázi kanálu agregace a dotazujte se s operátorem cosmosSearch . DiskANN umožňuje vysoce výkonné vyhledávání v rozsáhlých datových sadách s volitelným filtrováním, jako jsou geoprostorové nebo textové filtry.

{
  "$search": {
    "cosmosSearch": {
      "path": "<path_to_property>",
      "query": "<query_vector>",  
      "k": <num_results_to_return>,  
      "filter": {"$and": [
        { "<attribute_1>": { "$eq": <value> } },
        {"<location_attribute>": {"$geoWithin": {"$centerSphere":[[<longitude_integer_value>, <latitude_integer_value>], <radius>]}}}
      ]}
    }
  }
},

Pole	Typ	Description
`lSearch`	integer	Určuje velikost dynamického seznamu kandidátů pro vyhledávání. Výchozí hodnota je 40 s konfigurovatelným rozsahem od 10 do 1000. Zvýšení hodnoty zvyšuje přesnost, ale může snížit rychlost vyhledávání.
`k`	integer	Definuje počet výsledků hledání, které se mají vrátit. Hodnota `k` musí být menší nebo rovna `lSearch`.

Příklad použití indexu DiskANN s filtrováním

Přidání vektorů do databáze

Pokud chcete použít vektorové vyhledávání s geoprostorovými filtry, přidejte dokumenty, které obsahují jak vektorové vkládání, tak souřadnice umístění. Vytváření embeddings můžete realizovat pomocí vlastního modelu, Azure OpenAI embeddings nebo rozhraní API, jako je Hugging Face na Azure.

from pymongo import MongoClient

client = MongoClient("<your_connection_string>")
db = client["test"]
collection = db["testCollection"]

documents = [
    {"name": "Eugenia Lopez", "bio": "CEO of AdventureWorks", "is_open": 1, "location": [-118.9865, 34.0145], "contentVector": [0.52, 0.20, 0.23]},
    {"name": "Cameron Baker", "bio": "CFO of AdventureWorks", "is_open": 1, "location": [-0.1278, 51.5074], "contentVector": [0.55, 0.89, 0.44]},
    {"name": "Jessie Irwin", "bio": "Director of Our Planet initiative", "is_open": 0, "location": [-118.9865, 33.9855], "contentVector": [0.13, 0.92, 0.85]},
    {"name": "Rory Nguyen", "bio": "President of Our Planet initiative", "is_open": 1, "location": [-119.0000, 33.9855], "contentVector": [0.91, 0.76, 0.83]}
]

collection.insert_many(documents)

Vytvoření indexu vektoru DiskANN

Následující příklad ukazuje, jak nastavit index vektoru DiskANN s možnostmi filtrování. Tento příklad zahrnuje vytvoření vektorového indexu pro vyhledávání podobnosti, přidání dokumentů s vektorovými a geoprostorovými vlastnostmi a indexování polí pro další filtrování.

db.command({
    "createIndexes": "testCollection",
    "indexes": [
        {
            "name": "DiskANNVectorIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": {
                "kind": "vector-diskann",
                "dimensions": 3,
                "similarity": "COS",
                "maxDegree": 32,
                "lBuild": 64
            }
        },
        { 
            "name": "is_open",
            "key": { 
                "is_open": 1 
            }      
        },
        {
            "name": "locationIndex",
            "key": {
                "location": 1
            }
        }
    ]
})

Tento příkaz vytvoří na poli contentVectorindex exampleCollection vektoru DiskANN, který umožňuje vyhledávání podobnosti. Přidá také:

Index v is_open poli, abyste mohli filtrovat výsledky podle toho, jestli jsou firmy otevřené.
Geoprostorový index location pole pro filtrování podle geografické blízkosti.

Provedení vektorového vyhledávání

Pokud chcete najít dokumenty s podobnými vektory v určitém geografickém poloměru, zadejte queryVector hledání podobnosti a zahrňte geoprostorový filtr.

query_vector = [0.52, 0.28, 0.12]
pipeline = [
    {
        "$search": {
            "cosmosSearch": {
                "path": "contentVector",
                "vector": query_vector,
                "k": 5,
                "filter": {
                    "$and": [
                        {"is_open": {"$eq": 1}},
                        {"location": {"$geoWithin": {"$centerSphere": [[-119.7192861804, 34.4102485028], 100 / 3963.2]}}}
                    ]
                }
            }
        }
    }
]

results = list(collection.aggregate(pipeline))
for result in results:
    print(result)

V tomto příkladu vyhledávání podle vektorové podobnosti vrátí k nejbližších vektorů na základě zadané COS metriky podobnosti, přičemž výsledky jsou filtrovány tak, aby zahrnovaly pouze otevřené firmy v okruhu 100 mil.

[
  {
    similarityScore: 0.9745354109084544,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'CEO of AdventureWorks',
      is_open: 1,
      location: [-118.9865, 34.0145],
      contentVector: [0.52, 0.20, 0.23]
    }
  },
  {
    similarityScore: 0.9006955671333992,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'President of Our Planet initiative',
      is_open: 1,
      location: [-119.7302, 34.4005],
      contentVector: [0.91, 0.76, 0.83]
    }
  }
]

Tento výsledek ukazuje nejpodobnější dokumenty queryVector, které jsou omezené na poloměr 160 kilometrů a firmy, které jsou v provozu. Každý výsledek zahrnuje skóre podobnosti a metadata, která demonstrují, jak DiskANN v Azure DocumentDB podporuje kombinované vektorové a geoprostorové dotazy pro rozšířené vyhledávání citlivé na umístění.

Indexy HNSW můžete vytvářet na úrovních clusteru M30 a vyšších. Pokud chcete vytvořit hierarchický index pro navigaci v malém světě (HNSW), musíte vytvořit vektorový index s parametrem "kind" nastaveným na "vector-hnsw" následující šablonu:

{ 
    "createIndexes": "<collection_name>",
    "indexes": [
        {
            "name": "<index_name>",
            "key": {
                "<path_to_property>": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": <integer_value>, 
                "efConstruction": <integer_value>, 
                "similarity": "<string_value>", 
                "dimensions": <integer_value> 
            } 
        } 
    ] 
}

Pole	Typ	Description
`m`	integer	Maximální počet připojení na vrstvu (ve výchozím nastavení 16, minimální hodnota je 2, maximální hodnota je 100). Vyšší m je vhodný pro datové sady s vysokou dimenzionální a/nebo vysokou přesností.
`efConstruction`	integer	velikost dynamického kandidátního seznamu pro vytvoření grafu (ve výchozím nastavení je 64, minimální hodnota je 4, maximální hodnota je 1000). Vyšší `efConstruction` výsledky mají vyšší kvalitu indexu a vyšší přesnost, ale také zvyšuje čas potřebný k sestavení indexu. `efConstruction` musí být alespoň `2 * m`

Provedení vektorového vyhledávání pomocí HNSW

K provedení vektorového vyhledávání použijte $search fázi kanálu agregace a operátora cosmosSearch .

{
    "$search": {
        "cosmosSearch": {
            "vector": <query_vector>,
            "path": "<path_to_property>",
            "k": <num_results_to_return>,
            "efSearch": <integer_value>
        },
    }
}

Pole	Typ	Description
`efSearch`	integer	Velikost dynamického seznamu kandidátů pro vyhledávání (ve výchozím nastavení 40) Vyšší hodnota poskytuje lepší schopnost vybavování za cenu zpomalení.

Note

Vytvoření indexu HNSW s velkými datovými sadami může vést k nedostatku paměti vašeho prostředku Azure DocumentDB nebo může omezit výkon jiných operací spuštěných ve vaší databázi. Pokud narazíte na takové problémy, škálujte prostředek na vyšší úroveň clusteru nebo vytvořte nový index vektoru DiskANN.

Příklad použití indexu HNSW

Následující příklady ukazují, jak indexovat vektory, přidat dokumenty s vlastnostmi vektoru, provést vektorové vyhledávání a načíst konfiguraci indexu.

use test;

db.createCollection("exampleCollection");

db.runCommand({ 
    "createIndexes": "exampleCollection",
    "indexes": [
        {
            "name": "VectorSearchIndex",
            "key": {
                "contentVector": "cosmosSearch"
            },
            "cosmosSearchOptions": { 
                "kind": "vector-hnsw", 
                "m": 16, 
                "efConstruction": 64, 
                "similarity": "COS", 
                "dimensions": 3
            } 
        } 
    ] 
});

Tento příkaz vytvoří index HNSW pro contentVector vlastnost v dokumentech, které jsou uloženy v zadané kolekci, exampleCollection. Vlastnost cosmosSearchOptions určuje parametry indexu vektoru HNSW. Pokud dokument obsahuje vektor uložený ve vnořené vlastnosti, můžete tuto vlastnost nastavit pomocí cesty tečky. Můžete například použít text.contentVector, pokud je contentVector podvlastností text.

Přidání vektorů do databáze

Pokud chcete do kolekce databáze přidat vektory, musíte nejprve vytvořit embeddings pomocí vlastního modelu, embeddings Azure OpenAI nebo rozhraní API, jako Hugging Face on Azure. V tomto příkladu přidáte nové dokumenty prostřednictvím ukázkových vkládání:

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", contentVector: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", contentVector: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", contentVector: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", contentVector: [0.91, 0.76, 0.83]},
]);

Provedení vektorového vyhledávání

Pokračujeme v posledním příkladu a vytvořte další vektor, queryVector. Vektorové vyhledávání měří vzdálenost mezi queryVector a vektory v contentVector cestě k dokumentům. Počet výsledků, které hledání vrací, můžete nastavit nastavením parametru k, který je zde nastaven na hodnotu 2. Můžete také nastavit efSearch, což je celé číslo, které řídí velikost seznamu kandidátských vektorů. Vyšší hodnota může zvýšit přesnost, ale hledání je pomalejší v důsledku toho. Tento parametr je volitelný s výchozí hodnotou 40.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    "$search": {
        "cosmosSearch": {
            "vector": queryVector,
            "path": "contentVector",
            "k": 2,
            "efSearch": 40
        },
    }
  }
}
]);

V tomto příkladu provedete vektorové vyhledávání pomocí queryVector vstupu prostřednictvím prostředí Mongo Shell. Výsledkem hledání je seznam dvou položek, které jsou nejvíce podobné vektoru dotazu seřazené podle skóre podobnosti.

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Pokud chcete vytvořit vektorový index pomocí algoritmu IVF, použijte následující createIndexes šablonu a nastavte "kind" parametr na "vector-ivf":

{
  "createIndexes": "<collection_name>",
  "indexes": [
    {
      "name": "<index_name>",
      "key": {
        "<path_to_property>": "cosmosSearch"
      },
      "cosmosSearchOptions": {
        "kind": "vector-ivf",
        "numLists": <integer_value>,
        "similarity": "<string_value>",
        "dimensions": <integer_value>
      }
    }
  ]
}

Pole	Typ	Description
`numLists`	integer	Toto celé číslo je počet shluků, které index IVF používá k seskupení vektorových dat. Nastavte `numLists` na `documentCount/1000` pro až 1 milion dokumentů a na `sqrt(documentCount)` pro více než 1 milion dokumentů. `numLists` Použití hodnoty 1 je podobné provádění vyhledávání hrubou silou, což má omezený výkon.

Important

Správné nastavení parametru numLists je důležité pro dosažení správné přesnosti a výkonu. Nastavte numLists na documentCount/1000 pro až 1 milion dokumentů. K dosažení optimálních výsledků u více než 1 milionu dokumentů použijte index vektoru DiskANN.

S rostoucím počtem položek v databázi byste měli ladit numLists , aby byl větší, abyste dosáhli dobré latence pro vektorové vyhledávání.

Pokud experimentujete s novým scénářem nebo vytváříte malou ukázku, můžete začít nastavením numLists 1 a provést vyhledávání hrubou silou napříč všemi vektory. Toto nastavení poskytuje nejpřesnější výsledky z vektorového vyhledávání, ale rychlost a latence hledání jsou pomalejší. Po počátečním nastavení vylaďte numLists parametr pomocí předchozích pokynů.

Provedení vektorového vyhledávání pomocí IVF

K provedení vektorového vyhledávání použijte $search fázi kanálu agregace v dotazu MongoDB. Pokud chcete použít cosmosSearch index, použijte nový cosmosSearch operátor.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <query_vector>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Pokud chcete načíst skóre podobnosti (searchScore) spolu s dokumenty nalezenými vektorovým vyhledáváním, použijte $project operátor k zahrnutí searchScore a přejmenování jako <custom_name_for_similarity_score> ve výsledcích. Dokument se pak projektuje také jako vnořený objekt. Skóre podobnosti se vypočítá pomocí metriky definované v indexu vektoru.

Important

Vektory musí být number[] indexované. Vektor používající jiný typ, například double[], zabraňuje indexování dokumentu. Neindexované dokumenty se nevracejí ve výsledku vektorového hledání.

Příklad použití indexu IVF

Indexování invertovaného souboru (IVF) je metoda, která uspořádá vektory do clusterů. Při vektorovém vyhledávání se vektor dotazu nejprve porovná s středy těchto clusterů. Hledání se pak provede v rámci clusteru, jehož střed je nejblíže vektoru dotazu.

Parametr numLists určuje počet clusterů, které se mají vytvořit. Jeden samostatný cluster znamená, že vyhledávání se provádí proti všem vektorům v databázi; je to podobné prohledávání hrubou silou nebo kNN. Toto nastavení poskytuje nejvyšší přesnost, ale také nejvyšší latenci.

Zvýšením hodnoty vznikne numLists více shluků, z nichž každý obsahuje méně vektorů. Pokud například numLists=2každý cluster obsahuje více vektorů, než kdyby numLists=3atd. Méně vektorů na cluster urychlí vyhledávání (nižší latence, vyšší dotazy za sekundu). Tím se ale zvýší pravděpodobnost, že v databázi chybí nejvíce podobný vektor jako vektor dotazu. Příčinou tohoto problému je nekonfektní povaha clusteringu, kdy se hledání může zaměřit na jeden cluster, zatímco skutečný vektor "nejbližší" se nachází v jiném clusteru.

Parametr nProbes řídí počet clusterů, které se mají prohledávat. Ve výchozím nastavení je hodnota 1, což znamená, že prohledává pouze cluster se středem nejblíže vektoru dotazu. Zvýšení této hodnoty umožňuje hledání pokrýt více clusterů, zlepšit přesnost, ale také zvýšit latenci (tedy snížit počet dotazů za sekundu), protože se prohledává více clusterů a vektorů.

Následující příklady ukazují, jak indexovat vektory, přidat dokumenty s vlastnostmi vektoru, provést vektorové vyhledávání a načíst konfiguraci indexu.

Vytvoření vektorového indexu

use test;

db.createCollection("exampleCollection");

db.runCommand({
  createIndexes: 'exampleCollection',
  indexes: [
    {
      name: 'vectorSearchIndex',
      key: {
        "vectorContent": "cosmosSearch"
      },
      cosmosSearchOptions: {
        kind: 'vector-ivf',
        numLists: 3,
        similarity: 'COS',
        dimensions: 3
      }
    }
  ]
});

Tento příkaz vytvoří vector-ivf index proti vectorContent vlastnosti v dokumentech, které jsou uloženy v zadané kolekci, exampleCollection. Vlastnost cosmosSearchOptions určuje parametry pro index vektoru IVF. Pokud dokument obsahuje vektor uložený ve vnořené vlastnosti, můžete tuto vlastnost nastavit pomocí cesty tečky. Můžete například použít text.vectorContent, pokud je vectorContent podvlastností text.

Přidání vektorů do databáze

db.exampleCollection.insertMany([
  {name: "Eugenia Lopez", bio: "Eugenia is the CEO of AdvenureWorks.", vectorContent: [0.51, 0.12, 0.23]},
  {name: "Cameron Baker", bio: "Cameron Baker CFO of AdvenureWorks.", vectorContent: [0.55, 0.89, 0.44]},
  {name: "Jessie Irwin", bio: "Jessie Irwin is the former CEO of AdventureWorks and now the director of the Our Planet initiative.", vectorContent: [0.13, 0.92, 0.85]},
  {name: "Rory Nguyen", bio: "Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.", vectorContent: [0.91, 0.76, 0.83]},
]);

Provedení vektorového vyhledávání

K provedení vektorového vyhledávání použijte $search fázi kanálu agregace v dotazu MongoDB. Pokud chcete použít cosmosSearch index, použijte nový cosmosSearch operátor.

{
  {
  "$search": {
    "cosmosSearch": {
        "vector": <vector_to_search>,
        "path": "<path_to_property>",
        "k": <num_results_to_return>,
      },
      "returnStoredSource": True }},
  {
    "$project": { "<custom_name_for_similarity_score>": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
}

Dotazové vektory a vektorové vzdálenosti (vektorová skóre podobnosti) pomocí $search.

Pokračujeme v posledním příkladu a vytvořte další vektor, queryVector. Vektorové vyhledávání měří vzdálenost mezi queryVector a vektory v vectorContent cestě k dokumentům. Počet výsledků, které hledání vrací, můžete nastavit nastavením parametru k, který je zde nastaven na hodnotu 2. Můžete také nastavit nProbes, což je celé číslo, které řídí počet blízkých clusterů, které jsou kontrolovány v každém hledání. Vyšší hodnota může zvýšit přesnost, ale hledání je pomalejší v důsledku toho. Tento parametr je volitelný s výchozí hodnotou 1 a nemůže být větší než numLists hodnota zadaná v indexu vektoru.

const queryVector = [0.52, 0.28, 0.12];
db.exampleCollection.aggregate([
  {
    $search: {
      "cosmosSearch": {
        "vector": queryVector,
        "path": "vectorContent",
        "k": 2
      },
    "returnStoredSource": true }},
  {
    "$project": { "similarityScore": {
           "$meta": "searchScore" },
            "document" : "$$ROOT"
        }
  }
]);

[
  {
    similarityScore: 0.9465376,
    document: {
      _id: ObjectId("645acb54413be5502badff94"),
      name: 'Eugenia Lopez',
      bio: 'Eugenia is the CEO of AdvenureWorks.',
      vectorContent: [ 0.51, 0.12, 0.23 ]
    }
  },
  {
    similarityScore: 0.9006955,
    document: {
      _id: ObjectId("645acb54413be5502badff97"),
      name: 'Rory Nguyen',
      bio: 'Rory Nguyen is the founder of AdventureWorks and the president of the Our Planet initiative.',
      vectorContent: [ 0.91, 0.76, 0.83 ]
    }
  }
]

Získání definic vektorových indexů

K načtení definice vektorového indexu z kolekce použijte listIndexes příkaz:

db.exampleCollection.getIndexes();

V tomto příkladu se vectorIndex vrátí se všemi cosmosSearch parametry použitými k vytvoření indexu:

[
  { v: 2, key: { _id: 1 }, name: '_id_', ns: 'test.exampleCollection' },
  {
    v: 2,
    key: { vectorContent: 'cosmosSearch' },
    name: 'vectorSearchIndex',
    cosmosSearch: {
      kind: <index_type>, // options are `vector-ivf`, `vector-hnsw`, and `vector-diskann`
      numLists: 3,
      similarity: 'COS',
      dimensions: 3
    },
    ns: 'test.exampleCollection'
  }
]

Filtrované vektorové vyhledávání

Teď můžete spouštět vektorové vyhledávání s libovolným podporovaným filtrem dotazů, jako jsou $lt, $lte, $eq, $neq, $gte, $gt, $in, $nin a $regex.

Pokud chcete použít předfiltrování, musíte nejprve definovat standardní index vlastnosti, podle které chcete kromě vektorového indexu filtrovat. Tady je příklad vytvoření indexu filtru:

db.runCommand({
  "createIndexes": "<collection_name>",
  "indexes": [ {
    "key": {
      "<property_to_filter>": 1
    },
    "name": "<name_of_filter_index>"
  }
  ]
});

Jakmile je index filtru zavedený, můžete klauzuli přidat "filter" přímo do vektorového vyhledávacího dotazu. Tento příklad ukazuje, jak filtrovat výsledky, kde "title" hodnota vlastnosti není v zadaném seznamu:

db.exampleCollection.aggregate([
  {
    '$search': {
      "cosmosSearch": {
        "vector": "<query_vector>",
        "path": <path_to_vector>,
        "k": num_results,
        "filter": {<property_to_filter>: {"$nin": ["not in this text", "or this text"]}}
      },
      "returnStoredSource": True }},
  {'$project': { 'similarityScore': { '$meta': 'searchScore' }, 'document' : '$$ROOT' }
}
]);

Important

Pokud chcete optimalizovat výkon a přesnost předfiltrovaných vektorových hledání, zvažte úpravu parametrů indexu vektoru. U indexů DiskANN může zvýšení maxDegree nebo lBuild vést k lepším výsledkům. Pro indexy HNSW můžete experimentovat s vyššími hodnotami pro m, efConstructionnebo efSearch může zvýšit výkon. Podobně u indexů IVF by ladění numLists nebo nProbes mohlo vést k uspokojivějším výsledkům. Je důležité otestovat konkrétní konfiguraci s vašimi daty, aby výsledky splňovaly vaše požadavky. Tyto parametry ovlivňují strukturu indexu a chování vyhledávání a optimální hodnoty se můžou lišit v závislosti na charakteristikách dat a vzorech dotazů.

Použití nástrojů pro orchestraci velkých jazykových modelů (LLM)

Použijte jako vektorovou databázi se sémantickým jádrem

Pomocí Sémantické jádro orchestrujte načítání informací z Azure DocumentDB a LLM. Další informace najdete v úložišti GitHub.

Použijte jako vektorovou databázi s LangChain

Pomocí jazyka LangChain můžete orchestrovat načítání informací z Azure DocumentDB a LLM. Další informace najdete v tématu integrace LangChain pro Azure DocumentDB.

Použití LangChain jako sémantické mezipaměti

Pomocí jazyka LangChain a Azure DocumentDB můžete orchestrovat sémantické ukládání do mezipaměti pomocí dříve zaznamenaných odpovědí LLM, které vám můžou ušetřit náklady na rozhraní LLM API a snížit latenci odpovědí. Další informace najdete v tématu IntegraceLangChain s Azure DocumentDB.

Funkce a omezení

Podporované metriky vzdálenosti: L2 (Euclidean), vnitřní produkt a kosinus.
Podporované metody indexování: IVFFLAT, HNSW a DiskANN.
Pomocí diskANN a kvantování produktů můžete indexovat vektory až do 16 000 dimenzí.
Použití HNSW nebo IVF s poloviční přesností umožňuje indexování vektorů až do 4 000 dimenzí.
Bez komprese je výchozí maximální rozměr vektoru indexování 2 000.
Indexování se vztahuje pouze na jeden vektor na cestu.
Pro cestu vektoru můžete vytvořit pouze jeden index.

Shrnutí

Tento průvodce ukazuje, jak vytvořit vektorový index, přidat dokumenty, které obsahují vektorová data, provést vyhledávání podobnosti a načíst definici indexu. Pomocí naší integrované vektorové databáze můžete efektivně ukládat, indexovat a dotazovat vysoce dimenzionální vektorová data přímo v Azure DocumentDB. Umožňuje vám odemknout plný potenciál vašich dat prostřednictvím vektorových vkládání a umožňuje vytvářet přesnější, efektivnější a výkonnější aplikace.

Další krok

Vytvořit cluster Azure DocumentDB s doživotní bezplatnou úrovní

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-04-27

Integrované úložiště vektorů v Azure DocumentDB

Co je úložiště vektorů?

Jak funguje úložiště vektorů?

Případy použití vektorové databáze

Integrovaná vektorová databáze vs. databáze čistých vektorů

Opensourcové vektorové databáze

Výběr nejlepší opensourcové vektorové databáze

Výzvy opensourcových vektorových databází

Řešení problémů opensourcových vektorových databází

Hledání vektorové podobnosti

Provedení vektorového vyhledávání pomocí DiskANN

Příklad použití indexu DiskANN s filtrováním

Přidání vektorů do databáze

Vytvoření indexu vektoru DiskANN

Provedení vektorového vyhledávání

Získání definic vektorových indexů

Filtrované vektorové vyhledávání

Použití nástrojů pro orchestraci velkých jazykových modelů (LLM)

Použijte jako vektorovou databázi se sémantickým jádrem

Použijte jako vektorovou databázi s LangChain

Použití LangChain jako sémantické mezipaměti

Funkce a omezení

Shrnutí

Související obsah

Další krok

Váš názor

Další materiály