Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Vektorová úložiště se používají v mnoha doménách a situacích napříč analytickou a generující AI, včetně zpracování přirozeného jazyka, rozpoznávání videa a obrázků, systémů doporučení a vyhledávání.
Co je úložiště vektorů?
Vektorové úložiště (označované také jako vektorová databáze) je databáze, která ukládá a spravuje vkládání vektorů. Vektorové vkládání jsou matematické znázornění dat ve vysokodimenzionálním prostoru.
V tomto prostoru každá dimenze odpovídá funkci dat. Desítky tisíc dimenzí se můžou použít k reprezentaci sofistikovaných dat. Pozice vektoru v tomto prostoru představuje jeho vlastnosti. Slova, fráze, celé dokumenty, obrázky, zvuk a další typy dat mohou být vektorizovány.
Jak funguje úložiště vektorů?
V úložišti vektorů použijete algoritmy vektorového vyhledávání k indexování a dotazování vkládání. Mezi známé algoritmy vektorového vyhledávání patří Disk Approximate Nearest Neighbor (DiskANN),Hierarchical Navigable Small World (HNSW) a Inverted File with Flat Compression (IVFFlat).
Vektorové vyhledávání je metoda, která vám pomůže najít podobné položky na základě jejich charakteristik dat, nikoli přesných shod v poli vlastnosti. Tato technika je užitečná v aplikacích, jako je hledání podobného textu, hledání souvisejících obrázků, vytváření doporučení nebo dokonce zjišťování anomálií.
Vektorové vyhledávání se používá k dotazování se na vektorové reprezentace vašich dat, které jste vytvořili pomocí modelu strojového učení, prostřednictvím rozhraní API pro reprezentace. Příklady rozhraní API pro vkládání jsou Azure OpenAI Embeddings a Hugging Face na Azure.
Vektorové vyhledávání měří vzdálenost mezi datovými vektory a vektorem dotazu. Datové vektory, které jsou nejblíže vektoru dotazu, jsou ty, které jsou nejvíce podobné sémanticky.
Pokud jako vektorové úložiště používáte Azure Database for PostgreSQL, můžete ukládat, indexovat a dotazovat vkládání společně s původními daty. Tento přístup eliminuje dodatečné náklady na replikaci dat v samostatné čistě vektorové databázi.
Tato architektura také udržuje vektorové vkládání a původní data pohromadě. Zachování vkládání a dat společně lépe usnadňuje operace s vícemodálními daty. Umožňuje také větší konzistenci dat, škálování a výkon.