Úložiště vektorů ve službě Azure Database for PostgreSQL

Vektorová úložiště se používají v mnoha doménách a situacích napříč analytickou a generující AI, včetně zpracování přirozeného jazyka, rozpoznávání videa a obrázků, systémů doporučení a vyhledávání.

Co je úložiště vektorů?

Vektorové úložiště (označované také jako vektorová databáze) je databáze, která ukládá a spravuje vkládání vektorů. Vektorové vkládání jsou matematické znázornění dat ve vysokodimenzionálním prostoru.

V tomto prostoru každá dimenze odpovídá funkci dat. Desítky tisíc dimenzí se můžou použít k reprezentaci sofistikovaných dat. Pozice vektoru v tomto prostoru představuje jeho vlastnosti. Slova, fráze, celé dokumenty, obrázky, zvuk a další typy dat mohou být vektorizovány.

Jak funguje úložiště vektorů?

V úložišti vektorů použijete algoritmy vektorového vyhledávání k indexování a dotazování vkládání. Mezi známé algoritmy vektorového vyhledávání patří Disk Approximate Nearest Neighbor (DiskANN),Hierarchical Navigable Small World (HNSW) a Inverted File with Flat Compression (IVFFlat).

Vektorové vyhledávání je metoda, která vám pomůže najít podobné položky na základě jejich charakteristik dat, nikoli přesných shod v poli vlastnosti. Tato technika je užitečná v aplikacích, jako je hledání podobného textu, hledání souvisejících obrázků, vytváření doporučení nebo dokonce zjišťování anomálií.

Vektorové vyhledávání se používá k dotazování se na vektorové reprezentace vašich dat, které jste vytvořili pomocí modelu strojového učení, prostřednictvím rozhraní API pro reprezentace. Příklady rozhraní API pro vkládání jsou Azure OpenAI Embeddings a Hugging Face na Azure.

Vektorové vyhledávání měří vzdálenost mezi datovými vektory a vektorem dotazu. Datové vektory, které jsou nejblíže vektoru dotazu, jsou ty, které jsou nejvíce podobné sémanticky.

Pokud jako vektorové úložiště používáte Azure Database for PostgreSQL, můžete ukládat, indexovat a dotazovat vkládání společně s původními daty. Tento přístup eliminuje dodatečné náklady na replikaci dat v samostatné čistě vektorové databázi.

Tato architektura také udržuje vektorové vkládání a původní data pohromadě. Zachování vkládání a dat společně lépe usnadňuje operace s vícemodálními daty. Umožňuje také větší konzistenci dat, škálování a výkon.

Váš názor

Byla tato stránka užitečná?

Last updated on 2025-06-27

Sdílet prostřednictvím

Úložiště vektorů ve službě Azure Database for PostgreSQL

Co je úložiště vektorů?

Jak funguje úložiště vektorů?

Související obsah

Váš názor

Další materiály