Wektorowa baza danych

Dotyczy: ✅ NoSQL, ✅ PostgreSQL

Wskazówka

Aby zapoznać się z najnowszymi przykładami baz danych wektorów i aplikacji wzorca RAG, odwiedź Azure Cosmos DB Galerię przykładów.

Bazy danych wektorów są używane w wielu domenach i sytuacjach w różnych analitycznych i generujących sztuczną inteligencję, w tym przetwarzaniu języka naturalnego, rozpoznawaniu wideo i obrazów, systemie rekomendacji i wyszukiwaniu, między innymi.

W 2023 r. godny uwagi trend w oprogramowaniu był integracją ulepszeń sztucznej inteligencji, często osiąganych przez włączenie wyspecjalizowanych autonomicznych baz danych wektorów do istniejących stosów technologicznych. W tym artykule wyjaśniono, jakie bazy danych wektorów są i przedstawiono alternatywną architekturę, którą warto rozważyć: użycie zintegrowanej bazy danych wektorów w bazie danych NoSQL lub relacyjnej, której już używasz, zwłaszcza podczas pracy z danymi wielomodalnymi. Takie podejście pozwala nie tylko zmniejszyć koszty, ale także osiągnąć większą spójność danych, skalowalność i wydajność.

Wskazówka

Spójność danych, skalowalność i wydajność mają kluczowe znaczenie dla aplikacji intensywnie korzystających z danych, dlatego usługa OpenAI zdecydowała się utworzyć usługę ChatGPT na bazie usługi Azure Cosmos DB. Możesz też skorzystać z zintegrowanej bazy danych wektorów, a także czasów odpowiedzi w milisekundach, automatycznych i błyskawicznych skalowalności oraz gwarantowanej szybkości w dowolnej skali. Zobacz przykłady implementacji i wypróbuj bezpłatnie.

Co to jest baza danych wektorów?

Baza danych wektorów to baza danych przeznaczona do przechowywania wektorów osadzania i zarządzania nimi, które są matematycznymi reprezentacjami danych w przestrzeni wielowymiarowej. W tej przestrzeni każdy wymiar odpowiada funkcji danych, a dziesiątki tysięcy wymiarów może służyć do reprezentowania zaawansowanych danych. Położenie wektora w tym obszarze reprezentuje jego cechy. Wyrazy, frazy lub całe dokumenty oraz obrazy, dźwięk i inne typy danych mogą być wektoryzowane. Te osadzenia wektorowe są używane w wyszukiwaniu podobieństwa, wyszukiwaniu wielomodalnym, silnikach rekomendacji, dużych modelach językowych (LLM) itp.

W wektorowej bazy danych osadzanie są indeksowane i odpytywane za pomocą algorytmów wyszukiwania wektorowego na podstawie ich odległości wektorowej lub podobieństwa. Niezawodny mechanizm jest niezbędny do identyfikowania najbardziej odpowiednich danych. Niektóre dobrze znane algorytmy wyszukiwania wektorów to Hierarchical Navigable Small World (HNSW), Inverted File (IVF) i DiskANN.

Zintegrowana baza danych wektorów a czysta baza danych wektorów

Istnieją dwa typowe typy implementacji wektorowej bazy danych: czysta wektorowa baza danych i zintegrowana baza danych wektorów w NoSQL lub relacyjna baza danych.

Czysta wektorowa baza danych została zaprojektowana do wydajnego przechowywania osadzeń wektorów i zarządzania nimi wraz z niewielką ilością metadanych; jest oddzielona od źródła danych, z którego pochodzą osadzanie.
Baza danych wektorów, zintegrowana w wysoce wydajnej bazie danych NoSQL lub relacyjnej, zapewnia dodatkowe możliwości. Zintegrowana baza danych wektorów w NoSQL lub relacyjnej bazie danych może przechowywać, indeksować i przeprowadzać zapytania dotyczące osadzeń wraz z odpowiednimi oryginalnymi danymi. Takie podejście eliminuje dodatkowy koszt replikowania danych w oddzielnej czystej bazie danych wektorów. Ponadto utrzymywanie wektorowych osadzeń i oryginalnych danych lepiej ułatwia operacje na danych wielomodalnych i zapewnia większą spójność danych, skalę i wydajność. Wysoce wydajna baza danych z elastycznością schematu i zintegrowaną bazą danych wektorów jest szczególnie optymalna dla agentów sztucznej inteligencji.

Przypadki użycia bazy danych wektorów

Bazy danych wektorowych są używane w wielu domenach i sytuacjach w analitycznej i generatywnej sztucznej inteligencji, w tym w przetwarzaniu języka naturalnego, rozpoznawaniu wideo i obrazów, systemach rekomendacji i wyszukiwaniu. Na przykład można użyć wektorowej bazy danych do:

Identyfikowanie podobnych obrazów, dokumentów i piosenek na podstawie ich zawartości, motywów, tonacji i stylów
Identyfikowanie podobnych produktów na podstawie ich cech, funkcji i grup użytkowników
Polecanie zawartości, produktów lub usług na podstawie preferencji poszczególnych osób
Zalecanie zawartości, produktów lub usług na podstawie podobieństw grup użytkowników
Zidentyfikuj najlepsze możliwe opcje z dużej puli wyborów, aby spełnić złożone wymagania
Identyfikowanie anomalii danych lub fałszywych działań, które różnią się od dominujących lub normalnych wzorców
Implementowanie pamięci trwałej dla agentów sztucznej inteligencji

Wskazówka

Oprócz typowych przypadków użycia baz danych wektorów nasza zintegrowana baza danych wektorów jest również idealnym rozwiązaniem do buforowania llM na poziomie produkcyjnym dzięki małym opóźnieniu, wysokiej skalowalności i wysokiej dostępności.

Bazy danych wektorowych są szczególnie popularne w umożliwianiu generowania wspomaganego przez pobieranie (RAG), wykorzystując modele językowe LLM oraz niestandardowe dane lub informacje specyficzne dla domeny. Takie podejście pozwala na:

Generowanie kontekstowo odpowiednich i dokładnych odpowiedzi na polecenia użytkowników z modeli sztucznej inteligencji
Pokonaj limity tokenów LLMs
Obniżanie kosztów dzięki częstego dostosowywania zaktualizowanych danych

Ten proces obejmuje wyodrębnianie odpowiednich informacji z niestandardowego źródła danych i integrowanie go z żądaniem modelu za pośrednictwem inżynierii monitów. Przed wysłaniem żądania do usługi LLM dane wejściowe/zapytanie/żądanie użytkownika są również przekształcane w osadzanie, a techniki wyszukiwania wektorowego są stosowane w celu zlokalizowania najbardziej podobnych osadzeń w bazie danych. Ta technika umożliwia identyfikację najbardziej odpowiednich rekordów danych w bazie danych. Te pobrane rekordy są następnie dostarczane jako dane wejściowe do żądania LLM przy użyciu monitu inżynieryjnego.

Uwaga / Notatka

Chcesz korzystać z funkcji wyszukiwania wektorów o bardzo wysokiej przepływności? Azure Cosmos DB opracowuje ulepszone funkcje wyszukiwania wektorów przeznaczone dla dużych zestawów danych wektorowych sparowanych z bardzo wysoką przepływnością wstawień i wyszukiwań. Może pomieścić miliony zapytań na sekundę (QPS) z przewidywalnym, niskim opóźnieniem i niezrównaną wydajnością kosztową. Zarejestruj się, aby dowiedzieć się więcej o możliwościach wczesnego dostępu i otrzymywać powiadomienia, gdy te możliwości staną się dostępne.

Utwórz konto w rozszerzonej prywatnej wersji zapoznawczej.

Embeddings

Osadzanie to specjalny format reprezentacji danych, z którego mogą łatwo korzystać modele i algorytmy uczenia maszynowego. Osadzanie to gęsta informacyjnie reprezentacja semantycznego znaczenia tekstu. Każde osadzanie jest wektorem liczb zmiennoprzecinkowych, tak aby odległość między dwoma osadzaniami w przestrzeni wektorowej została skorelowana z podobieństwem semantycznym między dwoma danymi wejściowymi w oryginalnym formacie. Jeśli na przykład dwa teksty są podobne, ich reprezentacje wektorowe również powinny być podobne. Rozszerzenie wektorowej bazy danych, które umożliwia przechowywanie zakodowanych reprezentacji wraz z oryginalnymi danymi, zapewnia spójność danych, skalowalność i wydajność.

Wyszukiwanie wektorowe

Wyszukiwanie wektorowe to metoda, która ułatwia znajdowanie podobnych elementów na podstawie ich cech danych, a nie dokładnych dopasowań w polu właściwości. Ta technika jest przydatna w aplikacjach, takich jak wyszukiwanie podobnego tekstu, znajdowanie powiązanych obrazów, tworzenie zaleceń, a nawet wykrywanie anomalii.

Działa to poprzez uzyskanie reprezentacji wektorowych (listy liczb) danych, które zostały utworzone za pomocą modelu uczenia maszynowego przy użyciu API osadzania, takiego jak Azure OpenAI Embeddings lub Hugging Face na platformie Azure. Następnie mierzy odległość między wektorami danych a wektorem zapytania. Wektory danych, które znajdują się najbliżej wektora zapytania, to te, które są najbardziej podobne semantycznie.

Użycie funkcji wyszukiwania wektorów natywnych zapewnia wydajny sposób przechowywania, indeksowania i wyszukiwania danych wektorów o wysokim wymiarach bezpośrednio wraz z innymi danymi aplikacji. Takie podejście eliminuje konieczność migracji danych do bardziej kosztownych alternatywnych baz danych wektorów i zapewnia bezproblemową integrację aplikacji opartych na sztucznej inteligencji.

Komendy i inżynieria zapytań

Monit odnosi się do określonego tekstu lub informacji, które mogą służyć jako instrukcja do usługi LLM lub jako dane kontekstowe, na których może opierać się funkcja LLM. Monit może przyjmować różne formy, takie jak pytanie, instrukcja, a nawet fragment kodu. Monity mogą służyć jako:

Instrukcje, które dostarczają dyrektywy modelowi LLM
Podstawowa treść, która dostarcza informacje do LLM na potrzeby przetwarzania
Przykłady pomagające przystosować model do określonego zadania lub procesu
Wskazówki dotyczące kierowania wyników modelu LLM we właściwym kierunku
Zawartość wspierająca stanowiąca informacje uzupełniające, których LLM może użyć do generowania wyników.

Proces tworzenia dobrych monitów dotyczących scenariusza jest nazywany inżynierią monitu. Aby uzyskać więcej informacji na temat monitów i najlepszych rozwiązań dotyczących inżynierii monitów, zobacz Projektowanie komunikatów systemowych.

Tokens

Tokeny są małymi fragmentami tekstu generowanymi przez podzielenie tekstu wejściowego na mniejsze segmenty. Te segmenty mogą być wyrazami lub grupami znaków, różniąc się długością od pojedynczego znaku do całego wyrazu. Na przykład słowo hamburger zostanie podzielone na tokeny, takie jak szynka, bur i ger, podczas gdy krótkie i typowe słowo, takie jak gruszka, byłoby uważane za pojedynczy token. Maszyny LLM, takie jak ChatGPT, GPT-3.5 lub GPT-4, dzielą wyrazy na tokeny do przetwarzania. [Wróć]

Generowanie wspomagane wyszukiwaniem

Generacja rozszerzona o pobieranie (RAG) to architektura, która rozszerza możliwości LLM, takich jak ChatGPT, GPT-3.5 lub GPT-4, dodając system pobierania informacji, taki jak wyszukiwanie wektorowe, które udostępnia dane bazowe, takie jak przechowywane w wektorowej bazie danych. Takie podejście umożliwia usłudze LLM generowanie kontekstowo odpowiednich i dokładnych odpowiedzi na podstawie niestandardowych danych pochodzących z wektoryzowanych dokumentów, obrazów, audio, wideo itp.

Prosty wzorzec RAG korzystający z usługi Azure Cosmos DB dla NoSQL może:

Włączanie indeksu wektora NoSQL usługi Azure Cosmos DB
Konfigurowanie bazy danych i kontenera przy użyciu zasad wektora kontenera i indeksu wektora
Wstawianie danych do bazy danych Azure Cosmos DB for NoSQL i jej kontenera
Tworzenie osadzeń z właściwości danych za pomocą Azure OpenAI Embeddings
Połącz usługę Azure Cosmos DB for NoSQL.
Tworzenie indeksu wektorowego dla właściwości osadzania
Tworzenie funkcji do wykonywania wyszukiwania podobieństwa wektorów na podstawie monitu użytkownika
Udzielanie odpowiedzi na pytania dotyczące danych przy użyciu modelu Azure OpenAI Completions.

Wzorzec RAG, z inżynierią poleceń, służy do zwiększania jakości odpowiedzi, oferując bardziej kontekstowe informacje dla modelu. Funkcja RAG umożliwia modelowi zastosowanie szerszej bazy wiedzy poprzez włączenie odpowiednich źródeł zewnętrznych do procesu generowania, co skutkuje bardziej kompleksowymi i przemyślanymi odpowiedziami. Aby uzyskać więcej informacji, sprawdź Grounding LLMs.

Jak zaimplementować zintegrowane funkcje bazy danych wektorów

Zintegrowane funkcje bazy danych wektorów można zaimplementować dla usługi Azure Cosmos DB i jej różnych interfejsów API zgodności.

interfejs API NoSQL

Azure Cosmos DB dla NoSQL to pierwsza na świecie bezserwerowa NoSQL wektorowa baza danych. Przechowuj wektory i dane razem w Azure Cosmos DB dla NoSQL ze zintegrowanymi możliwościami bazy danych wektorów gdzie można utworzyć indeks wektorowy na podstawie DiskANN zestawu algorytmów indeksowania wektorów o wysokiej wydajności opracowanych przez Microsoft Research.

Funkcja DiskANN umożliwia wykonywanie zapytań z bardzo wysoką dokładnością i niskimi opóźnieniami w dowolnej skali, przy jednoczesnym wykorzystaniu wszystkich korzyści Azure Cosmos DB w technologii NoSQL, takich jak umowa SLA na poziomie 99,999% (z włączoną wysoką dostępnością), replikacja geograficzna oraz płynne przejście od modelu bezserwerowego do modelu z zarezerwowaną przepływnością (RU) wszystko to w jednej bazie danych.

Linki i przykłady

Przykłady kodu

Użyj warstwę bezpłatną Azure Cosmos DB dla bazy danych MongoDB

Interfejs API dla bazy danych PostgreSQL

Użyj natywnie zintegrowanej bazy danych wektorów w Azure Cosmos DB dla bazy danych PostgreSQL, która oferuje wydajny sposób przechowywania, indeksowania i wyszukiwania danych wektorów wysokowymiarowych bezpośrednio obok innych danych aplikacji. Takie podejście eliminuje konieczność migracji danych do bardziej kosztownych alternatywnych baz danych wektorów i zapewnia bezproblemową integrację aplikacji opartych na sztucznej inteligencji.

Przykład kodu

Python: samouczek dotyczący notesu języka Python — czatbot do przeglądu żywności

Następne kroki

Skorzystaj z bezpłatnej warstwy na całe życie usługi Azure Cosmos DB

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-27

Wektorowa baza danych

Co to jest baza danych wektorów?

Zintegrowana baza danych wektorów a czysta baza danych wektorów

Przypadki użycia bazy danych wektorów

Pojęcia związane z bazą danych wektorów

Embeddings

Wyszukiwanie wektorowe

Komendy i inżynieria zapytań

Tokens

Generowanie wspomagane wyszukiwaniem

Jak zaimplementować zintegrowane funkcje bazy danych wektorów

interfejs API NoSQL

Linki i przykłady

Przykłady kodu

Interfejs API dla bazy danych PostgreSQL

Przykład kodu

Następne kroki

Opinia

Dodatkowe zasoby