Jak włączyć i używać `pgvector` w usłudze Azure Cosmos DB for PostgreSQL

Dotyczy: ✅ PostgreSQL

Ważne

Usługa Azure Cosmos DB for PostgreSQL znajduje się na ścieżce wycofania i nie jest już zalecana w przypadku nowych projektów. Zamiast tego użyj jednej z tych dwóch usług:

W przypadku obciążeń PostgreSQL: użyj funkcji klastrowania elastycznego (Elastic Clusters) usługi Azure Database for PostgreSQL, w celu wykorzystania funkcji skalowania w poziomie i rozproszonych baz danych PostgreSQL zawartych w open-source'owym rozszerzeniu Citus. Aby uzyskać wskazówki dotyczące migracji, zobacz migrowanie do usługi Azure Database for PostgreSQL z klastrem elastycznym.
W przypadku obciążeń NoSQL użyj usługi Azure Cosmos DB for NoSQL dla rozproszonego rozwiązania bazy danych, które obejmuje umowę serwisową o dostępności na poziomie 99,999% (SLA), natychmiastowe automatyczne skalowanie i automatyczne przełączanie awaryjne w wielu regionach.

Rozszerzenie pgvector dodaje wyszukiwanie wektorów typu open source do bazy danych PostgreSQL.

W tym artykule przedstawiono dodatkowe możliwości włączone przez pgvectorusługę . Obejmuje ona pojęcia podobieństwa wektorów i osadzania oraz zawiera wskazówki dotyczące włączania pgvector rozszerzenia. Dowiemy się, jak tworzyć, przechowywać i wykonywać zapytania dotyczące wektorów. Możesz również odwołać się do oficjalnego pliku README projektu.

Włączanie rozszerzenia

Aby można było ich używać, rozszerzenia PostgreSQL muszą być włączone w bazie danych. Aby włączyć rozszerzenie, uruchom polecenie z narzędzia psql, aby załadować spakowane obiekty do bazy danych.

SELECT CREATE_EXTENSION('vector');

Uwaga

Aby wyłączyć rozszerzenie, użyj drop_extension()

Pojęcia

Podobieństwo wektorów

Podobieństwo wektorów to metoda służąca do mierzenia, jak podobne dwa elementy są reprezentowane jako wektory, które są seriami liczb. Wektory są często używane do reprezentowania punktów danych, gdzie każdy element wektora reprezentuje funkcję lub atrybut punktu danych.

Podobieństwo wektorów często oblicza się, stosując metryki odległości, takie jak Euclidean distance lub podobieństwo cosine. Odległość euklidesowa mierzy odległość linii prostej między dwoma wektorami w przestrzeni nwymiarowej, podczas gdy podobieństwo cosinusu mierzy cosinus kąta między dwoma wektorami. Wartości metryk podobieństwa zwykle wahają się między 0 i 1, a higher wartości wskazują większą podobieństwo między wektorami.

Podobieństwo wektorów jest szeroko stosowane w różnych aplikacjach, takich jak systemy rekomendacji, klasyfikacja tekstu, rozpoznawanie obrazów i klastrowanie. Na przykład w systemach rekomendacji podobieństwo wektorów może służyć do identyfikowania podobnych elementów na podstawie preferencji użytkownika. W klasyfikacji tekstu podobieństwo wektorów może służyć do określania podobieństwa między dwoma dokumentami lub zdaniami na podstawie ich reprezentacji wektorowych.

Osadzanie

Osadzanie to technika oceny "związku" tekstu, obrazów, filmów wideo lub innych typów informacji. Ocena pozwala modelom uczenia maszynowego efektywnie identyfikować relacje i podobieństwa między danymi, umożliwiając algorytmom identyfikowanie wzorców i dokładne przewidywanie. Na przykład w zadaniu analizy tonacji wyrazy z podobnymi osadzaniami mogą mieć podobne wyniki tonacji.

Wprowadzenie

Utwórz tabelę tblvector z kolumną embedding typu vector(3) reprezentującą wektor trójwymiarowy.

CREATE TABLE tblvector(
    id bigserial PRIMARY KEY,
    embedding vector(3)
    );

Po wygenerowaniu osadzania przy użyciu usługi, takiej jak interfejs API OpenAI, możesz przechowywać wynikowy wektor w bazie danych. Zdefiniowanie wektora jako vector(3) oznacza na trójwymiarowej płaszczyźnie [x,y,z] coordinates. Polecenie wstawia pięć nowych wierszy do tblvector tabeli z podanymi osadzaniami.

INSERT INTO tblvector (id, embedding) VALUES (1, '[1,2,3]'), (2, '[4,5,6]'), (3, '[5,4,6]'), (4, '[3,5,7]'), (5, '[7,8,9]');

Za pomocą instrukcji INSERT INTO ... ON CONFLICT można określić alternatywną akcję, taką jak aktualizowanie rekordów spełniających kryteria. Umożliwia ona obsługę potencjalnych konfliktów w bardziej wydajny i skuteczny sposób.

INSERT INTO tblvector (id, embedding) VALUES (1, '[1,2,3]'), (2, '[4,5,6]')
ON CONFLICT (id) DO UPDATE SET embedding = EXCLUDED.embedding;

Polecenie DELETE usuwa wiersze z określonej tabeli na podstawie warunków określonych w klauzuli WHERE. Gdy klauzula WHERE nie jest obecna, wszystkie wiersze w tabeli zostaną usunięte.

DELETE FROM tblvector WHERE id = 1;

Aby pobrać wektory i obliczyć podobieństwo, użyj SELECT instrukcji i wbudowanych operatorów wektorów. Na przykład zapytanie oblicza odległość euklidesy (odległość L2) między danym wektorem a wektorami przechowywanymi w tblvector tabeli, sortuje wyniki według odległości obliczeniowej i zwraca najbliższe pięć najbardziej podobnych elementów.

SELECT * FROM tblvector 
ORDER BY embedding <-> '[3,1,2]' 
LIMIT 5;

Zapytanie używa operatora "<->", który jest "operatorem odległości" używanym do obliczania odległości między dwoma wektorami w przestrzeni wielowymiarowej. Zapytanie zwraca wszystkie wiersze o odległości mniejszej niż 6 od wektora [3,1,2].

SELECT * FROM tblvector WHERE embedding <-> '[3,1,2]' < 6;

Polecenie pobiera średnią wartość kolumny "embedding" z tabeli "tblvector". Na przykład, jeśli kolumna "wektory" zawiera wektory słów dla modelu językowego, średnia wartość tych wektorów może zostać użyta do reprezentowania całego zdania lub dokumentu.

SELECT AVG(embedding) FROM tblvector;

Operatory wektorowe

pgvector wprowadza sześć nowych operatorów, które mogą być używane w wektorach:

Operator	opis
+	dodawanie element po elemencie
-	odejmowanie elementów
*	mnożenie element po elemencie
<->	Odległość euklidesowa
<#>	ujemny produkt wewnętrzny
<=>	odległość kosinusowa

Funkcje wektorowe

`cosine_distance`

Oblicza odległość cosinusu między dwoma wektorami.

cosine_distance(vector, vector)

Argumenty

`vector`

Najpierw vector.

`vector`

Drugi vector.

Typ zwracany

double precision jako odległość między dwoma podanymi wektorami.

`inner_product`

Oblicza wewnętrzny iloczyn dwóch wektorów.

inner_product(vector, vector)

Argumenty

`vector`

Najpierw vector.

`vector`

Sekunda vector

Typ zwracany

double precision jako wewnętrzny iloczyn dwóch wektorów.

`l2_distance`

Oblicza odległość euklidy (znaną również jako L2) między dwoma wektorami.

l2_distance(vector, vector)

Argumenty

`vector`

Najpierw vector.

`vector`

Sekunda vector

Typ zwracany

double precision jako odległość euklidesowa między dwoma wektorami.

`l1_distance`

Oblicza odległość taxicab (znaną również jako L1) między dwoma wektorami.

l1_distance(vector, vector)

Argumenty

`vector`

Najpierw vector.

`vector`

Sekunda vector

Typ zwracany

double precision jako odległość taksówkowa między dwoma wektorami.

`vector_dims(vector)`

Zwraca wymiary danego wektora.

Argumenty

`vector`

Element vector.

Typ zwracany

integer reprezentujący liczbę wymiarów danego wektora.

`vector_norms(vector)`

Oblicza normę euklidesową danego wektora.

Argumenty

`vector`

Element vector.

Typ zwracany

double precision reprezentującą normę euklidesa danego wektora.

Agregacje wektorów

`AVG`

Oblicza średnią przetworzonych wektorów.

Argumenty

`vector`

Element vector.

Typ zwracany

vector reprezentujące średnią przetworzonych wektorów.

`SUM`

Argumenty

`vector`

Element vector.

Typ zwracany

vector reprezentujący sumę przetworzonych wektorów.

Następne kroki

Dowiedz się więcej na temat wydajności, indeksowania i ograniczeń przy użyciu polecenia pgvector.

Optymalizowanie wydajności przy użyciu wektora pgvector

Opinia

Czy ta strona była pomocna?

Last updated on 2026-02-06

Jak włączyć i używać pgvector w usłudze Azure Cosmos DB for PostgreSQL

Włączanie rozszerzenia

Pojęcia

Podobieństwo wektorów

Osadzanie

Wprowadzenie

Operatory wektorowe

Funkcje wektorowe

cosine_distance

Argumenty

vector

vector

Typ zwracany

inner_product

Argumenty

vector

vector

Typ zwracany

l2_distance

Argumenty

vector

vector

Typ zwracany

l1_distance

Argumenty

vector

vector

Typ zwracany

vector_dims(vector)

Argumenty

vector

Typ zwracany

vector_norms(vector)

Argumenty

vector

Typ zwracany

Agregacje wektorów

AVG

Argumenty

vector

Typ zwracany

SUM

Argumenty

vector

Typ zwracany

Następne kroki

Opinia

Dodatkowe zasoby

Jak włączyć i używać `pgvector` w usłudze Azure Cosmos DB for PostgreSQL

`cosine_distance`

`vector`

`vector`

`inner_product`

`vector`

`vector`

`l2_distance`

`vector`

`vector`

`l1_distance`

`vector`

`vector`

`vector_dims(vector)`

`vector`

`vector_norms(vector)`

`vector`

`AVG`

`vector`

`SUM`

`vector`