Wektory i osadzanie: często zadawane pytania

Dotyczy: SQL Server 2025 (17.x) Azure SQL Database Azure SQL Managed Instance Baza danych SQL w Microsoft Fabric

Ten artykuł zawiera często zadawane pytania dotyczące wektorów i osadzania w Database Engine SQL.

Uwaga / Notatka

Funkcje wektorowe są dostępne w Azure SQL Managed Instance skonfigurowanych przy użyciu zasad Always-up-to-date.

Jak utrzymywać aktualność osadzonych treści?

Aktualizuj osadzenia za każdym razem, gdy zmieniają się dane bazowe, które one reprezentują. Ta praktyka jest szczególnie ważna w przypadku scenariuszy, w których dane są dynamiczne, takie jak zawartość generowana przez użytkownika lub często aktualizowane bazy danych. Aby uzyskać więcej informacji na temat kilku strategii aktualizowania osadzania, zobacz Baza danych i sztuczna inteligencja: rozwiązania do aktualizowania osadzania.

Jaki jest koszt magazynowania i przetwarzania przy wyszukiwaniu wektorowym?

Obciążenie związane z wyszukiwaniem wektorów obejmuje przede wszystkim przechowywanie typu danych wektorowych i zasobów obliczeniowych wymaganych do indeksowania i wyszukiwania. Typ danych wektorów został zaprojektowany tak, aby był wydajny pod względem magazynu, ale dokładne obciążenie może się różnić w zależności od rozmiaru — liczby wymiarów — przechowywanych wektorów.

Aby uzyskać więcej informacji na temat wybierania odpowiedniego rozmiaru wektora, zobacz Osadzanie modeli i wymiarów: optymalizowanie współczynnika użycia zasobów wydajności.

Strona danych SQL Server może pomieścić maksymalnie 8060 bajtów, więc rozmiar wektora wpływa na liczbę wektorów, które mogą być przechowywane na jednej stronie. Jeśli na przykład masz wektor o 1024 wymiarach, a każdy wymiar jest pojedynczym zmiennoprzecinkowym (4 bajty), łączny rozmiar wektora wynosi 4104 bajty (4096 bajtów ładunku + 8 bajtów nagłówka). Ten rozmiar ogranicza liczbę wektorów, które mieszczą się na jednej stronie, do jednego.

Jakiego modelu osadzania należy używać i kiedy?

Dostępnych jest wiele modeli osadzania. Wybór zależy od konkretnego przypadku użycia i typu przetwarzanych danych. Niektóre modele obsługują wiele języków, a inne obsługują dane wielomodelowe (tekst, obrazy i inne). Niektóre modele są dostępne tylko w trybie online, podczas gdy inne mogą działać lokalnie.

Oprócz samego modelu należy wziąć pod uwagę rozmiar modelu i liczbę generowanych wymiarów. Większe modele mogą zapewnić lepszą dokładność, ale wymagają większej ilości zasobów obliczeniowych i miejsca do magazynowania. W wielu przypadkach posiadanie większej liczby wymiarów nie zmienia znacząco jakości typowych przypadków użycia.

Aby uzyskać więcej informacji na temat wybierania odpowiedniego modelu osadzania, zobacz Osadzanie modeli i wymiarów: optymalizowanie współczynnika użycia zasobów wydajności.

Jak zdecydować, kiedy używać wartości zmiennoprzecinkowych o pojedynczej precyzji (4 bajtów) w porównaniu z połową precyzji (2-bajtową) dla wektorów?

W przypadku przechowywania wektorów osadzania w bazie danych często trzeba równoważyć wydajność magazynowania z wiernością liczbową podczas wybierania między zmiennoprzecinkami o pojedynczej precyzji (float32) i półprecyzyjnej (float16).

Na szczęście osadzanie zwykle nie jest bardzo wrażliwe na niewielkie zmiany w precyzji.

Osadzanie to gęste reprezentacje wektorów używane w zadaniach, takich jak wyszukiwanie semantyczne, systemy rekomendacji i przetwarzanie języka naturalnego. Te wektory często pochodzą z sieci neuronowych, które są z natury odporne na małe odmiany liczbowe. W rezultacie zmniejszenie dokładności od float32 do float16 zwykle ma minimalny wpływ na jakość porównań podobieństw lub zadań podrzędnych, zwłaszcza podczas wnioskowania.

Użycie float16 może znacznie zmniejszyć użycie magazynu i pamięci, co jest szczególnie korzystne podczas pracy z zestawami danych osadzania na dużą skalę.

A co z rozrzedłymi wektorami?

Obecnie vector typ danych w Database Engine SQL jest przeznaczony dla wektorów gęstych. Te wektory to tablice liczb zmiennoprzecinkowych, w których większość elementów nie jest zero. Wektory rozrzedłe, które zawierają znaczną liczbę elementów zerowych, nie są obsługiwane natywnie.

Jakie są testy porównawcze wydajności wyszukiwania wektorów SQL?

Wydajność może się znacznie różnić w zależności od konkretnego przypadku użycia, rozmiaru zestawu danych i złożoności zapytań. Jednak możliwości wyszukiwania wektorów SQL Server są wydajne i skalowalne. Używają technik indeksowania, aby zoptymalizować wydajność wyszukiwania.

Co zrobić, jeśli mam więcej niż jedną kolumnę, której chcę użyć do generowania osadzania?

Jeśli masz wiele kolumn, których chcesz użyć do generowania osadzania, masz dwie główne opcje:

Utwórz jedno osadzanie dla każdej kolumny lub
Połącz wartości wielu kolumn w jeden ciąg, a następnie wygeneruj pojedyncze osadzanie dla tego łączonego ciągu.

Aby uzyskać więcej informacji na temat tych dwóch opcji i powiązanych zagadnień dotyczących projektowania bazy danych, zobacz Efektywne i eleganckie modelowanie osadzania.

Co z ponownym klasyfikowaniem?

Ponowne klasyfikowanie poprawia istotność wyników wyszukiwania przez ponowne ocenianie początkowych wyników na podstawie dodatkowych kryteriów lub modeli. W Database Engine SQL można zaimplementować ponowne klasyfikowanie, łącząc wyszukiwanie wektorów z wyszukiwaniem pełnotekstowym (które zapewnia klasyfikację BM25) lub przy użyciu dodatkowych zapytań SQL lub modeli uczenia maszynowego w celu uściślenia wyników na podstawie określonej logiki biznesowej lub preferencji użytkownika.

Aby uzyskać więcej informacji, zobacz Rozszerzanie możliwości wyszukiwania za pomocą funkcji wyszukiwania hybrydowego i ponowne klasyfikowanie RRF.

Bardziej wyrafinowana technika ponownego klasyfikowania jest nazywana semantyczną ponowną klasyfikacją. Semantyczna ponowna klasyfikacja opiera się na wyspecjalizowanym modelu (często opartym na koderze krzyżowym lub późnym podejściu interakcji), aby porównać każdy fragment kandydata z zapytaniem i przypisać szczegółowy wynik istotności. Oceniając te fragmenty, rerankers zapewniają, że najbardziej precyzyjne, przydatne i odpowiednie wyniki znajdą się na czele.

Aby zapoznać się z przykładem używania modelu ponownego porządkowania, zobacz Semantic Reranking with Azure SQL, SQL Server 2025 and Cohere Rerank models.

Kiedy należy używać wyszukiwania AI (obecnie AI Foundry) w porównaniu z używaniem SQL dla scenariuszy wyszukiwania wektorowego?

Wyszukiwanie sztucznej inteligencji (teraz AI Foundry) to wyspecjalizowana usługa przeznaczona dla zaawansowanych scenariuszy wyszukiwania, w tym wyszukiwania wektorów, przetwarzania języka naturalnego i szczegółowych informacji opartych na sztucznej inteligencji. Udostępnia kompleksowy zestaw funkcji do tworzenia inteligentnych aplikacji wyszukiwania, takich jak wbudowana obsługa różnych modeli sztucznej inteligencji, zaawansowane algorytmy klasyfikacji i integracja z innymi usługami sztucznej inteligencji.

Database Engine SQL zapewnia możliwość przechowywania dowolnego rodzaju danych i uruchamiania dowolnego rodzaju zapytania: ustrukturyzowanego i nieustrukturyzowanego. Możesz przeprowadzić wyszukiwanie wektorów na tych danych. Jest to dobry wybór w scenariuszach, w których trzeba przeszukiwać wszystkie te dane razem i nie chcesz używać oddzielnej usługi do wyszukiwania, które komplikują architekturę. Database Engine SQL oferuje kluczowe funkcje zabezpieczeń dla przedsiębiorstw, aby upewnić się, że dane są zawsze chronione, takie jak zabezpieczenia na poziomie wiersza (RLS), dynamiczne maskowanie danych (DDM), Always Encrypted, niezmienne tabele księgi, i przezroczyste szyfrowanie danych (TDE).

Oto przykład pojedynczego zapytania, które można uruchomić w Azure SQL lub SQL Server, które łączy wektor, geoprzestrzenne, ustrukturyzowane i nieustrukturyzowane dane jednocześnie. Przykładowe zapytanie pobiera 50 najbardziej odpowiednich restauracji na podstawie opisu restauracji, lokalizacji restauracji i preferencji użytkownika. Używa wyszukiwania wektorowego dla opisu i wyszukiwania geoprzestrzennego lokalizacji, filtrowania również według liczb gwiazdek, liczby recenzji, kategorii i innych atrybutów.

DECLARE @p AS GEOGRAPHY = GEOGRAPHY::Point(47.6694141, -122.1238767, 4326);
DECLARE @e AS VECTOR(1536) = AI_GENERATE_EMBEDDINGS('I want to eat a good focaccia' USE MODEL Text3Embedding);

SELECT TOP (50) b.id AS business_id,
                b.name AS business_name,
                r.id AS review_id,
                r.stars,
                r.review,
                VECTOR_DISTANCE('cosine', re.embedding, @e) AS semantic_distance,
                @p.STDistance(geo_location) AS geo_distance
FROM dbo.reviews AS r
     INNER JOIN dbo.reviews_embeddings AS re
         ON r.id = re.review_id
     INNER JOIN dbo.business AS b
         ON r.business_id = b.id
WHERE b.city = 'Redmond'
      AND @p.STDistance(b.geo_location) < 5000 -- 5 km
      AND r.stars >= 4
      AND b.reviews >= 30
      AND JSON_VALUE(b.custom_attributes, '$.local_recommended') = 'true'
      AND VECTOR_DISTANCE('cosine', re.embedding, @e) < 0.2
ORDER BY semantic_distance DESC;

W poprzednim przykładzie Dokładne wyszukiwanie najbliższego sąsiada (ENN) znajduje najbardziej odpowiednie recenzje na podstawie semantycznej odległości osadzonych wektorów, a także filtruje według odległości geoprzestrzennej i innych atrybutów biznesowych. To zapytanie demonstruje możliwości łączenia wyszukiwania wektorów z tradycyjnymi funkcjami SQL w celu utworzenia zaawansowanego i wydajnego środowiska wyszukiwania.

Jeśli chcesz użyć wyszukiwania Przybliżonego Najbliższego Sąsiada (ANN), możesz utworzyć indeks wektorowy na tabeli reviews_embeddings i użyć funkcji VECTOR_SEARCH do wykonania wyszukiwania.

Gdzie można znaleźć laboratorium umożliwiające naukę we własnym tempie, aby dowiedzieć się więcej o wektoryzacji i wyszukiwaniu wektorowym?

Przejrzyj samodzielnie realizowane Azure SQL Cryptozoology AI Embeddings laboratorium.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-14