Uwaga dotycząca przejrzystości: Azure AI Search

2025-06-24

Ważne

Tłumaczenia nieanglojęzyczne są dostępne tylko dla wygody. Aby zapoznać się z wiążącą wersją, sprawdź EN-US wersję tego dokumentu.

Co to jest notatka dotycząca przezroczystości?

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które będą jej używać, osoby, których to dotyczy, oraz środowisko, w którym jest wdrażana. Utworzenie systemu dopasowanego do zamierzonego celu wymaga zrozumienia, jak działa technologia, jakie są jego możliwości i ograniczenia oraz jak osiągnąć najlepszą wydajność. Notatki dotyczące przejrzystości firmy Microsoft mają na celu ułatwienie zrozumienia sposobu działania naszej technologii sztucznej inteligencji, wyborów, jakie właściciele systemów mogą dokonać, aby wpływać na wydajność i zachowanie systemu oraz znaczenie myślenia o całym systemie, w tym o technologii, ludziach i środowisku. Możesz użyć notatek przezroczystości podczas tworzenia lub wdrażania własnego systemu lub udostępniania ich osobom, które będą korzystać z systemu lub mają na nie wpływ.

Informacje o przejrzystości firmy Microsoft są częścią szerszego wysiłku firmy Microsoft na rzecz wprowadzenia zasad sztucznej inteligencji w życie. Aby dowiedzieć się więcej, zobacz zasady dotyczące sztucznej inteligencji firmy Microsoft.

Podstawy usługi Azure AI Search

Wprowadzenie

Usługa Azure AI Search udostępnia deweloperom narzędzia, interfejsy API i zestawy SDK do tworzenia rozbudowanego środowiska wyszukiwania za pośrednictwem prywatnej, heterogenicznej zawartości w aplikacjach internetowych, mobilnych i dla przedsiębiorstw. Wyszukiwanie jest podstawowe dla każdej aplikacji, która wyświetla dane użytkownikom. Typowe scenariusze obejmują wyszukiwanie katalogów lub dokumentów, sklepy detaliczne online lub eksplorację danych w przypadku zastrzeżonej zawartości.

Dane z możliwością wyszukiwania mogą być w postaci tekstu lub wektorów i pozyskiwane as-is ze źródła danych lub wzbogacone za pomocą sztucznej inteligencji w celu ulepszenia ogólnego środowiska wyszukiwania. Deweloperzy mogą konwertować dane int na reprezentacje liczbowe (nazywane wektorami), wybierając opcję wywoływania zewnętrznych modeli uczenia maszynowego (nazywanych modelami osadzania). Indeksatory mogą opcjonalnie zawierać zestawy umiejętności, które obsługują zaawansowany zestaw wzbogacania danych za pośrednictwem kilku możliwości Azure AI Language, takich jak rozpoznawanie jednostek nazwanych (NER) i wykrywanie danych osobowych (PII), oraz możliwości Azure AI Vision, w tym optyczne rozpoznawanie znaków (OCR) i analiza obrazów.

Zobacz poniższe karty, aby uzyskać więcej informacji na temat sposobu, w jaki usługa Azure AI Search poprawia środowisko wyszukiwania przy użyciu usług Azure AI lub innych systemów sztucznej inteligencji, aby lepiej zrozumieć intencję, semantyka i dorozumianą strukturę zawartości klienta.

Wzbogacanie sztucznej inteligencji to zastosowanie modeli uczenia maszynowego z usług Azure AI za pośrednictwem zawartości, która nie jest łatwo wyszukiwana w postaci pierwotnej. Dzięki wzbogaceniu analiza i wnioskowanie są używane do tworzenia zawartości i struktury z możliwością wyszukiwania, w której żadna wcześniej nie istniała.

Wzbogacanie sztucznej inteligencji to opcjonalne rozszerzenie potoku indeksowania usługi Azure AI Search, które łączy się z usługami Azure AI w tym samym regionie, w którym znajduje się usługa wyszukiwania klienta. Potok wzbogacania ma te same podstawowe składniki co typowy indeksator (indeksator, źródło danych, indeks), a także zestaw umiejętności określający kroki atomowego wzbogacania. Zestaw umiejętności można zebrać przy użyciu wbudowanych umiejętności opartych na interfejsach API usług Azure AI, takich jak Azure AI Vision i Azure AI Language, lub umiejętności niestandardowe, które uruchamiają kod zewnętrzny, który dostarczysz.

Wyszukiwanie wektorowe to metoda pobierania informacji, w której dokumenty i zapytania są reprezentowane w indeksie jako wektory zamiast zwykłego tekstu. W wyszukiwaniu wektorowym modele uczenia maszynowego hostowane zewnętrznie z usługi Azure AI Search generują wektorowe reprezentacje danych wejściowych źródła, które mogą być tekstem, obrazami, audio lub zawartością wideo. Ta matematyczna i znormalizowana reprezentacja zawartości, nazywana osadzaniem wektorów, stanowi wspólną podstawę dla scenariuszy wyszukiwania.

Gdy wszystko jest wektorem, zapytanie może znaleźć dopasowanie w przestrzeni wektorowej, nawet jeśli skojarzona oryginalna zawartość znajduje się w innym typie nośnika, takim jak obrazy i tekst, lub język niż zapytanie. Aparat wyszukiwania skanuje indeks w poszukiwaniu zawartości wektorowej, która jest najbardziej podobna, czyli najbliżej wektora w zapytaniu. Dopasowywanie oparte na matematycznej reprezentacji wektorowej zamiast słów kluczowych zwiększa prawdopodobieństwo znalezienia dopasowań, które dzielą znaczenie semantyczne, ale różnią się tekstowo, na przykład "samochód" i "auto". Zapewnia to bardziej szczegółowe wprowadzenie do osadzania wektorów i sposobu działania algorytmu podobieństwa.

Kluczowe terminy

Termin	Definicja
Osadzanie wektorów	Wysoce zoptymalizowany sposób reprezentowania danych, które odzwierciedlają znaczenie i zrozumienie wyodrębnione przez model uczenia maszynowego z obrazów, audio, wideo lub tekstu. Zawartość jest konwertowana na wektorowe osadzanie zarówno w czasie indeksowania, jak i zapytania. Wyszukiwanie wektorowe to pobieranie osadzonych elementów podanych w zapytaniu i wyszukiwanie najbardziej podobnych osadzania w indeksie. Wyniki są następnie zwykle sortowane według stopnia podobieństwa.
Przestrzeń osadzania	Wszystkie wektory w korpusie pojedynczego pola zajmują to samo miejsce osadzania, w którym podobne elementy znajdują się blisko siebie, a różne elementy są bardziej oddalone. Wyższa wymiarowość miejsca osadzania może zawierać więcej informacji w jednym wektorze i znacznie poprawić środowisko wyszukiwania, ale przy znaczącym koszcie rozmiaru magazynu indeksu i większym opóźnieniu zapytań.

Termin

Definicja

Osadzanie wektorów

Wysoce zoptymalizowany sposób reprezentowania danych, które odzwierciedlają znaczenie i zrozumienie wyodrębnione przez model uczenia maszynowego z obrazów, audio, wideo lub tekstu. Zawartość jest konwertowana na wektorowe osadzanie zarówno w czasie indeksowania, jak i zapytania. Wyszukiwanie wektorowe to pobieranie osadzonych elementów podanych w zapytaniu i wyszukiwanie najbardziej podobnych osadzania w indeksie. Wyniki są następnie zwykle sortowane według stopnia podobieństwa.

Przestrzeń osadzania

Wszystkie wektory w korpusie pojedynczego pola zajmują to samo miejsce osadzania, w którym podobne elementy znajdują się blisko siebie, a różne elementy są bardziej oddalone. Wyższa wymiarowość miejsca osadzania może zawierać więcej informacji w jednym wektorze i znacznie poprawić środowisko wyszukiwania, ale przy znaczącym koszcie rozmiaru magazynu indeksu i większym opóźnieniu zapytań.

Semantyczny ranker wykorzystuje kontekst lub semantyczne znaczenie zapytania do obliczenia nowego wyniku istotności, który promuje wyniki semantycznie najbliższe intencji oryginalnego zapytania na górę. Początkowy zestaw wyników może pochodzić z wyszukiwania słów kluczowych z klasyfikacją BM25 , wyszukiwaniem wektorów lub wyszukiwaniem hybrydowym obejmującym oba te elementy. Tworzy także i zwraca "napisy", wyodrębniając dosłowną zawartość znalezioną w wyniku, oraz "podświetlenia", aby zwrócić uwagę na ważną zawartość w wyniku. Może również zwrócić "odpowiedź", jeśli zapytanie ma cechy pytania ("jaki jest mroźny punkt wody"), a wynik zawiera tekst o cechach odpowiedzi ("woda zamarza w temperaturze 0°C lub 32°F").

Kluczowe terminy

Termin	Definicja
Ranga semantyczna	Używa kontekstu i semantycznego znaczenia zapytania, aby poprawić istotność wyszukiwania przy użyciu interpretacji języka w celu ponownego pozycjonowania wyników wyszukiwania.
Semantyczne podpisy i wyróżnienia	Wyodrębnia zdania i frazy z dokumentu, które najlepiej podsumowują zawartość, z wyróżnionymi fragmentami kluczowymi w celu łatwego skanowania. Podpisy, które podsumowują wynik, są przydatne, gdy poszczególne pola zawartości są zbyt gęste dla strony wyników. Wyróżniony tekst podnosi poziom najbardziej odpowiednich terminów i fraz, dzięki czemu użytkownicy mogą szybko określić, dlaczego dopasowanie zostało uznane za istotne.
Odpowiedzi semantyczne	Udostępnia opcjonalną i dodatkową strukturę zwracaną z zapytania semantycznego. Zapewnia bezpośrednią odpowiedź na zapytanie, które wygląda jak pytanie. Wymaga to, aby dokument miał tekst z cechami odpowiedzi.

Umiejętność GenAI Prompt jest częścią wykazu umiejętności usługi Azure AI Search, umożliwiając klientom ulepszanie indeksów wyszukiwania przy użyciu zawartości wygenerowanej przez sztuczną inteligencję na podstawie ich danych. Korzystając z własnych danych i preferencji organizacji klienta, ta umiejętność ułatwia tworzenie dostosowanych podsumowań, odpowiedzi lub szczegółowych informacji, które są zgodne z ich potrzebami.

Oznacza to, że gdy użytkownik końcowy przeszukuje zawartość klientów za pośrednictwem wyszukiwania sztucznej inteligencji, wygenerowana przez sztuczną inteligencję zawartość może zapewnić bardziej informacyjne i kontekstowe wyniki, co ułatwia użytkownikom znajdowanie szukanych informacji.

Kluczowe terminy

Termin	Definicja
Umiejętności	Umiejętność usługi Azure AI Search to modułowy składnik przetwarzania w potoku wzbogacania usługi Azure AI Search. Te umiejętności stosują przekształcenia oparte na sztucznej inteligencji do nieprzetworzonej zawartości, takiej jak tekst, obrazy lub dokumenty, podczas indeksowania, umożliwiając wyodrębnianie ustrukturyzowanych, przeszukiwalnych informacji z danych bez struktury.
Podpowiedź	Tekst wysyłany do usługi w wywołaniu interfejsu API. Ten tekst jest następnie wprowadzany do modelu. Na przykład można wprowadzić następujące polecenie: Przekonwertuj pytania na polecenie: .: Zapytaj Constance, czy potrzebujemy chleba A: send-msg `find constance` Czy potrzebujemy chleba? .: Wyślij wiadomość do Grega, aby dowiedzieć się, czy wszystko jest gotowe do środy. Wyślij wiadomość `find greg` czy wszystko gotowe na środę?
Indeksy wyszukiwania	W usłudze Azure AI Search indeks jest strukturą danych, która przechowuje zawartość z możliwością wyszukiwania, definiuje sposób ich przechowywania i kontroluje, jak usługa zinterpretuje ją podczas uruchamiania zapytania.

Pobieranie agentowe to równoległa architektura przetwarzania zapytań, która używa konwersacyjnego dużego modelu językowego (LLM) jako planującego zapytania. LLM zmienia historię konwersacji użytkownika w jedno lub kilka skoncentrowanych podzapytań zgodnie z potrzebami. Te podzapytania są uruchamiane jednocześnie w indeksie usługi Azure AI Search, a usługa scala najlepsze wyniki, zwracając następujące elementy:

Pojedynczy ciąg zawartości zawierający najbardziej odpowiednie fragmenty (dane uziemieniowe).
Tablica odwołań (opcjonalnie), która uwidacznia pełne dokumenty źródłowe lub fragmenty.
Tablica działań, która zawiera listę każdej operacji, liczby tokenów i latencji, aby ułatwić śledzenie kosztów i debugowanie.

Kluczowe terminy

Termin	Definicja

Agentyczne wyszukiwanie	Odwołuje się to do agenta sztucznej inteligencji planującego i wykonującego sekwencję kroków w celu pobrania informacji z bazowych źródeł. Obejmuje to działania, takie jak wykonywanie zapytań i udoskonalanie wyszukiwań w celu uzyskania najbardziej odpowiednich informacji dotyczących zapytania.
Dane uziemienia	Zestaw dokumentów/informacji zwracanych przez Agentic Retrieval. Służy jako podstawa rzeczowa, którą zewnętrzny LLM może przytaczać lub przekształcić informacje w odpowiedź w języku naturalnym, zapewniając możliwość śledzenia i zmniejszając ryzyko halucynacji.
Planista zapytań	Podział historii konwersacji na podzapytania w celu znalezienia najbardziej odpowiednich danych uziemienia dla bazowego zapytania wyszukiwania.
Podzapytanie	Pojedyncze zapytanie wygenerowane przez usługę LLM. Podzapytania są oparte na pytaniach użytkownika, historii czatu i parametrach w żądaniu. Podzapytania są przeznaczone dla indeksowanych dokumentów (zwykły tekst i wektory) w usłudze Azure AI Search.

Możliwości

Zachowanie systemu

Kilka wbudowanych umiejętności w zakresie wzbogacania sztucznej inteligencji w usłudze Azure AI Search korzysta z usług Azure AI. Zobacz uwagi dotyczące przejrzystości dla każdej wbudowanej umiejętności wymienionej poniżej, aby wiedzieć, na co zwrócić uwagę przy wyborze umiejętności.

Umiejętność wyodrębniania kluczowych fraz: Język sztucznej inteligencji platformy Azure — wyodrębnianie kluczowych fraz
Umiejętność wykrywania języka: język sztucznej inteligencji platformy Azure — wykrywanie języka
Umiejętność łączenia jednostek: język sztucznej inteligencji platformy Azure — łączenie jednostek
Umiejętność rozpoznawania jednostek: język sztucznej inteligencji platformy Azure — rozpoznawanie jednostek nazwanych (NER)
Umiejętność wykrywania PII: Azure AI Language - wykrywanie PII
Umiejętność tonacji: Język sztucznej inteligencji platformy Azure — analiza tonacji
Umiejętność analizy obrazów: Azure AI Vision — analiza obrazów
Umiejętności OCR: Azure AI Vision — OCR

Zapoznaj się z dokumentacją każdej umiejętności, aby dowiedzieć się więcej o odpowiednich możliwościach, ograniczeniach, wydajności, ocenach i metodach integracji i odpowiedzialnego użycia. Należy pamiętać, że używanie tych umiejętności w połączeniu może prowadzić do nałożenia się efektów (na przykład błędy wprowadzone podczas korzystania z OCR będą przenikać podczas korzystania z wyodrębniania kluczowych fraz).

Przypadki użycia

Przykładowe przypadki użycia

Ponieważ usługa Azure AI Search to rozwiązanie do wyszukiwania pełnotekstowego, celem wzbogacania sztucznej inteligencji jest ulepszenie narzędzia wyszukiwania zawartości bez struktury. Oto kilka przykładów scenariuszy wzbogacania zawartości obsługiwanych przez wbudowane umiejętności:

Funkcja translacji i wykrywania języka umożliwia wyszukiwanie wielojęzyczne.
Rozpoznawanie jednostek wyodrębnia osoby , miejsca i inne jednostki z dużych fragmentów tekstu.
Wyodrębnianie kluczowych fraz identyfikuje, a następnie generuje ważne terminy.
Funkcja OCR rozpoznaje tekst drukowany i odręczny w plikach binarnych.
Analiza obrazów opisuje zawartość obrazu i wyprowadza opisy jako pola tekstowe z możliwością wyszukiwania.
Zintegrowana wektoryzacja to funkcja w wersji zapoznawczej, która wywołuje model wektorów usługi Azure OpenAI w celu wektoryzacji danych i przechowywania wektorów w usłudze Azure AI Search na potrzeby wyszukiwania podobieństwa.

Ograniczenia

Wzbogacanie AI w usłudze Azure AI Search korzysta z funkcji indeksatora i źródła danych, aby wywołać usługi Azure AI i przeprowadzić wzbogacanie zawartości. Zostaną zastosowane ograniczenia indeksatorów i źródeł danych używanych w tym procesie. Zapoznaj się z dokumentacją indeksatora i źródła danych , aby uzyskać więcej informacji na temat tych powiązanych ograniczeń. Ograniczenia każdej usługi Azure AI używanej przez potok wzbogacania AI w Azure AI Search również obowiązują. Aby uzyskać więcej informacji na temat tych ograniczeń, zobacz uwagi dotyczące przezroczystości dla każdej usługi .

Udostępnij za pośrednictwem

Uwaga dotycząca przejrzystości: Azure AI Search

Co to jest notatka dotycząca przezroczystości?

Podstawy usługi Azure AI Search

Wprowadzenie

Możliwości

Zachowanie systemu

Przypadki użycia

Przykładowe przypadki użycia

Ograniczenia

Dowiedz się więcej na temat odpowiedzialnej sztucznej inteligencji

Dowiedz się więcej o usłudze Azure AI Search

Opinia

Dodatkowe zasoby