Funkcje usługi Azure AI Search

Usługa Azure AI Search udostępnia pobieranie informacji i używa opcjonalnej integracji sztucznej inteligencji w celu wyodrębnienia większej ilości zawartości tekstu i struktury.

Poniższa tabela zawiera podsumowanie funkcji według kategorii. Aby uzyskać więcej informacji na temat porównywania usługi Azure AI Search z innymi technologiami wyszukiwania, zobacz Porównanie opcji wyszukiwania.

Istnieje parzystość funkcji we wszystkich chmurach publicznych, prywatnych i suwerennych platformy Azure, ale niektóre funkcje nie są obsługiwane w określonych regionach. Aby uzyskać więcej informacji, zobacz dostępność produktów według regionów.

Uwaga

Szukasz funkcji w wersji zapoznawczej? Zobacz listę funkcji w wersji zapoznawczej.

Funkcje indeksowania

Kategoria Funkcje
Źródła danych Indeksy wyszukiwania mogą akceptować tekst z dowolnego źródła, pod warunkiem że są przesyłane jako dokument JSON.

Indeksatory to funkcja automatyzująca importowanie danych z obsługiwanych źródeł danych w celu wyodrębniania zawartości z możliwością wyszukiwania w podstawowych magazynach danych. Indeksatory obsługują serializacji JSON dla Ciebie i większość obsługuje jakąś formę wykrywania zmian i usuwania. Możesz nawiązać połączenie z różnymi źródłami danych, w tym z usługą Azure SQL Database, Usługą Azure Cosmos DB lub usługą Azure Blob Storage.
Hierarchiczne i zagnieżdżone struktury danych Złożone typy i kolekcje umożliwiają modelowanie praktycznie dowolnego typu struktury JSON w indeksie wyszukiwania. Kardynalność "jeden do wielu" i "wiele do wielu" może być wyrażana natywnie za pośrednictwem kolekcji, typów złożonych i kolekcji typów złożonych.
Analiza lingwistyczna Analizatory to składniki używane do przetwarzania tekstu podczas operacji indeksowania i wyszukiwania. Domyślnie można użyć analizatora Standard Lucene ogólnego przeznaczenia lub zastąpić wartość domyślną analizatorem języka, analizatorem niestandardowym skonfigurowanym lub innym wstępnie zdefiniowanym analizatorem tworzącym tokeny w wymaganym formacie.

Analizatory języków, opracowane przez firmę Lucene lub Microsoft, są używane do inteligentnej obsługi struktur lingwistycznych, m.in. czasów gramatycznych, rodzajów i rzeczowników z nieregularną liczbą mnogą (na przykład „mouse” i „mice” w języku angielskim), a także rozkładania i dzielenia wyrazów (w przypadku języków, w których nie używa się odstępów).

Niestandardowe analizatory leksykalne są używane do złożonych formularzy zapytań, takich jak dopasowywanie fonetyczne i wyrażenia regularne.

Kategoria Funkcje
Indeksowanie wektorów W indeksie wyszukiwania dodaj pola wektorów, aby obsługiwać scenariusze wyszukiwania wektorów. Pola wektorowe mogą współistnieć z polami niewektorowymi w tym samym dokumencie wyszukiwania.
Zapytania wektorowe Sformułuj zapytania pojedyncze i wiele wektorów.
Algorytmy wyszukiwania wektorowego Użyj hierarchicznego nawigowalnego małego świata (HNSW) lub wyczerpującego K najbliższych sąsiadów (KNN), aby znaleźć podobne wektory w indeksie wyszukiwania.
Filtry wektorowe Zastosuj filtry przed wykonaniem zapytania lub po nim, aby uzyskać większą precyzję podczas pobierania informacji.
Pobieranie informacji hybrydowych Wyszukaj pojęcia i słowa kluczowe w pojedynczym żądaniu zapytania hybrydowego.

Wyszukiwanie hybrydowe konsoliduje wyszukiwanie wektorowe i tekstowe z opcjonalnym semantycznym klasyfikowaniem i dostrajaniem istotności w celu uzyskania najlepszych wyników.
Zintegrowane fragmentowanie i wektoryzacja danych (wersja zapoznawcza) Natywne dzielenie danych za pomocą umiejętności dzielenia tekstu i natywnej wektoryzacji za pomocą wektoryzatorów i umiejętności AzureOpenAIEmbeddingModel.

Zintegrowana wektoryzacja (wersja zapoznawcza) zapewnia kompleksowe potok indeksowania z plików źródłowych do zapytań.
Kompresja i kwantyzacja wektorów zintegrowanych Użyj wbudowanej kwantyzacji skalarnej, aby zmniejszyć rozmiar indeksu wektorowego w pamięci i na dysku. Można również zera przechowywać wektory, których nie potrzebujesz, lub przypisywać wąskie typy danych do pól wektorowych w celu uzyskania ograniczonych wymagań dotyczących magazynu.
Importowanie i wektoryzowanie danych (wersja zapoznawcza) Nowy kreator w witrynie Azure Portal, który tworzy pełny potok indeksowania zawierający fragmentowanie i wektoryzację danych. Kreator tworzy wszystkie obiekty i ustawienia konfiguracji.

Wzbogacanie sztucznej inteligencji i wyszukiwanie wiedzy

Kategoria Funkcje
Przetwarzanie sztucznej inteligencji podczas indeksowania Wzbogacanie sztucznej inteligencji odnosi się do osadzonego obrazu i przetwarzania języka naturalnego w potoku indeksatora, który wyodrębnia tekst i informacje z zawartości, która nie może być indeksowana w celu wyszukiwania pełnotekstowego. Przetwarzanie sztucznej inteligencji jest osiągane przez dodawanie i łączenie umiejętności w zestawie umiejętności, które następnie jest dołączone do indeksatora. Sztuczna inteligencja może być wbudowanymi umiejętnościami firmy Microsoft, takimi jak tłumaczenie tekstu lub optyczne rozpoznawanie znaków (OCR) lub umiejętności niestandardowe .
Przechowywanie wzbogaconej zawartości na potrzeby analizy i użycia w scenariuszach niezwiązanych z wyszukiwaniem Magazyn wiedzy jest trwałym magazynem wzbogaconej zawartości przeznaczonej dla scenariuszy bez wyszukiwania, takich jak wyszukiwanie wiedzy i przetwarzanie nauki o danych. Magazyn wiedzy jest definiowany w zestawie umiejętności, ale utworzony w usłudze Azure Storage jako obiekty lub zestawy wierszy tabelarycznych.
Buforowane wzbogacania Wzbogacanie przyrostowe (wersja zapoznawcza) odnosi się do buforowanych wzbogacenia, które mogą być ponownie używane podczas wykonywania zestawu umiejętności. Buforowanie jest szczególnie cenna w zestawach umiejętności, które obejmują OCR i analizę obrazów, które są kosztowne do przetworzenia.

Wykonywanie zapytań i środowisko użytkownika

Kategoria Funkcje
Wyszukiwanie tekstowe w dowolnej postaci Wyszukiwanie pełnotekstowe to podstawowy przypadek użycia większości aplikacji opartych na wyszukiwaniu. Zapytania można formułować za pomocą obsługiwanej składni.

Prosta składnia zapytań zawiera operatory logiczne, operatory wyszukiwania fraz, operatory sufiksów oraz operatory pierwszeństwa.

Pełna składnia zapytań Lucene obejmuje wszystkie operacje w prostej składni, z rozszerzeniami wyszukiwania rozmytego, wyszukiwania w pobliżu, zwiększania terminów i wyrażeń regularnych.
Stopień zgodności Proste ocenianie to kluczowa zaleta usługi Azure AI Search. Profile oceniania służą do modelowania trafności jako funkcji wartości w samych dokumentach. Na przykład nowsze produkty lub produkty o obniżonej cenie mogą być wyświetlane na początku wyników wyszukiwania. Do tworzenia profilów oceniania można również używać tagów spersonalizowanej oceny opartych na preferencjach klientów, śledzonych i przechowywanych oddzielnie.

Semantyczny ranger to funkcja premium, która reranksuje wyniki na podstawie semantycznego istotności zapytania. W zależności od zawartości i scenariusza może znacznie poprawić istotność wyszukiwania przy prawie minimalnej konfiguracji lub nakładu pracy.
Wyszukiwanie geoprzestrzenne Funkcje geoprzestrzenne filtrują i pasują do współrzędnych geograficznych. Można dopasować na odległość lub poprzez włączenie w kształcie wielokąta.
Filtry i aspekty Nawigacja aspektowa jest włączana za pomocą jednego parametru zapytania. Usługa Azure AI Search zwraca strukturę nawigacji aspektowej, której można użyć jako kodu listy kategorii do samodzielnego filtrowania (na przykład filtrowania elementów wykazu według zakresu cen lub marki).

Filtry umożliwiają integrowanie nawigacji aspektowej z interfejsem użytkownika aplikacji, rozbudowywanie zapytań oraz filtrowanie na podstawie kryteriów określonych przez użytkownika lub dewelopera. Do tworzenie filtrów służy składnia OData.
Środowisko użytkownika Autouzupełnianie można włączyć dla zapytań z wyprzedzeniem typu na pasku wyszukiwania.

Sugestie dotyczące wyszukiwania działają również na podstawie tekstu częściowego wpisanego w pasku wyszukiwania, ale wyniki są faktycznymi dokumentami w indeksie, a nie terminami zapytania.

Synonimy umożliwiają kojarzenie równoważnych terminów, co niejawnie rozszerza zakres zapytania — bez potrzeby podawania terminów alternatywnych przez użytkownika.

Wyróżnianie trafień umożliwia zastosowanie formatowania tekstu do pasującego słowa kluczowego w wynikach wyszukiwania. Można wybrać pola, które zwracają wyróżnione fragmenty.

Sortowanie jest dostępne dla wielu pól za pośrednictwem schematu indeksu. Można je przełączać w czasie wykonywania zapytania za pomocą pojedynczego parametru wyszukiwania.

Stronicowanie i ograniczanie wyników wyszukiwania jest proste dzięki precyzyjnej kontroli, którą usługa Azure AI Search oferuje w wynikach wyszukiwania.

Funkcje zabezpieczeń

Kategoria Funkcje
Szyfrowanie danych Szyfrowanie zarządzane przez firmę Microsoft jest wbudowane w wewnętrzną warstwę magazynu i jest nieodwracalne.

Klucze szyfrowania zarządzane przez klienta tworzone i zarządzane w usłudze Azure Key Vault mogą służyć do dodatkowego szyfrowania indeksów i map synonimów. W przypadku usług utworzonych po 1 sierpnia 2020 r. szyfrowanie CMK rozszerza dane na dyskach tymczasowych w celu pełnego podwójnego szyfrowania indeksowanej zawartości.
Ochrona punktów końcowych Reguły adresów IP dla obsługi zapory dla ruchu przychodzącego umożliwiają konfigurowanie zakresów adresów IP, dla których usługa wyszukiwania będzie akceptować żądania.

Utwórz prywatny punkt końcowy przy użyciu usługi Azure Private Link, aby wymusić wszystkie żądania za pośrednictwem sieci wirtualnej.
Dostęp przychodzący Kontrola dostępu oparta na rolach platformy Azure przypisuje role użytkownikom i grupom w usłudze Microsoft Entra ID w celu uzyskania kontrolowanego dostępu do zawartości i operacji wyszukiwania. Możesz również użyć uwierzytelniania opartego na kluczach, jeśli nie masz dzierżawy platformy Azure.
Zabezpieczenia dla ruchu wychodzącego (indeksatory) Dostęp do danych za pośrednictwem prywatnych punktów końcowych umożliwia indeksatorowi łączenie się z zasobami platformy Azure chronionymi za pośrednictwem usługi Azure Private Link.

Dostęp do danych przy użyciu zaufanej tożsamości oznacza, że parametry połączenia do zewnętrznych źródeł danych mogą pomijać nazwy użytkowników i hasła. Gdy indeksator łączy się ze źródłem danych, zasób umożliwia połączenie, jeśli usługa wyszukiwania została wcześniej zarejestrowana jako zaufana usługa.

Funkcje portalu

Kategoria Funkcje
Narzędzia służące do tworzenia prototypów i przeprowadzania inspekcji Dodawanie indeksu jest projektantem indeksów w portalu, którego można użyć do utworzenia podstawowego schematu składającego się z pól przypisanych i kilku innych ustawień. Po zapisaniu indeksu możesz wypełnić go przy użyciu zestawu SDK lub interfejsu API REST w celu udostępnienia danych.

Kreator importu danych tworzy indeksy, indeksatory, zestawy umiejętności i definicje źródeł danych. Jeśli dane istnieją na platformie Azure, ten kreator może zaoszczędzić dużo czasu i nakładu pracy, szczególnie w przypadku badania i eksploracji weryfikacji koncepcji.

Eksplorator wyszukiwania służy do testowania zapytań i uściślinia profilów oceniania.

Tworzenie aplikacji demonstracyjnej służy do generowania strony HTML, która może służyć do testowania środowiska wyszukiwania.

Sesje debugowania to edytor wizualny, który umożliwia interaktywne debugowanie zestawu umiejętności. Pokazuje on zależności, dane wyjściowe i przekształcenia.
Monitorowanie i diagnostyka Włącz funkcje monitorowania, aby przejść poza metryki na pierwszy rzut oka, które są zawsze widoczne w portalu. Metryki dotyczące zapytań na sekundę, opóźnienia i ograniczania są przechwytywane i zgłaszane na stronach portalu bez konieczności dodatkowej konfiguracji.

Możliwości programowania

Kategoria Funkcje
REST Interfejs API REST usługi jest przeznaczony dla operacji płaszczyzny danych, w tym wszystkich operacji związanych z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Interfejs API REST zarządzania służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla platformy .NET Azure.Search.Documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Microsoft.Azure.Management.Search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla języka Java Com.azure.search.documents jest przeznaczony dla operacji płaszczyzny danych, w tym wszystkich operacji związanych z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

Com.microsoft.azure.management.search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla środowiska Python azure-search-documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

azure-mgmt-search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.
Zestaw Azure SDK dla języka JavaScript/TypeScript azure/search-documents to operacje płaszczyzny danych, w tym wszystkie operacje związane z indeksowaniem, zapytaniami i wzbogacaniem sztucznej inteligencji. Możesz również użyć tej biblioteki klienta, aby pobrać informacje o systemie i statystyki.

usługa azure/arm-search służy do tworzenia i aprowizacji usług za pośrednictwem usługi Azure Resource Manager. Za pomocą tego interfejsu API można również zarządzać kluczami i pojemnością.

Zobacz też