Co to jest usługa Azure AI Search?

Usługa Azure AI Search (wcześniej znana jako "Azure Cognitive Search") zapewnia bezpieczne pobieranie informacji na dużą skalę w odniesieniu do zawartości należącej do użytkownika w tradycyjnych i generujących aplikacjach do wyszukiwania sztucznej inteligencji.

Pobieranie informacji jest podstawą każdej aplikacji, która przedstawia tekst i wektory. Typowe scenariusze obejmują wyszukiwanie katalogów lub dokumentów, eksplorację danych i coraz bardziej aplikacje w stylu czatu w przypadku zastrzeżonych danych uziemienia. Podczas tworzenia usługi wyszukiwania pracujesz z następującymi możliwościami:

  • Wyszukiwarka wyszukiwania wektorów i wyszukiwania pełnotekstowego oraz wyszukiwania hybrydowego w indeksie wyszukiwania
  • Rozbudowane indeksowanie ze zintegrowanymi fragmentacjami i wektoryzacją danych (wersja zapoznawcza), analiza leksykalna tekstu i opcjonalna wzbogacanie sztucznej inteligencji na potrzeby wyodrębniania i przekształcania zawartości
  • Składnia zapytań sformatowanych dla zapytań wektorowych, wyszukiwania tekstu, zapytań hybrydowych, wyszukiwania rozmytego, autouzupełniania, wyszukiwania geograficznego i innych
  • Skalowanie, zabezpieczenia i zasięg platformy Azure
  • Integracja platformy Azure z warstwą danych, warstwą uczenia maszynowego, usługami azure AI i usługami Azure OpenAI

W architekturze usługa wyszukiwania znajduje się między zewnętrznymi magazynami danych zawierającymi dane nieindeksowane, a aplikacją kliencką, która wysyła żądania zapytań do indeksu wyszukiwania i obsługuje odpowiedź.

Azure AI Search architecture

W aplikacji klienckiej środowisko wyszukiwania jest definiowane przy użyciu interfejsów API z usługi Azure AI Search i może obejmować dostrajanie istotności, klasyfikację semantyczną, autouzupełnianie, dopasowywanie synonimów, dopasowywanie rozmyte, dopasowywanie wzorców, filtrowanie i sortowanie.

Na całej platformie Azure usługa Azure AI Search może integrować się z innymi usługami platformy Azure w postaci indeksatorów, które automatyzują pozyskiwanie/pobieranie danych ze źródeł danych platformy Azure oraz zestawy umiejętności, które obejmują eksploatacyjne rozwiązania sztucznej inteligencji z usług Azure AI, takich jak przetwarzanie obrazów i języka naturalnego, lub niestandardowa sztuczna inteligencja tworzona w usłudze Azure Machine Edukacja lub opakowujące się w usłudze Azure Functions.

Wewnątrz usługi wyszukiwania

W samej usłudze wyszukiwania dwa podstawowe obciążenia indeksują i wysyłają zapytania.

  • Indeksowanie to proces do wprowadzania, który ładuje zawartość do usługi wyszukiwania i umożliwia wyszukiwanie. Wewnętrznie tekst przychodzący jest przetwarzany na tokeny i przechowywany w indeksach odwróconych, a wektory przychodzące są przechowywane w indeksach wektorów. Format dokumentu, który usługa Azure AI Search może indeksować, to JSON. Możesz przekazać dokumenty JSON, które zostały utworzone, lub użyć indeksatora, aby pobrać i serializować dane w formacie JSON.

    Wzbogacanie sztucznej inteligencji dzięki umiejętnościom poznawczym to rozszerzenie indeksowania. Jeśli masz obrazy lub duży tekst bez struktury w dokumencie źródłowym, możesz dołączyć umiejętności wykonujące funkcję OCR, opisywać obrazy, wnioskować strukturę, tłumaczyć tekst i nie tylko. Możesz również dołączyć umiejętności, które wykonują fragmentowanie i wektoryzacja danych.

  • Wykonywanie zapytań może nastąpić po wypełnieniu indeksu zawartością z możliwością wyszukiwania, gdy aplikacja kliencka wysyła żądania zapytań do usługi wyszukiwania i obsługuje odpowiedzi. Całe wykonywanie zapytań odbywa się za pośrednictwem indeksu wyszukiwania, który kontrolujesz.

    Klasyfikacja semantyczna to rozszerzenie wykonywania zapytań. Dodaje zrozumienie języka do przetwarzania wyników wyszukiwania, promując najbardziej semantycznie istotne wyniki na górze.

Usługa Azure AI Search jest odpowiednia dla następujących scenariuszy aplikacji:

  • Służy do tradycyjnego wyszukiwania pełnotekstowego i wyszukiwania wektorów następnej generacji. Utwórz kopię zapasową aplikacji generacyjnych sztucznej inteligencji za pomocą pobierania informacji, które wykorzystują siłę słowa kluczowego i wyszukiwania podobieństwa. Użyj obu metod, aby pobrać najbardziej odpowiednie wyniki.

  • Skonsoliduj zawartość heterogeniczną do zdefiniowanego przez użytkownika i wypełnionego indeksu wyszukiwania składającego się z wektorów i tekstu. Jesteś właścicielem i kontrolujesz, co można przeszukiwać.

  • Integrowanie fragmentowania i wektoryzacji danych na potrzeby generowania aplikacji sztucznej inteligencji i rag.

  • Zastosuj szczegółową kontrolę dostępu na poziomie dokumentu.

  • Odciążanie obciążeń indeksowania i wykonywania zapytań w dedykowanej usłudze wyszukiwania.

  • Łatwe implementowanie funkcji związanych z wyszukiwaniem: dostrajanie istotności, nawigacja aspektowa, filtry (w tym wyszukiwanie geograficzne), mapowanie synonimów i autouzupełnianie.

  • Przekształć duży niezróżnicowany tekst lub pliki obrazów albo pliki aplikacji przechowywane w usłudze Azure Blob Storage lub Azure Cosmos DB w fragmenty z możliwością wyszukiwania. Jest to osiągane podczas indeksowania za pomocą umiejętności poznawczych, które dodają zewnętrzne przetwarzanie z usługi Azure AI.

  • Dodaj analizę językową lub niestandardową. Jeśli masz zawartość inną niż angielska, usługa Azure AI Search obsługuje zarówno analizatory Lucene, jak i procesory języka naturalnego firmy Microsoft. Można również skonfigurować analizatory w celu osiągnięcia wyspecjalizowanego przetwarzania nieprzetworzonej zawartości, na przykład filtrowania znaków diakrytycznych lub rozpoznawania i zachowywania wzorców w ciągach.

Aby uzyskać więcej informacji na temat określonych funkcji, zobacz Funkcje usługi Azure AI Search

Pierwsze kroki

Funkcje są udostępniane za pośrednictwem witryny Azure Portal, prostych interfejsów API REST lub zestawów AZURE SDK, takich jak zestaw Azure SDK dla platformy .NET. Witryna Azure Portal obsługuje administrowanie usługami i zarządzanie zawartością z narzędziami do tworzenia prototypów i wykonywania zapytań dotyczących indeksów i zestawów umiejętności.

Kompleksowa eksploracja podstawowych funkcji wyszukiwania można wykonać w czterech krokach:

  1. Zdecyduj o warstwie i regionie. Jedna bezpłatna usługa wyszukiwania jest dozwolona na subskrypcję. Wszystkie przewodniki Szybki start można ukończyć w warstwie Bezpłatna. Aby uzyskać więcej pojemności i możliwości, potrzebujesz warstwy rozliczanej.

  2. Utwórz usługę wyszukiwania w witrynie Azure Portal.

  3. Rozpocznij od kreatora importu danych. Wybierz wbudowany przykład lub obsługiwane źródło danych, aby utworzyć, załadować i wysłać zapytanie do indeksu w ciągu kilku minut.

  4. Zakończ pomocą Eksploratora wyszukiwania, używając klienta portalu do wykonywania zapytań dotyczących właśnie utworzonego indeksu wyszukiwania.

Alternatywnie możesz utworzyć, załadować i wykonać zapytanie dotyczące indeksu wyszukiwania w krokach niepodzielnych:

  1. Utwórz indeks wyszukiwania przy użyciu portalu, interfejsu API REST, zestawu .NET SDK lub innego zestawu SDK. Schemat indeksu definiuje strukturę zawartości z możliwością wyszukiwania.

  2. Przekaż zawartość przy użyciu modelu wypychania do wypychania dokumentów JSON z dowolnego źródła lub użyj modelu "ściągania" (indeksatorów), jeśli dane źródłowe są obsługiwane.

  3. Wykonywanie zapytań względem indeksu przy użyciu Eksploratora wyszukiwania w portalu, interfejsie API REST, zestawie SDK platformy .NET lub innym zestawie SDK.

Napiwek

Aby uzyskać pomoc dotyczącą złożonych lub niestandardowych rozwiązań, skontaktuj się z partnerem z głęboką wiedzą w zakresie technologii Azure AI Search.

Porównanie opcji wyszukiwania

Klienci często pytają, jak usługa Azure AI Search porównuje się z innymi rozwiązaniami związanymi z wyszukiwaniem. Poniższa tabela zawiera podsumowanie podstawowych różnic.

W porównaniu do Podstawowe różnice
Microsoft Search Usługa Microsoft Search jest dla uwierzytelnionych użytkowników platformy Microsoft 365, którzy muszą wykonywać zapytania dotyczące zawartości w programie SharePoint. Usługa Azure AI Search pobiera zawartość między platformą Azure i dowolnym zestawem danych JSON.
Bing Interfejsy API Bing wysyłają zapytania do indeksów w Bing.com w celu dopasowania terminów. Wyszukiwanie w usłudze Azure AI Search w indeksach wypełnionych zawartością. Kontrolujesz pozyskiwanie danych i schemat.
Wyszukiwanie w bazie danych Program SQL Server ma wyszukiwanie pełnotekstowe, a usługa Azure Cosmos DB i podobne technologie mają indeksy z możliwością wykonywania zapytań. Usługa Azure AI Search staje się atrakcyjną alternatywą, gdy potrzebujesz funkcji, takich jak analizatory leksykalne i dostrajanie istotności, lub zawartość ze źródeł heterogenicznych. Użycie zasobów to kolejny etap. Indeksowanie i zapytania intensywnie korzystają z obliczeń. Odciążanie wyszukiwania z usługi DBMS zachowuje zasoby systemowe na potrzeby przetwarzania transakcji.
Dedykowane rozwiązanie wyszukiwania Zakładając, że podjęto decyzję o dedykowanym wyszukiwaniu z pełną funkcjonalnością spektrum, ostateczne porównanie kategorii jest między technologiami wyszukiwania. Wśród dostawców usług w chmurze usługa Azure AI Search jest najsilniejsza dla obciążeń wektorowych, kluczowych i hybrydowych w odniesieniu do zawartości na platformie Azure, w przypadku aplikacji korzystających głównie z wyszukiwania zarówno pobierania informacji, jak i nawigacji zawartości.

Oto najważniejsze zalety:

  • Osadzanie wektorów przechowywania, indeksowania i wyszukiwania dla zdań, obrazów, grafów i nie tylko.
  • Znajdź informacje, które są semantycznie podobne do zapytań wyszukiwania, nawet jeśli terminy wyszukiwania nie są dokładnie zgodne.
  • Użyj wyszukiwania hybrydowego, aby uzyskać najlepsze słowo kluczowe i wyszukiwanie wektorów.
  • Dostrajanie istotności za pomocą profilów klasyfikacji semantycznej i oceniania.
  • Integracja danych (przeszukiwarki) w warstwie indeksowania.
  • Integracja sztucznej inteligencji platformy Azure na potrzeby przekształceń, które umożliwiają wyszukiwanie tekstu zawartości i wektora.
  • Zabezpieczenia firmy Microsoft dla zaufanych połączeń i usługi Azure Private Link dla połączeń prywatnych w scenariuszach bez Internetu.
  • Pełne środowisko wyszukiwania: językoznawstwo i niestandardowa analiza tekstu w 56 językach. Tworzenie aspektów, autouzupełnianie zapytań i sugerowane wyniki oraz synonimy.
  • Skalowanie, niezawodność i globalny zasięg platformy Azure.