Wybieranie warstwy usługi dla usługi Azure AI Search

Częścią tworzenia usługi wyszukiwania jest wybranie warstwy cenowej (lub jednostki SKU), która jest stała przez okres istnienia usługi. W portalu warstwa jest określona na stronie Wybieranie warstwy cenowej podczas tworzenia usługi. Jeśli zamiast tego aprowizujesz za pomocą programu PowerShell lub interfejsu wiersza polecenia platformy Azure, warstwa jest określana za pomocą parametru -Sku

Wybrana warstwa określa:

  • Maksymalna liczba indeksów i innych obiektów dozwolonych w usłudze
  • Rozmiar i szybkość partycji (magazyn fizyczny)
  • Stawka rozliczana jako koszt stały miesięczny, ale także koszt przyrostowy w przypadku dodawania pojemności

W kilku przypadkach wybrana warstwa określa dostępność funkcji Premium.

Cennik — lub szacowany miesięczny koszt uruchamiania usługi — są wyświetlane na stronie Wybieranie warstwy cenowej portalu. Sprawdź cennik usług, aby dowiedzieć się więcej o szacowanych kosztach.

Uwaga

usługa wyszukiwania utworzone po 3 kwietnia 2024 r. mają większe partycje i wyższe limity przydziału wektorów w prawie każdej warstwie. Aby uzyskać więcej informacji, zobacz Limity usług.

Opisy warstw

Warstwy obejmują warstwy Bezpłatna, Podstawowa, Standardowa i Zoptymalizowane pod kątem magazynu. Zoptymalizowane pod kątem warstwy Standardowa i magazynu są dostępne z kilkoma konfiguracjami i pojemnościami. Poniższy zrzut ekranu z witryny Azure Portal przedstawia dostępne warstwy, pomniejszone o ceny (które można znaleźć w portalu i na stronie cennika).

Wykres warstwy cenowej

Bezpłatnie tworzy ograniczoną usługęwyszukiwania dla mniejszych projektów, takich jak uruchamianie samouczków i przykładów kodu. Wewnętrznie zasoby systemowe są współużytkowane przez wielu subskrybentów. Nie można skalować bezpłatnej usługi ani uruchamiać znaczących obciążeń. Możesz mieć tylko jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure.

Najczęściej używane warstwy rozliczane obejmują następujące elementy:

  • Podstawowa ma możliwość spełnienia umowy SLA z obsługą trzech replik.

  • Standard (S1, S2, S3) jest wartością domyślną. Zapewnia ona większą elastyczność skalowania obciążeń. Można skalować zarówno partycje, jak i repliki. Dzięki dedykowanym zasobom pod kontrolą można wdrażać większe projekty, optymalizować wydajność i zwiększać pojemność.

Niektóre warstwy są przeznaczone dla niektórych typów pracy:

  • Standard 3 High Density (S3 HD) to tryb hostingu dla S3, gdzie podstawowy sprzęt jest zoptymalizowany pod kątem dużej liczby mniejszych indeksów i jest przeznaczony dla scenariuszy wielodostępności. Usługa S3 HD ma takie same opłaty za jednostkę co S3, ale sprzęt jest zoptymalizowany pod kątem szybkiego odczytu plików w dużej liczbie mniejszych indeksów.

  • Warstwy Zoptymalizowane pod kątem magazynu (L1, L2) oferują większą pojemność magazynu w niższej cenie za TB niż w warstwach Standardowa. Te warstwy są przeznaczone dla dużych indeksów, które nie zmieniają się bardzo często. Podstawowym kompromisem jest większe opóźnienie zapytań, które należy zweryfikować pod kątem określonych wymagań aplikacji.

Więcej informacji na temat różnych warstw można znaleźć na stronie cennika, w artykule Limity usługi w usłudze Azure AI Search oraz na stronie portalu podczas aprowizowania usługi.

Dostępność funkcji według warstwy

Większość funkcji jest dostępna we wszystkich warstwach, w tym w warstwie Bezpłatna. W kilku przypadkach warstwa określa dostępność funkcji. W poniższej tabeli opisano ograniczenia.

Funkcja Ograniczenia
Indeksatory Indeksatory nie są dostępne w usłudze S3 HD. Indeksatory mają więcej ograniczeń w warstwie Bezpłatna.
Wzbogacanie sztucznej inteligencji Działa w warstwie Bezpłatna, ale nie jest to zalecane.
Tożsamości zarządzane lub zaufane na potrzeby dostępu wychodzącego (indeksatora) Niedostępne w warstwie Bezpłatna.
Klucze szyfrowania zarządzane przez klienta Niedostępne w warstwie Bezpłatna.
Dostęp do zapory ip Niedostępne w warstwie Bezpłatna.
Prywatny punkt końcowy (integracja z usługą Azure Private Link) W przypadku połączeń przychodzących z usługą wyszukiwania nie jest dostępna w warstwie Bezpłatna. W przypadku połączeń wychodzących przez indeksatory do innych zasobów platformy Azure nie są dostępne w warstwie Bezpłatna lub S3 HD. W przypadku indeksatorów korzystających z zestawów umiejętności, które nie są dostępne w warstwie Bezpłatna, Podstawowa, S1 lub S3 HD.
Strefy dostępności Niedostępne w warstwie Bezpłatna lub Podstawowa.
Ranga semantyczna Niedostępne w warstwie Bezpłatna.

Funkcje intensywnie korzystające z zasobów mogą nie działać prawidłowo, chyba że zapewnisz jej wystarczającą pojemność. Na przykład wzbogacanie sztucznej inteligencji ma długotrwałe umiejętności, które przekroczyły limit czasu bezpłatnej usługi, chyba że zestaw danych jest mały.

Górne limity

Warstwy określają maksymalny magazyn samej usługi, a także maksymalną liczbę indeksów, indeksatorów, źródeł danych, zestawów umiejętności i map synonimów, które można utworzyć. Aby uzyskać pełny podział wszystkich limitów, zobacz Limity usług w usłudze Azure AI Search.

Rozmiar partycji i szybkość

Cennik warstw zawiera szczegółowe informacje o magazynie na partycje, które wahają się od 15 GB dla warstwy Podstawowa, do 2 TB dla warstw zoptymalizowanych pod kątem magazynu (L2). Inne cechy sprzętu, takie jak szybkość operacji, opóźnienia i szybkość transferu, nie są publikowane, ale warstwy przeznaczone dla określonych architektur rozwiązań są oparte na sprzęcie, który ma funkcje do obsługi tych scenariuszy. Aby uzyskać więcej informacji na temat partycji, zobacz Szacowanie pojemności i niezawodność oraz zarządzanie nią w usłudze Azure AI Search.

Stawki rozliczeniowe

Warstwy mają różne stawki rozliczeniowe, z wyższymi stawkami dla warstw, które działają na droższym sprzęcie lub oferują droższe funkcje. Stawkę rozliczeń warstw można znaleźć na stronach cennika platformy Azure dla usługi Azure AI Search.

Po utworzeniu usługi stawka rozliczeniowa staje się zarówno stałym kosztemuruchamiania usługi przez całą dobę, jak i kosztem przyrostowym, jeśli zdecydujesz się dodać więcej pojemności.

usługa wyszukiwania są przydzielane zasoby obliczeniowe w postaci partycji (dla magazynu) i replik (wystąpień aparatu zapytań). Początkowo usługa jest tworzona przy użyciu jednego z nich, a stawka rozliczeniowa obejmuje oba zasoby. Jednak w przypadku skalowania pojemności koszty spadną w górę lub w dół w przyrostach stawki rozliczanej.

Poniższy przykład stanowi ilustrację. Załóżmy hipotetyczną stawkę rozliczeniową w wysokości 100 USD miesięcznie. Jeśli zachowasz usługę wyszukiwania w początkowej pojemności jednej partycji i jednej repliki, wówczas 100 USD będzie płacić na koniec miesiąca. Jeśli jednak dodasz jeszcze dwie repliki, aby uzyskać wysoką dostępność, miesięczny rachunek wzrośnie do 300 USD (100 USD dla pierwszej pary repliki-partycji, a następnie 200 USD dla dwóch replik).

Ten model rozliczeń opiera się na koncepcji stosowania stawki rozliczeniowej do liczby jednostek wyszukiwania (SU) używanych przez usługę wyszukiwania. Wszystkie usługi są początkowo aprowidowane w jednej jednostki SU, ale można zwiększyć liczbę jednostek jednostki SU, dodając partycje lub repliki do obsługi większych obciążeń. Aby uzyskać więcej informacji, zobacz Jak oszacować koszty usługi wyszukiwania.

Uaktualnianie lub obniżanie poziomu warstwy

Nie ma wbudowanej obsługi uaktualniania ani obniżania warstw. Jeśli chcesz przełączyć się na inną warstwę, podejście to:

  • Utwórz nową usługę wyszukiwania w nowej warstwie.

  • Wdróż zawartość wyszukiwania w nowej usłudze. Postępuj zgodnie z tą listą kontrolną, aby upewnić się, że masz całą zawartość.

  • Usuń starą usługę wyszukiwania po upewnieniu się, że nie jest już potrzebna.

W przypadku dużych indeksów, których nie chcesz ponownie kompilować od podstaw, rozważ użycie przykładu tworzenia kopii zapasowej i przywracania, aby je przenieść.

Następne kroki

Najlepszym sposobem wyboru warstwy cenowej jest rozpoczęcie od warstwy o najniższych kosztach, a następnie umożliwienie środowiska i testowania informowanie o decyzji o utrzymaniu usługi lub utworzeniu nowej warstwy w wyższej warstwie. W przypadku następnych kroków zalecamy utworzenie usługi wyszukiwania w warstwie, która może pomieścić proponowany poziom testowania, a następnie zapoznaj się z poniższymi wskazówkami dotyczącymi szacowania kosztów i pojemności.