Wybieranie warstwy usługi dla usługi Azure AI Search

Artykuł
10/26/2024

Częścią tworzenia usługi wyszukiwania jest wybranie warstwy cenowej (lub jednostki SKU), która jest stała przez okres istnienia usługi. W portalu warstwa jest określona na stronie Wybieranie warstwy cenowej podczas tworzenia usługi. W programie PowerShell lub interfejsie wiersza polecenia platformy Azure warstwa jest określana za pomocą parametru -Sku .

Warstwa określa:

Maksymalna liczba indeksów i innych obiektów dozwolonych w usłudze
Rozmiar i szybkość partycji (magazyn fizyczny)
Stawka rozliczana jako koszt stały miesięczny, ale także koszt przyrostowy w przypadku dodawania pojemności

W kilku przypadkach wybrana warstwa określa dostępność funkcji Premium.

Stawki rozliczeniowe są wyświetlane na stronie Wybieranie warstwy cenowej portalu. Możesz sprawdzić stronę cennika dla stawek regionalnych i przejrzeć sekcję Planowanie kosztów i zarządzanie nimi, aby dowiedzieć się więcej na temat modelu rozliczeń.

Uwaga

usługa wyszukiwania utworzone po 3 kwietnia 2024 r. mają większe partycje i wyższe limity przydziału wektorów w prawie każdej warstwie. Aby uzyskać więcej informacji, zobacz Limity usług.

Opisy warstw

Warstwy obejmują warstwy Bezpłatna, Podstawowa, Standardowa i Zoptymalizowane pod kątem magazynu. Zoptymalizowane pod kątem warstwy Standardowa i magazynu są dostępne z kilkoma konfiguracjami i pojemnościami. Poniższy zrzut ekranu z witryny Azure Portal przedstawia dostępne warstwy, pomniejszone o ceny (które można znaleźć w portalu i na stronie cennika).

Bezpłatnie tworzy ograniczoną usługę wyszukiwania dla mniejszych projektów, takich jak uruchamianie samouczków i przykładów kodu. Wewnętrznie zasoby systemowe są współużytkowane przez wielu subskrybentów. Nie można skalować bezpłatnej usługi, uruchamiać znaczących obciążeń, a niektóre funkcje w warstwie Premium nie są dostępne. Możesz mieć tylko jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Jeśli usługa jest nieaktywna przez dłuższy czas, może zostać usunięta, aby zwolnić pojemność, zwłaszcza jeśli region jest objęty ograniczeniami pojemności.

Najczęściej używane warstwy rozliczane to:

Podstawowa ma możliwość spełnienia umowy SLA z obsługą trzech replik.
Standard (S1, S2, S3) jest wartością domyślną. Zapewnia ona większą elastyczność skalowania obciążeń. Można skalować zarówno partycje, jak i repliki. Dzięki dedykowanym zasobom pod kontrolą można wdrażać większe projekty, optymalizować wydajność i zwiększać pojemność.

Niektóre warstwy są przeznaczone dla niektórych typów pracy:

Standard 3 High Density (S3 HD) to tryb hostingu dla S3, gdzie podstawowy sprzęt jest zoptymalizowany pod kątem dużej liczby mniejszych indeksów i jest przeznaczony dla scenariuszy wielodostępności. Usługa S3 HD ma takie same opłaty za jednostkę co S3, ale sprzęt jest zoptymalizowany pod kątem szybkiego odczytu plików w dużej liczbie mniejszych indeksów.
Warstwy Zoptymalizowane pod kątem magazynu (L1, L2) oferują większą pojemność magazynu w niższej cenie za TB niż w warstwach Standardowa. Te warstwy są przeznaczone dla dużych indeksów, które nie zmieniają się bardzo często. Podstawowym kompromisem jest większe opóźnienie zapytań, które należy zweryfikować pod kątem określonych wymagań aplikacji.

Więcej informacji na temat różnych warstw można znaleźć na stronie cennika, w artykule Limity usługi w usłudze Azure AI Search oraz na stronie portalu podczas aprowizowania usługi.

Dostępność regionów według warstwy

Lista obsługiwanych regionów zawiera lokalizacje, w których jest oferowana usługa Azure AI Search.

Obecnie kilka regionów znajduje się w pojemności dla określonych warstw i nie można ich używać w przypadku nowych usług wyszukiwania. Jeśli używasz witryny Azure Portal do tworzenia usługi wyszukiwania, portal wyklucza wszystkie kombinacje warstwy regionu, które nie są dostępne.

Region (Region)	Wyłączono warstwę (SKU) z powodu nadmiernej pojemności	Sugerowana alternatywa
Wschodnie stany USA 2	Podstawowa, S1	Środkowe stany USA
South Central US	Wszystkie warstwy	Środkowe stany USA
US Gov Wirginia	Wszystkie warstwy	US Gov Arizona
West Europe	Wszystkie warstwy	Szwecja Środkowa/Europa Północna
Zachodnie stany USA 3	Podstawowa, S1	Środkowe stany USA

Dostępność funkcji według warstwy

Większość funkcji jest dostępna we wszystkich warstwach, w tym w warstwie Bezpłatna. W kilku przypadkach warstwa określa dostępność funkcji. W poniższej tabeli opisano ograniczenia.

Funkcja	Zagadnienia dotyczące warstw
Indeksatory	Indeksatory nie są dostępne w usłudze S3 HD. Indeksatory mają więcej ograniczeń w warstwie Bezpłatna.
parametr konfiguracji indeksatora `executionEnvironment`	Możliwość przypinania całego przetwarzania indeksatora tylko do klastrów wyszukiwania przydzielonych do usługi wyszukiwania wymaga S2 i nowszych.
Wzbogacanie sztucznej inteligencji	Działa w warstwie Bezpłatna, ale nie jest to zalecane.
Tożsamości zarządzane lub zaufane na potrzeby dostępu wychodzącego (indeksatora)	Niedostępne w warstwie Bezpłatna.
Klucze szyfrowania zarządzane przez klienta	Niedostępne w warstwie Bezpłatna.
Dostęp do zapory ip	Niedostępne w warstwie Bezpłatna.
Prywatny punkt końcowy (integracja z usługą Azure Private Link)	W przypadku połączeń przychodzących z usługą wyszukiwania nie jest dostępna w warstwie Bezpłatna. W przypadku połączeń wychodzących przez indeksatory do innych zasobów platformy Azure nie są dostępne w warstwie Bezpłatna lub S3 HD. W przypadku indeksatorów korzystających z zestawów umiejętności, które nie są dostępne w warstwie Bezpłatna, Podstawowa, S1 lub S3 HD.
Strefy dostępności	Niedostępne w warstwie Bezpłatna lub Podstawowa.
Ranga semantyczna	Niedostępne w warstwie Bezpłatna.

Funkcje intensywnie korzystające z zasobów mogą nie działać prawidłowo, chyba że zapewnisz jej wystarczającą pojemność. Na przykład wzbogacanie sztucznej inteligencji ma długotrwałe umiejętności, które przekroczyły limit czasu bezpłatnej usługi, chyba że zestaw danych jest mały.

Górne limity

Warstwy określają maksymalny magazyn samej usługi oraz maksymalną liczbę indeksów, indeksatorów, źródeł danych, zestawów umiejętności i map synonimów, które można utworzyć. Aby uzyskać pełny podział wszystkich limitów, zobacz Limity usług w usłudze Azure AI Search.

Rozmiar partycji i szybkość

Cennik warstw zawiera szczegółowe informacje o magazynie na partycje, które wahają się od 15 GB dla warstwy Podstawowa, do 2 TB dla warstw zoptymalizowanych pod kątem magazynu (L2). Inne cechy sprzętu, takie jak szybkość operacji, opóźnienia i szybkość transferu, nie są publikowane, ale warstwy przeznaczone dla określonych architektur rozwiązań są oparte na sprzęcie, który ma funkcje do obsługi tych scenariuszy. Aby uzyskać więcej informacji na temat partycji, zobacz Szacowanie pojemności i niezawodność oraz zarządzanie nią w usłudze Azure AI Search.

Uwaga

Partycje o większej pojemności stały się dostępne w wybranych regionach od kwietnia 2024 r. Druga fala wyższych partycji pojemności wydanych w maju 2024 r. Jeśli używasz starszej usługi wyszukiwania, rozważ utworzenie nowej usługi wyszukiwania, aby skorzystać z większej pojemności przy użyciu tej samej stawki rozliczeniowej. Aby uzyskać więcej informacji, zobacz Limity usługi. Aby sprawdzić wiek usługi wyszukiwania, zobacz Jak sprawdzić datę utworzenia usługi.

Stawki rozliczeniowe

Warstwy mają różne stawki rozliczeniowe, z wyższymi stawkami dla warstw, które działają na droższym sprzęcie lub oferują droższe funkcje. Stawkę rozliczeń warstw można znaleźć na stronach cennika platformy Azure dla usługi Azure AI Search.

Po utworzeniu usługi stawka rozliczeniowa staje się zarówno stałym kosztem uruchamiania usługi przez całą dobę, jak i kosztem przyrostowym, jeśli zdecydujesz się dodać więcej pojemności.

usługa wyszukiwania są przydzielane zasoby obliczeniowe w postaci partycji (dla magazynu) i replik (wystąpień aparatu zapytań). Początkowo usługa jest tworzona przy użyciu jednego z nich, a stawka rozliczeniowa obejmuje oba zasoby. Jednak w przypadku skalowania pojemności koszty spadną w górę lub w dół w przyrostach stawki rozliczanej.

Poniższy przykład stanowi ilustrację. Załóżmy hipotetyczną stawkę rozliczeniową w wysokości 100 USD miesięcznie. Jeśli zachowasz usługę wyszukiwania w początkowej pojemności jednej partycji i jednej repliki, wówczas 100 USD będzie płacić na koniec miesiąca. Jeśli jednak dodasz jeszcze dwie repliki, aby uzyskać wysoką dostępność, miesięczny rachunek wzrośnie do 300 USD (100 USD dla pierwszej pary repliki-partycji, a następnie 200 USD dla dwóch replik).

Ten model rozliczeń opiera się na koncepcji stosowania stawki rozliczeniowej do liczby jednostek wyszukiwania (SU) używanych przez usługę wyszukiwania. Wszystkie usługi są początkowo aprowidowane w jednej jednostki SU, ale można zwiększyć liczbę jednostek jednostki SU, dodając partycje lub repliki do obsługi większych obciążeń. Aby uzyskać więcej informacji, zobacz Jak oszacować koszty usługi wyszukiwania.

Uaktualnianie lub obniżanie poziomu warstwy

Nie ma wbudowanej obsługi uaktualniania ani obniżania warstw. Jeśli chcesz przełączyć się na inną warstwę, podejście to:

Utwórz nową usługę wyszukiwania w nowej warstwie.
Wdróż zawartość wyszukiwania w nowej usłudze. Postępuj zgodnie z tą listą kontrolną, aby upewnić się, że masz całą zawartość.
Usuń starą usługę wyszukiwania po upewnieniu się, że nie jest już potrzebna.

W przypadku dużych indeksów, których nie chcesz ponownie kompilować od podstaw, rozważ użycie przykładu tworzenia kopii zapasowej i przywracania, aby je przenieść.

Następne kroki

Najlepszym sposobem wyboru warstwy cenowej jest rozpoczęcie od warstwy o najniższych kosztach, a następnie umożliwienie środowiska i testowania informowanie o decyzji o utrzymaniu usługi lub utworzeniu nowej warstwy w wyższej warstwie. W przypadku następnych kroków zalecamy utworzenie usługi wyszukiwania w warstwie, która może pomieścić proponowany poziom testowania, a następnie zapoznaj się z poniższymi wskazówkami dotyczącymi szacowania kosztów i pojemności.

Udostępnij za pośrednictwem