Limity usług w usłudze Azure AI Search

Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od tego, czy tworzysz usługę Azure AI Search w warstwach cenowych Bezpłatna, Podstawowa, Standardowa czy Zoptymalizowana pod kątem magazynu.

  • Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.

  • Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę, ale udostępnia infrastrukturę sieciową innym dzierżawcom.

  • Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie zapewnia funkcji indeksatora, a pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.

  • Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Zoptymalizowane pod kątem magazynu są dostępne na dwóch poziomach: L1 i L2.

Limity subskrypcji

Można utworzyć wiele rozliczanych usług wyszukiwania (podstawowa i wyższa) do maksymalnej liczby usług dozwolonych w każdej warstwie. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.

Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.

Zasób Bezpłatna 1 Podstawowy S1 S2 S3 S3 (wysoka gęstość) L1 L2
Maksymalna liczba usług 1 16 16 8 6 6 6 6
Maksymalna liczba jednostek wyszukiwania (SU)2 Nie dotyczy 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB.

2 Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replikalub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji jednostek jednostki organizacyjnej, zobacz Szacowanie pojemności usługi wyszukiwania i zarządzanie nią.

Limity usługi

usługa wyszukiwania limity magazynu, partycji i replik różnią się w zależności od daty utworzenia usługi, a wyższe limity dla nowszych usług w obsługiwanych regionach.

Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.

Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług mających co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w umowie SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.

Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.

Przed 3 kwietnia 2024 r.

Zasób Bezpłatna Podstawowy S1 S2 S3 S3 (wysoka gęstość) L1 L2
Umowa dotycząca poziomu usług (SLA) Nie. Tak Tak Tak Tak Tak Tak Tak
Magazyn (rozmiar partycji) 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partycje Nie dotyczy 1 12 12 12 3 12 12
Repliki Nie dotyczy 3 12 12 12 12 12 12

Po 3 kwietnia 2024 r.

W przypadku nowych usług utworzonych po 3 kwietnia 2024 r.:

  • Warstwa Podstawowa może mieć maksymalnie trzy partycje i trzy repliki oraz łącznie dziewięć jednostek wyszukiwania (SU).
  • Podstawowa, S1, S2, S3 ma więcej miejsca na partycję, począwszy od 3–7 razy więcej, w zależności od warstwy.
  • Aby uzyskać dodatkową pojemność dla warstw Podstawowa i inne warstwy, nowa usługa wyszukiwania musi znajdować się w obsługiwanym regionie .

Obecnie nie ma uaktualnienia w miejscu. Należy utworzyć nową usługę wyszukiwania, aby korzystać z dodatkowego magazynu.

Zasób Bezpłatna Podstawowy S1 S2 S3 S3 (wysoka gęstość) L1 L2
Umowa dotycząca poziomu usług (SLA) Nie. Tak Tak Tak Tak Tak Tak Tak
Magazyn (rozmiar partycji) 50 MB 15 GB 160 GB 350 GB 700 GB 700 GB 1 TB 2 TB
Partycje Nie dotyczy 3 12 12 12 3 12 12
Repliki Nie dotyczy 3 12 12 12 12 12 12

Obsługiwane regiony z wyższymi limitami magazynu

Usługi utworzone po 3 kwietnia 2024 r. muszą znajdować się w jednym z następujących regionów, aby uzyskać dodatkowy magazyn. Obejrzyj ogłoszenia w artykule Co nowego w usłudze Azure AI Search , aby uzyskać rozszerzenie do innych regionów.

Kraj Regiony zapewniające dodatkową pojemność na partycję
Stany Zjednoczone Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA
Zjednoczone Królestwo Południowe Zjednoczone Królestwo, Zachodnie Zjednoczone Królestwo
Zjednoczone Emiraty Arabskie (ZEA) Zjednoczone Emiraty Arabskie Na Północ
Szwajcaria Szwajcaria Zachodnia
Szwecja Szwecja Środkowa
Polska Polska Środkowa
Norwegia Norwegia Wschodnia
Korea Południowa Korea Środkowa, Korea Południowa
Japonia Japonia Wschodnia, Japonia Zachodnia
Włochy Włochy Północne
Indie Indie Środkowe, Jio Indie Zachodnie
Francja Francja Środkowa
Europa Europa Północna
Kanada Kanada Środkowa, Kanada Wschodnia
Bazil Brazylia Południowa
Azja i Pacyfik Azja Wschodnia, Azja Południowo-Wschodnia
Australia Australia Wschodnia, Australia Południowo-Wschodnia

Limity indeksów

Zasób Bezpłatna Podstawowa 1 S1 S2 S3 S3 (wysoka gęstość) L1 L2
Maksymalna liczba indeksów 3 5 lub 15 50 200 200 1000 na partycję lub 3000 na usługę 10 10
Maksymalna liczba prostych pól na indeks 2 1000 100 1000 1000 1000 1000 1000 1000
Maksymalne wymiary na pole wektora 3072 3072 3072 3072 3072 3072 3072 3072
Maksymalna liczba złożonych kolekcji na indeks 40 40 40 40 40 40 40 40
Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maksymalna głębokość pól złożonych 10 10 10 10 10 10 10 10
Maksymalna liczba sugestorów na indeks 1 1 1 1 1 1 1 1
Maksymalna liczba profilów oceniania na indeks 100 100 100 100 100 100 100 100
Maksymalna liczba funkcji na profil 8 8 8 8 8 8 8 8
Maksymalny rozmiar indeksu 4 Brak NIE DOTYCZY Brak 1,92 TB 2,4 TB 100 GB Brak Brak

1 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.

2 Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone pola podrzędne w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.

3 Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument hotelowy z złożoną kolekcją Rooms każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie. Ten limit został wprowadzony w api-version=2019-05-06 systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.

4 W większości warstw maksymalny rozmiar indeksu jest dostępny w usłudze wyszukiwania. W przypadku S2, S3 i S3 HD maksymalny rozmiar dowolnego indeksu to liczba podana w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.

W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.

Limity dokumentów

W usługach wyszukiwania Basic, S1, S2, S3, L1 i L2 można mieć około 24 miliardów dokumentów na indeks. W przypadku usługi S3 HD limit wynosi 2 miliardy dokumentów na indeks. Każde wystąpienie złożonej kolekcji jest liczone jako oddzielny dokument pod względem tych limitów.

Limity rozmiaru dokumentu na wywołanie interfejsu API

Maksymalny rozmiar dokumentu podczas wywoływania interfejsu API indeksowania wynosi około 16 megabajtów.

Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru treści żądania interfejsu API indeksowania. Ponieważ można przekazać partię wielu dokumentów do interfejsu API indeksowania jednocześnie, limit rozmiaru jest realistycznie zależny od liczby dokumentów w partii. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.

Podczas szacowania rozmiaru dokumentu należy wziąć pod uwagę tylko te pola, które mogą być używane przez usługę wyszukiwania. Wszystkie dane binarne lub dane obrazu w dokumentach źródłowych powinny zostać pominięte w obliczeniach.

Limity rozmiaru indeksu wektorowego

Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną dla wyszukiwania wektorowego dla warstwy usługi (lub SKU).

Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest trudnym limitem, który gwarantuje, że usługa pozostaje w dobrej kondycji, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowoduje niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub skalowanie w górę w partycjach.

W tabeli opisano limit przydziału rozmiaru indeksu wektorowego na partycję w różnych warstwach usług. Kontekst obejmuje następujące elementy:

  • Partycjonuj limity magazynu dla każdej warstwy powtórzone tutaj w kontekście.
  • Ilość każdej partycji (w GB) dostępna dla indeksów wektorów (tworzonych podczas dodawania pól wektorowych do indeksu).
  • Przybliżona liczba osadzonych (wartości zmiennoprzecinkowych) na partycję.

Użyj statystyk usługi GET, aby pobrać limit przydziału rozmiaru indeksu wektorowego lub przejrzeć stronę Indeksy lub kartę Użycie w witrynie Azure Portal.

Limity wektorów różnią się w zależności od daty i warstwy tworzenia usługi. Aby sprawdzić wiek usługi wyszukiwania i dowiedzieć się więcej o indeksach wektorów, zobacz Vector index size and staying under limits (Rozmiar indeksu wektora i pozostawanie w granicach).

Limity wektorów dla usług utworzonych po 3 kwietnia 2024 r. w obsługiwanych regionach

Najwyższe limity wektorów są dostępne w usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. w obsługiwanym regionie.

Warstwa Limit przydziału magazynu (GB) Przydział wektorów na partycję (GB) Około liczby zmiennoprzecinkowe na partycję (przy założeniu 15% obciążenia)
Podstawowy 15 5 1100 milionów
S1 160 35 8200 mln
S2 350 100 23 500 milionów
S3 700 200 47 000 milionów
L1 1000 12 2800 milionów
L2 2000 36 8400 milionów

Zauważ, że limity L1 i L2 pozostają niezmienione w 3 kwietnia.

Limity wektorów dla usług utworzonych między 1 lipca 2023 r. a 3 kwietnia 2024 r.

Następujące limity stosowane do nowych usług utworzonych między 1 a 3 kwietnia 2024 r., z wyjątkiem następujących regionów, które mają pierwotne limity od 1 lipca 2023 r.:

  • Niemcy Środkowo-Zachodnie
  • Indie Zachodnie
  • Katar Środkowy

Wszystkie inne regiony mają następujące limity:

Warstwa Limit przydziału magazynu (GB) Przydział wektorów na partycję (GB) Około liczby zmiennoprzecinkowe na partycję (przy założeniu 15% obciążenia)
Podstawowy 2 1 235 mln
S1 25 3 700 milionów
S2 100 12 2800 milionów
S3 200 36 8400 milionów
L1 1000 12 2800 milionów
L2 2000 36 8400 milionów

Limity wektorów dla usług utworzonych przed 1 lipca 2023 r.

Warstwa Limit przydziału magazynu (GB) Przydział wektorów na partycję (GB) Około liczby zmiennoprzecinkowe na partycję (przy założeniu 15% obciążenia)
Podstawowy 2 0.5 115 milionów
S1 25 1 235 mln
S2 100 6 1400 milionów
S3 200 12 2800 milionów
L1 1000 12 2800 milionów
L2 2000 36 8400 milionów

Limity indeksatora

Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Harmonogram śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może odebrać miejsce, w którym ostatnio zostało przerwane przy następnym zaplanowanym uruchomieniu.

Zasób Bezpłatna 1 Podstawowa 2 S1 S2 S3 S3 HD 3 L1 L2
Maksymalna liczba indeksatorów 3 5 lub 15 50 200 200 Nie dotyczy 10 10
Maksymalna liczba źródeł danych 3 5 lub 15 50 200 200 Nie dotyczy 10 10
Maksymalna liczba zestawów umiejętności 4 3 5 lub 15 50 200 200 Nie dotyczy 10 10
Maksymalne obciążenie indeksowania na wywołanie 10 000 dokumentów Ograniczone tylko przez maksymalną liczbę dokumentów Ograniczone tylko przez maksymalną liczbę dokumentów Ograniczone tylko przez maksymalną liczbę dokumentów Ograniczone tylko przez maksymalną liczbę dokumentów Nie dotyczy Brak ograniczeń Brak ograniczeń
Minimalny harmonogram 5 min 5 min 5 min 5 min 5 min 5 min 5 min 5 min
Maksymalny czas działania 5 1–3 minuty 2 lub 24 godziny 2 lub 24 godziny 2 lub 24 godziny 2 lub 24 godziny Nie dotyczy 2 lub 24 godziny 2 lub 24 godziny
Maksymalny czas wykonywania indeksatorów z zestawem umiejętności 6 3–10 minut 2 godziny 2 godziny 2 godziny 2 godziny Nie dotyczy 2 godziny 2 godziny
Indeksator obiektów blob: maksymalny rozmiar obiektu blob, MB 16 16 128 256 256 Nie dotyczy 256 256
Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob 32,000 64,000 4 miliony 8 mln 16 milionów Nie dotyczy 4 miliony 4 miliony

1 Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, które wywołuje usługi Azure AI, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania (porada: możesz zresetować indeksator, aby zresetować jego liczbę).

2 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.

3 Usługi S3 HD nie obejmują obsługi indeksatora.

4 Maksymalnie 30 umiejętności na zestaw umiejętności.

5 Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Limit 24-godzinny pochodzi ze starszej implementacji indeksatora. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, w przypadku zadań indeksowania, które nie mogą zostać zakończone w ciągu dwóch godzin, należy umieścić indeksator w harmonogramie 2-godzinnym. Po zakończeniu pierwszego interwału 2-godzinnego indeksator pobiera miejsce, w którym został przerwany podczas uruchamiania następnego 2-godzinnego interwału.

6 Wykonywanie zestawu umiejętności, a w szczególności analiza obrazów jest intensywnie obciążane obliczeniami i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Czas pracy dla tych obciążeń został skrócony, aby dać innym zadniom w kolejce więcej możliwości uruchamiania.

Uwaga

Jak określono w limitach indeksów, indeksatory będą również wymuszać górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ogólnie dostępnej, która obsługuje typy złożone (2019-05-06). Oznacza to, że jeśli indeksator został utworzony z wcześniejszą wersją interfejsu API, nie będzie podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06 interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.

Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.

Zasób Bezpłatna Podstawowy S1 S2 S3 S3 (wysoka gęstość) L1 L2
Obsługa indeksatora prywatnego punktu końcowego Nie. Tak Tak Tak Tak Nie Tak Tak
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawemumiejętności 1 Nie Nie. Nie. Tak Tak Nie Tak Tak
Maksymalna liczba prywatnych punktów końcowych Nie dotyczy 10 lub 30 100 400 400 Nie dotyczy 20 20
Maksymalna liczba unikatowych typówzasobów 2 Nie dotyczy 100 7 15 15 Nie dotyczy 4 4

1 Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania.

2 Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.

Limity synonimów

Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.

Zasób Bezpłatna Podstawowy S1 S2 S3 S3-HD L1 L2
Maksymalna liczba map synonimów 3 3 5 10 20 20 10 10
Maksymalna liczba reguł na mapę 5000 20000 20000 20000 20000 20000 20000 20000

Limity aliasów indeksu

Maksymalna liczba aliasów indeksu różni się w zależności od warstwy. We wszystkich warstwach maksymalna liczba aliasów jest dwukrotnie liczbą dozwolonych indeksów.

Zasób Bezpłatna Podstawowy S1 S2 S3 S3-HD L1 L2
Maksymalna liczba aliasów 6 10 lub 30 100 400 400 2000 na partycję lub 6000 na usługę 20 20

Limity danych (wzbogacanie sztucznej inteligencji)

Potok wzbogacania sztucznej inteligencji, który wykonuje wywołania zasobu języka AI platformy Azure na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych podlega limitom danych. Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj umiejętności Dzielenie tekstu.

Limity ograniczania przepustowości

Żądania interfejsu API są ograniczane, ponieważ system zbliża się do szczytowej pojemności. Ograniczanie działa inaczej dla różnych interfejsów API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) i indeksowanie interfejsów API są dynamicznie ograniczane na podstawie obciążenia usługi. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.

Statyczne limity żądań szybkości dla operacji związanych z indeksem:

  • Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
  • Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
  • Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
  • Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
  • Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania

Statyczne limity żądań szybkości dla operacji związanych z usługą:

  • Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania

Limity żądań interfejsu API

  • Maksymalnie 16 MB na żądanie 1
  • Maksymalna długość adresu URL 8 KB
  • Maksymalnie 1000 dokumentów na partię przekazywania, scalania lub usuwania indeksu
  • Maksymalnie 32 pola w klauzuli $orderby
  • Maksymalnie 100 000 znaków w klauzuli wyszukiwania
  • Maksymalna liczba klauzul ( search w wyrażeniach oddzielonych znakami AND lub OR) wynosi 1024
  • Maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu w formacie UTF-8
  • Maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych
  • Wyszukiwanie symboli wieloznacznych i wyszukiwanie wyrażeń regularnych jest ograniczone do maksymalnie 1000 stanów przetwarzanych przez lucene.

1 W usłudze Azure AI Search treść żądania podlega górnemu limitowi 16 MB, nakładając praktyczny limit zawartości poszczególnych pól lub kolekcji, które nie są w inny sposób ograniczone przez limity teoretyczne (zobacz Obsługiwane typy danych, aby uzyskać więcej informacji na temat kompozycji i ograniczeń pól).

Istnieją limity rozmiaru i kompozycji zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.

Limity odpowiedzi interfejsu API

  • Maksymalnie 1000 dokumentów zwracanych na stronę wyników wyszukiwania
  • Maksymalna liczba sugestii zwróconych na żądanie interfejsu API sugerowanego: 100

Limity kluczy interfejsu API

Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy analizatorów. Administracja klucze są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.

  • Maksymalnie 2 klucze administracyjne na usługę
  • Maksymalnie 50 kluczy zapytań na usługę