Limity usług w usłudze Azure AI Search

Artykuł
07.01.2025

Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od tego, czy tworzysz usługę Azure AI Search w warstwach cenowych Bezpłatna, Podstawowa, Standardowa czy Zoptymalizowana pod kątem magazynu.

Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.
Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę, ale udostępnia infrastrukturę sieciową innym dzierżawcom.
Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie zapewnia funkcji indeksatora, a pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.
Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Zoptymalizowane pod kątem magazynu są dostępne na dwóch poziomach: L1 i L2.

Limity subskrypcji

Można utworzyć wiele rozliczanych usług wyszukiwania (podstawowa i wyższa), maksymalnie maksymalną liczbę usług dozwolonych w każdej warstwie na region. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji i regionu. Następnie można utworzyć dodatkowe 16 podstawowych usług w innym regionie dla łącznie 32 usług Podstawowych w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.

Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.

Zasób	Bezpłatna ¹	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Maksymalna liczba usług na region	1	16	16	8	6	6	6	6
Maksymalna liczba jednostek wyszukiwania (SU)²	Nie dotyczy	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB. Bezpłatna usługa wyszukiwania może zostać usunięta po dłuższym okresie braku aktywności, aby zwolnić miejsce na więcej usług.

² Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replikalub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji jednostek jednostki organizacyjnej, zobacz Szacowanie pojemności usługi wyszukiwania i zarządzanie nią.

Limity usługi

W poniższej tabeli opisano umowy SLA, liczby partycji i liczby replik na poziomie usługi.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Umowa dotycząca poziomu usług (SLA)	Nie.	Tak	Tak	Tak	Tak	Tak	Tak	Tak
Partycje	Nie dotyczy	3 ¹	12	12	12	3	12	12
Repliki	Nie dotyczy	3	12	12	12	12	12	12

¹ Warstwa Podstawowa obsługuje trzy partycje i trzy repliki, w sumie dziewięć jednostek wyszukiwania (SU) w nowych usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. Starsze usługi podstawowe są ograniczone do jednej partycji i trzech replik.

Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.

Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług mających co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w umowie SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.

Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.

Partycjonowanie magazynu (GB)

Limity magazynu dla usługi różnią się w zależności od dwóch rzeczy: daty utworzenia usługi i regionu. Istnieją wyższe limity dla nowszych usług w większości obsługiwanych regionów.

W tej tabeli przedstawiono postęp zwiększenia limitu przydziału magazynu w GB w czasie. Partycje o większej pojemności zostały przeniesione do trybu online od kwietnia 2024 r. w regionach wymienionych w przypisach. Większa pojemność jest ograniczona do nowych usług wyszukiwania. Obecnie nie ma uaktualnienia w miejscu.

Data utworzenia usługi	Podstawowy	S1	S2	S3/HD	L1	L2
Przed 3 kwietnia 2024 r.	2	25	100	200	1,024	2048
3 kwietnia 2024 r. do 17 maja 2024 ^r.	15	160	512	1,024	1,024	2048
Po 17 maja 2024 ^r.	15	160	512	1,024	2,048	4,096
Po 10 lutego 2025 ^{r. 3}	15	160	512	1,024	2048	4,096

¹ Magazyn o wyższej pojemności dla warstwy Podstawowa, S1, S2, S3 w tych regionach. Ameryki: Brazylia Południowa, Kanada Środkowa, Kanada Wschodnia, Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA. Europa: Francja Środkowa. Włochy Północne, Europa Północna, Norwegia Wschodnia, Polska Środkowa, Szwajcaria Północna, Szwecja Środkowa, Zjednoczone Królestwo Południowe, Zachodnie Zjednoczone Królestwo. Bliski Wschód: Północ ZEA. Afryka: Republika Południowej Afryki Północnej. Azja i Pacyfik: Australia Wschodnia, Australia Południowo-Wschodnia, Indie Środkowe, Jio Indie Zachodnie, Azja Wschodnia, Azja Południowo-Wschodnia, Japonia Wschodnia, Japonia Zachodnia, Korea Środkowa, Korea Południowa.

² Magazyn o wyższej pojemności dla L1 i L2. Więcej regionów zapewnia większą pojemność w każdej warstwie rozliczanej. Europa: Niemcy Północne, Niemcy Zachodnio-Środkowe, Szwajcaria Zachodnia. Azure Government: Texas, Arizona, Virginia. Afryka: Republika Południowej Afryki Północnej. Azja i Pacyfik: Chiny Północne 3, Chiny Wschodnie 3.

³ Magazyn o większej pojemności jest dostępny w regionie Europa Zachodnia.

Kilka regionów nadal działa w starszej infrastrukturze, z zastrzeżeniem limitów 3 kwietnia. Przed utworzeniem nowej usługi sprawdź obsługiwane regiony , aby upewnić się, że wybrany region zapewnia dodatkową pojemność.

Limity indeksów

Zasób	Bezpłatna	Podstawowa ¹	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Maksymalna liczba indeksów	3	5 lub 15	50	200	200	1000 na partycję lub 3000 na usługę	10	10
Maksymalna liczba prostych pól na indeks ²	1000	100	1000	1000	1000	1000	1000	1000
Maksymalne wymiary na pole wektora	4098	4098	4098	4098	4098	4098	4098	4098
Maksymalna liczba złożonych kolekcji na indeks	40	40	40	40	40	40	40	40
Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument ³	3000	3000	3000	3000	3000	3000	3000	3000
Maksymalna głębokość pól złożonych	10	10	10	10	10	10	10	10
Maksymalna liczba sugestorów na indeks	1	1	1	1	1	1	1	1
Maksymalna liczba profilów oceniania na indeks	100	100	100	100	100	100	100	100
Maksymalna liczba funkcji na profil	8	8	8	8	8	8	8	8
Maksymalny rozmiar indeksu ⁴	Brak	NIE DOTYCZY	Brak	1,88 TB	2,34 TB	100 GB	Brak	Brak

¹ Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.

² Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone pola podrzędne w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.

³ Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument hotelowy z złożoną kolekcją Rooms każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie. Ten limit został wprowadzony w api-version=2019-05-06 systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.

⁴ W większości warstw maksymalny rozmiar indeksu jest dostępny w usłudze wyszukiwania. W przypadku S2, S3 i S3 HD maksymalny rozmiar dowolnego indeksu to liczba podana w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.

W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.

Limity dokumentów

Maksymalna liczba dokumentów na indeks to:

24 miliardy w warstwie Podstawowa, S1, S2, S3
2 miliardy na S3 HD
288 miliardów na L1
576 miliardów na L2

Maksymalny rozmiar każdego dokumentu wynosi około 16 megabajtów. Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru ładunku żądania interfejsu API indeksowania, który wynosi 16 megabajtów. Ten ładunek może być pojedynczym dokumentem lub partią dokumentów. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.

Rozmiar dokumentu ma zastosowanie do indeksowania w trybie wypychania, które przekazuje dokumenty do usługi wyszukiwania. Jeśli używasz indeksatora do indeksowania w trybie ściągania, pliki źródłowe mogą mieć dowolny rozmiar pliku, z zastrzeżeniem limitów indeksatora. W przypadku indeksatora obiektów blob limity rozmiaru plików są większe dla wyższych warstw. Na przykład limit S1 wynosi 128 megabajtów, limit S2 wynosi 256 megabajtów itd.

Podczas szacowania rozmiaru dokumentu pamiętaj, aby indeksować tylko te pola, które dodają wartość do scenariuszy wyszukiwania, i wykluczyć wszystkie pola źródłowe, które nie mają celu w zapytaniach, które mają być uruchamiane.

Limity rozmiaru indeksu wektorowego

Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną dla wyszukiwania wektorowego dla warstwy usługi (lub SKU). Aby uzyskać wskazówki dotyczące zarządzania i maksymalizacji magazynu wektorów, zobacz Rozmiar indeksu wektora i pozostawanie w granicach.

Limity wektorów różnią się w zależności od:

Wyższe limity wektorów od kwietnia 2024 r. istnieją w nowych usługach wyszukiwania w regionach zapewniających dodatkową pojemność, która jest w większości z nich.

W tej tabeli przedstawiono postęp zwiększenia limitu przydziału wektorów w GB w czasie. Limit przydziału jest na partycję, więc w przypadku skalowania nowej usługi w warstwie Standardowa (S1) do 6 partycji łączny limit przydziału wektorów jest pomnożony przez 6.

Data utworzenia usługi	Podstawowy	S1	S2	S3/HD	L1	L2
Przed 1 lipca 2023^{r. 1}	0.5	1	6	12	12	36
1 lipca 2023 r. do 3 kwietnia 2024^r.	1	3	12	36	12	36
3 kwietnia 2024 r. do 17 maja 2024^r.	5	35	150	300	12	36
Po 17 maja 2024^{r. 4}	5	35	150	300	150	300

¹ Początkowe limity wektorów podczas wczesnej wersji zapoznawczej.

² Limity wektorów w późniejszym okresie obowiązywania wersji zapoznawczej. Trzy regiony nie miały wyższych limitów: Niemcy Zachodnio-środkowe, Indie Zachodnie, Katar Środkowy.

³ Wyższe limity przydziału wektorów na podstawie większych partycji dla obsługiwanych warstw i regionów.

⁴ Wyższe limity przydziału wektorów dla większej liczby warstw i regionów na podstawie aktualizacji rozmiaru partycji.

Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest trudnym limitem, który gwarantuje, że usługa pozostaje w dobrej kondycji, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowoduje niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub skalowanie w górę w partycjach.

Ważne

Wyższe limity wektorów są powiązane z większymi rozmiarami partycji. Regiony działające na starszej infrastrukturze podlegają limitom z lipca do kwietnia. Przejrzyj listę regionów, aby uzyskać stan limitów magazynu partycji.

Limity indeksatora

Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Harmonogram śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może odebrać miejsce, w którym ostatnio zostało przerwane przy następnym zaplanowanym uruchomieniu.

Zasób	Bezpłatna ¹	Podstawowa ²	S1	S2	S3	S3 HD ³	L1	L2
Maksymalna liczba indeksatorów	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalna liczba źródeł danych	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalna liczba zestawów ^{umiejętności 4}	3	5 lub 15	50	200	200	Nie dotyczy	10	10
Maksymalne obciążenie indeksowania na wywołanie	10 000 dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Ograniczone tylko przez maksymalną liczbę dokumentów	Nie dotyczy	Brak ograniczeń	Brak ograniczeń
Minimalny harmonogram	5 min	5 min	5 min	5 min	5 min	5 min	5 min	5 min
Maksymalny czas ^{działania 5}	1-3 lub 3-10 minut	2 lub 24 godziny	2 lub 24 godziny	2 lub 24 godziny	2 lub 24 godziny	Nie dotyczy	2 lub 24 godziny	2 lub 24 godziny
Indeksator obiektów blob: maksymalny rozmiar obiektu blob, MB	16	16	128	256	256	Nie dotyczy	256	256
Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob ⁶	32,000	64,000	4 miliony	8 mln	16 milionów	Nie dotyczy	4 miliony	4 miliony

¹ Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, które wywołuje usługi Azure AI, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania (porada: możesz zresetować indeksator, aby zresetować jego liczbę).

² Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.

³ Usługi S3 HD nie obejmują obsługi indeksatora.

⁴ Maksymalnie 30 umiejętności na zestaw umiejętności.

⁵ Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Odnosi się do indeksatorów uruchamianych w środowisku publicznym, używanych do odciążania przetwarzania intensywnie korzystającego z obliczeń i pozostawiania większej ilości zasobów dla zapytań. Limit 24-godzinny ma zastosowanie w przypadku skonfigurowania indeksatora do działania w środowisku prywatnym przy użyciu tylko infrastruktury przydzielonej do usługi wyszukiwania. Należy pamiętać, że niektóre starsze indeksatory nie są w stanie działać w środowisku publicznym, a indeksatory zawsze mają 24-godzinny zakres przetwarzania. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, możesz założyć, że nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, w przypadku zadań indeksowania, które nie mogą zakończyć się w ciągu dwóch godzin, umieść indeksator w harmonogramie 5 minut, aby indeksator mógł szybko odebrać miejsce, w którym został przerwany. W warstwie Bezpłatna maksymalny czas wykonywania wynoszący 3–10 minut jest przeznaczony dla indeksatorów z zestawami umiejętności.

⁶ Maksymalna liczba znaków jest oparta na jednostkach kodu Unicode, w szczególności UTF-16.

Uwaga

Jak określono w limitach indeksów, indeksatory będą również wymuszać górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ogólnie dostępnej, która obsługuje typy złożone (2019-05-06). Oznacza to, że jeśli indeksator został utworzony z wcześniejszą wersją interfejsu API, nie będzie podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06 interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.

Limity zasobów udostępnionego łącza prywatnego

Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3 (wysoka gęstość)	L1	L2
Obsługa indeksatora prywatnego punktu końcowego	Nie.	Tak	Tak	Tak	Tak	Nie	Tak	Tak
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawem^{umiejętności 1}	Nie	Nie.	Nie.	Tak	Tak	Nie	Tak	Tak
Obsługa prywatnego punktu końcowego dla indeksatorów z zestawem umiejętności i zintegrowaną wektoryzacją ²	Nie.	Tak	Tak	Tak	Tak	Nie	Tak	Tak
Maksymalna liczba prywatnych punktów końcowych	Nie dotyczy	10 lub 30	100	400	400	Nie dotyczy	20	20
Maksymalna liczba unikatowych typów^{zasobów 3}	Nie dotyczy	100	7	15	15	Nie dotyczy	4	4

¹ Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania.

² Usługi o wysokiej pojemności utworzone po 3 kwietnia 2024 r. w regionach wymienionych w obszarze Magazyn partycji i uruchomione zintegrowane obciążenia wektoryzacji w czasie indeksowania obsługują udostępnione linki prywatne w warstwach płatnych. System musi wykryć co najmniej umiejętności osadzania danych.

³ Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.

Limity synonimów

Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.

Zasób	Bezpłatna	Podstawowy	S1	S2	S3	S3-HD	L1	L2
Maksymalna liczba map synonimów	3	3	5	10	20	20	10	10
Maksymalna liczba reguł na mapę	5000	20000	20000	20000	20000	20000	20000	20000

Limity aliasów indeksu

Maksymalna liczba aliasów indeksu zależy od daty utworzenia warstwy i usługi. We wszystkich warstwach, jeśli usługa została utworzona po październiku 2022 r., maksymalna liczba aliasów jest dwukrotnie liczbą dozwolonych indeksów. Jeśli usługa została utworzona przed październikiem 2022 r., limit jest dozwoloną liczbą indeksów.

Data utworzenia usługi	Bezpłatna	Podstawowy	S1	S2	S3	S3-HD	L1	L2
Przed październikiem 2022 r.	3	5 lub 15 ¹	50	200	200	1000 na partycję lub 3000 na usługę	10	10
Po październiku 2022 r.	6	30	100	400	400	2000 na partycję lub 6000 na usługę	20	20

¹ Usługi podstawowe utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) w indeksach

Limity danych (wzbogacanie sztucznej inteligencji)

Potok wzbogacania sztucznej inteligencji, który wykonuje wywołania zasobu języka AI platformy Azure na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych podlega limitom danych. Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj umiejętności Dzielenie tekstu.

Limity ograniczania przepustowości

Żądania interfejsu API są ograniczane, ponieważ system zbliża się do szczytowej pojemności. Ograniczanie działa inaczej dla różnych interfejsów API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) i indeksowanie interfejsów API są dynamicznie ograniczane na podstawie obciążenia usługi. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.

Statyczne limity żądań szybkości dla operacji związanych z indeksem:

Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania

Statyczne limity żądań szybkości dla operacji związanych z usługą:

Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania

Limity ograniczania klasyfikacji semantycznej

Semantyczny ranger używa systemu kolejkowania do zarządzania współbieżnych żądań. Ten system umożliwia usługom wyszukiwania uzyskanie największej liczby zapytań na sekundę. Po osiągnięciu limitu współbieżnych żądań dodatkowe żądania są umieszczane w kolejce. Jeśli kolejka jest pełna, kolejne żądania są odrzucane i muszą zostać ponowione.

Łączna liczba zapytań rangi semantycznej na sekundę różni się w zależności od następujących czynników:

Warstwa usługi wyszukiwania. Zarówno pojemność kolejki, jak i limity żądań współbieżnych różnią się w zależności od warstwy.
Liczba jednostek wyszukiwania w usłudze wyszukiwania. Najprostszym sposobem zwiększenia maksymalnej liczby współbieżnych zapytań rangą semantyczną jest dodanie kolejnych jednostek wyszukiwania do usługi wyszukiwania.
Łączna dostępna pojemność klasyfikatora semantycznego w regionie.
Czas potrzebny na obsługę zapytania przy użyciu klasyfikatora semantycznego. Różni się to w zależności od tego, jak zajęta jest usługa wyszukiwania.

W poniższej tabeli opisano limity ograniczania klasyfikacji semantycznej według warstwy, z uwzględnieniem dostępnej pojemności w regionie. Możesz skontaktować się z pomocą techniczną firmy Microsoft, aby poprosić o zwiększenie limitu.

Zasób	Podstawowy	S1	S2	S3	S3-HD	L1	L2
Maksymalna liczba współbieżnych żądań (na jednostkę wyszukiwania)	2	3	4	4	4	4	4
Maksymalny rozmiar kolejki żądań (na jednostkę wyszukiwania)	100	6	8	8	8	8	8

Limity żądań interfejsu API

Istnieją limity zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.

Limity ładunków istnieją z podobnych powodów, zapewniając stabilność usługi wyszukiwania. Limit dotyczy całego żądania, włącznie ze wszystkimi jego składnikami. Jeśli na przykład żądanie wsaduje kilka dokumentów lub poleceń, całe żądanie musi mieścić się w obsługiwanym limicie.

Jeśli musisz przekroczyć obsługiwany limit, należy przetestować obciążenie , aby wiedzieć, czego się spodziewać.

Z wyjątkiem przypadków, w których zaznaczono, następujące żądania interfejsu API dotyczą wszystkich programowalnych interfejsów, w tym zestawów SDK platformy Azure.

Ogólne:

Obsługiwany maksymalny limit ładunku to 16 MB na potrzeby indeksowania i wysyłania zapytań za pośrednictwem interfejsu API REST i zestawów SDK.
Maksymalna długość adresu URL 8 KB (dotyczy tylko interfejsów API REST).

Interfejsy API indeksowania:

Obsługiwane maksymalnie 1000 dokumentów na partię przekazywania indeksu, scalania lub usuwania.

Interfejsy API zapytań:

Maksymalnie 32 pola w klauzuli $orderby.
Maksymalnie 100 000 znaków w klauzuli wyszukiwania.
Maksymalna liczba klauzul w wyszukiwaniu wynosi 3000.
Maksymalne limity dla zapytań z symbolami wieloznacznymi i wyrażeniami regularnymi, zgodnie z wymuszanymi przez lucene. Limituje liczbę wzorców, odmian lub dopasowań do 1000 wystąpień. Ten limit jest obowiązujący, aby uniknąć przeciążenia silnika.

Wyszukiwane terminy:

Obsługiwany maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu UTF-8. Dotyczy wyszukiwania słów kluczowych i właściwości tekstowej wyszukiwania wektorowego.
Obsługiwany maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych.

Limity odpowiedzi interfejsu API

Maksymalnie 1000 dokumentów zwracanych na stronę wyników wyszukiwania
Maksymalna liczba sugestii zwróconych na żądanie interfejsu API sugerowanego: 100

Aparat wyszukiwania zwraca domyślnie 50 wyników, ale można zastąpić ten parametr do maksymalnego limitu.

Limity kluczy interfejsu API

Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy analizatorów. Klucze administratora są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.

Maksymalnie 2 klucze administracyjne na usługę
Maksymalnie 50 kluczy zapytań na usługę

Udostępnij za pośrednictwem