Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Maksymalne limity magazynu, obciążeń i ilości indeksów i innych obiektów zależą od warstwy cenowej usługi Azure AI Search:
Bezpłatna to wielodostępna usługa udostępniona dostarczana z subskrypcją platformy Azure.
Warstwa Podstawowa udostępnia dedykowane zasoby obliczeniowe dla obciążeń produkcyjnych na mniejszą skalę.
Standardowa działa na dedykowanych maszynach z większą pojemnością magazynu i przetwarzania na każdym poziomie. Standard ma cztery poziomy: S1, S2, S3 i S3 HD. S3 Wysoka gęstość (S3 HD) jest przeznaczona dla wielu dzierżaw i dużych ilości małych indeksów (3000 indeksów na usługę). Usługa S3 HD nie obsługuje indeksatorów, dlatego pozyskiwanie danych musi używać interfejsów API, które wypychają dane ze źródła do indeksu.
Zoptymalizowane pod kątem magazynu działa na dedykowanych maszynach z większą łączną ilością miejsca do magazynowania, przepustowością magazynu i pamięcią niż w warstwie Standardowa. Ta warstwa jest przeznaczona dla dużych, zmieniających się powoli indeksów. Opcja Zoptymalizowana pod kątem pamięci masowej jest dostępna na dwóch poziomach: L1 i L2.
Limity subskrypcji
Możesz utworzyć wiele rozliczanych usług wyszukiwania (Podstawowe i wyższe), do maksymalnej liczby usług dozwolonej na każdym poziomie, w każdym regionie. Można na przykład utworzyć maksymalnie 16 usług w warstwie Podstawowa i kolejne 16 usług w warstwie S1 w ramach tej samej subskrypcji i regionu. Następnie można utworzyć dodatkowe 16 podstawowych usług w innym regionie dla łącznie 32 usług Podstawowych w ramach tej samej subskrypcji. Aby uzyskać więcej informacji na temat warstw, zobacz Wybieranie warstwy (lub jednostki SKU) dla usługi Azure AI Search.
Maksymalne limity usług można zgłaszać na żądanie. Jeśli potrzebujesz większej liczby usług w ramach tej samej subskrypcji, zgłoś wniosek o pomoc techniczną.
| Zasób | Bezpłatna 1 | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Maksymalna liczba usług na region | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
| Maksymalna liczba jednostek wyszukiwania (SU)2 | Nie dotyczy | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Możesz mieć jedną bezpłatną usługę wyszukiwania na subskrypcję platformy Azure. Warstwa Bezpłatna jest oparta na infrastrukturze udostępnionej innym klientom. Ponieważ sprzęt nie jest dedykowany, skalowanie w górę nie jest obsługiwane, a magazyn jest ograniczony do 50 MB. Bezpłatna usługa wyszukiwania może zostać usunięta po dłuższym okresie braku aktywności, aby zwolnić miejsce na więcej usług.
2 Jednostki wyszukiwania (SU) to jednostki rozliczeniowe przydzielone jako replikalub partycja. Potrzebujesz obu tych elementów. Aby dowiedzieć się więcej na temat kombinacji SU, zobacz Szacowanie oraz zarządzanie pojemnością usługi wyszukiwania.
Limity usługi
W poniższej tabeli opisano umowy o poziomie usług (SLA), liczbę partycji i replik na poziomie usługi.
| Zasób | Bezpłatna | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Umowa dotycząca poziomu usług (SLA) | Nie. | Tak | Tak | Tak | Tak | Tak | Tak | Tak |
| Partycje | Nie dotyczy | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
| Repliki | Nie dotyczy | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Warstwa Podstawowa obsługuje trzy partycje i trzy repliki, w sumie dziewięć jednostek wyszukiwania (SU) w nowych usługach wyszukiwania utworzonych po 3 kwietnia 2024 r. Starsze usługi podstawowe są ograniczone do jednej partycji i trzech replik.
Usługa wyszukiwania podlega maksymalnemu limitowi magazynu (rozmiarowi partycji pomnożonemu przez liczbę partycji) lub przez sztywny limit maksymalnej liczby indeksów lub indeksatorów, w zależności od tego, co nastąpi wcześniej.
Umowy dotyczące poziomu usług (SLA) mają zastosowanie do rozliczanych usług, które mają co najmniej dwie repliki dla obciążeń zapytań lub co najmniej trzy repliki dla obciążeń zapytań i indeksowania. Liczba partycji nie jest uwzględniana w ramach SLA. Aby uzyskać więcej informacji, zobacz Niezawodność w usłudze Azure AI Search.
Bezpłatne usługi nie mają stałych partycji ani replik i udostępniają zasoby innym subskrybentom.
Rozmiar partycji (GB)
Limity magazynu dla usługi różnią się w zależności od dwóch rzeczy: daty utworzenia usługi i regionu. Istnieją wyższe limity dla nowszych usług w większości obsługiwanych regionów.
W tej tabeli przedstawiono postęp zwiększania limitu miejsca na dysku w GB w czasie. Począwszy od kwietnia 2024 r., partycje o większej pojemności zostały wprowadzone do użytku w regionach wymienionych w przypisach. Jeśli masz starszą usługę z obsługiwanego regionu, sprawdź, czy możesz uaktualnić usługę do wyższych limitów przechowywania.
| Data utworzenia usługi | Basic | S1 | S2 | S3/HD | L1 | L2 |
|---|---|---|---|---|---|---|
| Przed 3 kwietnia 2024 r. | 2 | 25 | 100 | 200 | 1,024 | 2048 |
| 3 kwietnia 2024 r. do 17 maja 2024 r. | 15 | 160 | 512 | 1,024 | 1,024 | 2048 |
| Po 17 maja 2024 r. | 15 | 160 | 512 | 1,024 | 2,048 | 4,096 |
| Po 10 lutego 2025 3 | 15 | 160 | 512 | 1,024 | 2048 | 4,096 |
1 Magazyn o wyższej pojemności dla warstwy Podstawowa, S1, S2, S3 w tych regionach. Ameryki: Brazylia Południowa, Kanada Środkowa, Kanada Wschodnia, Wschodnie stany USA, Wschodnie stany USA 2, Środkowe stany USA, Północno-środkowe stany USA, Południowo-środkowe stany USA, Zachodnie stany USA, Zachodnie stany USA 2, Zachodnie stany USA 3, Zachodnio-środkowe stany USA. Europa: Francja Środkowa. Włochy Północne, Europa Północna, Norwegia Wschodnia, Polska Środkowa, Szwajcaria Północna, Szwecja Środkowa, Zjednoczone Królestwo Południowe, Zachodnie Zjednoczone Królestwo. Bliski Wschód: Północ ZEA. Afryka: Republika Południowej Afryki Północnej. Azja i Pacyfik: Australia Wschodnia, Australia Południowo-Wschodnia, Indie Środkowe, Jio Indie Zachodnie, Azja Wschodnia, Azja Południowo-Wschodnia, Japonia Wschodnia, Japonia Zachodnia, Korea Środkowa, Korea Południowa.
2 Magazyn o wyższej pojemności dla L1 i L2. Więcej regionów zapewnia większą pojemność w każdej warstwie rozliczanej. Ameryka: Wschodnie stany USA 2 EUAP. Europa: Niemcy Północne, Niemcy Zachodnio-Środkowe, Szwajcaria Zachodnia. Azure Government: Texas, Arizona, Virginia. Afryka: Północna część Republiki Południowej Afryki. Azja i Pacyfik: Chiny Północne 3, Chiny Wschodnie 3.
3 Magazyn o zwiększonej pojemności jest dostępny w Europie Zachodniej.
Ważne
Obecnie wyższe limity magazynu nie są dostępne w następujących regionach, które podlegają limitom przed 3 kwietnia.
- Izrael Środkowy
- Katar Środkowy
- Hiszpania Środkowa
- Indie Południowe
Limity indeksów
| Zasób | Bezpłatna | Podstawowa 1 | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Maksymalna liczba indeksów | 3 | 5 lub 15 | 50 | 200 | 200 | 1000 na partycję lub 3000 na usługę | 10 | 10 |
| Maksymalna liczba prostych pól na indeks 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
| Maksymalne wymiary na pole wektora | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 |
| Maksymalna liczba złożonych kolekcji na indeks | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
| Maksymalna liczba elementów we wszystkich złożonych kolekcjach na dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
| Maksymalna głębokość pól złożonych | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
| Maksymalna liczba sugestorów na indeks | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
| Maksymalna liczba profilów oceniania na indeks | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
| Maksymalna liczba konfiguracji semantycznych na indeks | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
| Maksymalna liczba funkcji na profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
| Maksymalny rozmiar indeksu 4 | Nie dotyczy | Nie dotyczy | Nie dotyczy | 1,88 TB | 2,34 TB | 100 GB | Nie dotyczy | Nie dotyczy |
1 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów. Warstwa Podstawowa to jedyna warstwa z niższym limitem 100 pól na indeks.
2 Górny limit pól obejmuje zarówno pola pierwszego poziomu, jak i zagnieżdżone podpola w złożonej kolekcji. Jeśli na przykład indeks zawiera 15 pól i ma dwie złożone kolekcje z pięcioma polami podrzędnymi, liczba pól indeksu wynosi 25. Indeksy z bardzo dużą kolekcją pól mogą być powolne. Ogranicz pola i atrybuty tylko do tych, których potrzebujesz, i uruchom indeksowanie i test zapytań, aby upewnić się, że wydajność jest akceptowalna.
3 Istnieje górny limit dla elementów, ponieważ duża ich liczba znacznie zwiększa magazyn wymagany dla indeksu. Element kolekcji złożonej jest definiowany jako element członkowski tej kolekcji. Załóżmy na przykład, że dokument związany z hotelem zawierający złożoną kolekcję pokoi. Każdy pokój w kolekcji Rooms jest traktowany jako element. Podczas indeksowania aparat indeksowania może bezpiecznie przetworzyć maksymalnie 3000 elementów w całym dokumencie.
Ten limit został wprowadzony w api-version=2019-05-06 systemie i dotyczy tylko złożonych kolekcji, a nie kolekcji ciągów lub złożonych pól.
4 W przypadku większości poziomów maksymalny rozmiar indeksu to całkowita dostępna przestrzeń magazynowa w usłudze wyszukiwania. W przypadku usług S2, S3 i S3 HD z wieloma partycjami, a tym samym więcej miejsca do magazynowania, maksymalny rozmiar pojedynczego indeksu znajduje się w tabeli. Dotyczy usług wyszukiwania utworzonych po 3 kwietnia 2024 r.
W przypadku aprowizacji usługi w klastrze o większej mocy możesz znaleźć pewne różnice w limitach maksymalnych. Limity w tym miejscu reprezentują wspólny mianownik. Indeksy utworzone zgodnie z powyższymi specyfikacjami są przenośne w równoważnych warstwach usług w dowolnym regionie.
Limity dokumentów
Maksymalna liczba dokumentów na indeks to:
- 24 miliardy w warstwie Podstawowa, S1, S2, S3
- 2 miliardy na S3 HD
- 288 miliardów na L1
- 576 miliardów na L2
Maksymalny rozmiar każdego dokumentu wynosi około 16 megabajtów. Rozmiar dokumentu jest w rzeczywistości ograniczeniem rozmiaru ładunku żądania interfejsu API indeksowania, który wynosi 16 megabajtów. Ten ładunek może być pojedynczym dokumentem lub partią dokumentów. W przypadku partii z jednym dokumentem maksymalny rozmiar dokumentu wynosi 16 MB w formacie JSON.
Rozmiar dokumentu ma zastosowanie do indeksowania w trybie 'push', które przesyła dokumenty do usługi wyszukiwania. Jeśli używasz indeksatora do indeksowania w trybie ściągania, pliki źródłowe mogą mieć dowolny rozmiar pliku, z zastrzeżeniem limitów indeksatora. W przypadku indeksatora obiektów blob limity rozmiaru plików są większe dla wyższych warstw. Na przykład limit S1 wynosi 128 megabajtów, limit S2 wynosi 256 megabajtów itd.
Podczas szacowania rozmiaru dokumentu pamiętaj, aby indeksować tylko pola, które dodają wartość do scenariuszy wyszukiwania. Wyklucz pola źródłowe, które nie mają celu w zapytaniach, które mają być uruchamiane.
Limity rozmiaru indeksu wektorowego
Podczas indeksowania dokumentów z polami wektorowymi usługa Azure AI Search konstruuje wewnętrzne indeksy wektorów przy użyciu dostarczonych parametrów algorytmu. Rozmiar tych indeksów wektorów jest ograniczony przez pamięć zarezerwowaną na wyszukiwanie wektorowe dla poziomu usługi (lub SKU). Aby uzyskać wskazówki dotyczące zarządzania i maksymalizacji magazynu wektorów, zobacz Rozmiar indeksu wektora i pozostawanie w granicach.
Limity wektorów różnią się w zależności od:
Wyższe limity wektorów od kwietnia 2024 r. istnieją w nowych usługach wyszukiwania w regionach zapewniających dodatkową pojemność, która jest w większości z nich. Jeśli masz starszą usługę w obsługiwanym regionie, sprawdź, czy możesz uaktualnić usługę do wyższych limitów wektorów.
W tej tabeli przedstawiono postęp zwiększenia limitu przydziału wektorów w GB w czasie. Limit przydziału jest na partycję, więc w przypadku skalowania nowej usługi w warstwie Standardowa (S1) do 6 partycji łączny limit przydziału wektorów jest 35 pomnożony przez 6.
| Data utworzenia usługi | Basic | S1 | S2 | S3/HD | L1 | L2 |
|---|---|---|---|---|---|---|
| Przed 1 lipca 2023 r.1 | 0,5 | 1 | 6 | 12 | 12 | 36 |
| 1 lipca 2023 r. do 3 kwietnia 2024 r. | 1 | 3 | 12 | 36 | 12 | 36 |
| 3 kwietnia 2024 r. do 17 maja 2024 r. | 5 | 35 | 150 | 300 | 12 | 36 |
| Po 17 maja 2024r. 4 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Początkowe limity wektorów podczas wczesnej wersji zapoznawczej.
2 Limity wektorów w późniejszym okresie obowiązywania wersji zapoznawczej. Trzy regiony nie miały wyższych limitów: Niemcy Zachodnio-środkowe, Indie Zachodnie, Katar Środkowy.
3 Wyższe limity przydziału wektorów na podstawie większych partycji dla obsługiwanych warstw i regionów.
4 Wyższe limity przydziału wektorów dla większej liczby warstw i regionów na podstawie aktualizacji rozmiaru partycji.
Usługa wymusza limit przydziału rozmiaru indeksu wektorowego dla każdej partycji w usłudze wyszukiwania. Każda dodatkowa partycja zwiększa dostępny limit przydziału rozmiaru indeksu wektorowego. Ten limit przydziału jest ścisłym ograniczeniem, które zapewnia, że usługa działa prawidłowo, co oznacza, że dalsze próby indeksowania po przekroczeniu limitu spowodują niepowodzenie. Indeksowanie można wznowić po zwolnieniu dostępnego limitu przydziału przez usunięcie niektórych dokumentów wektorowych lub zwiększenie liczby partycji.
Ważne
Wyższe limity wektorów są powiązane z większymi rozmiarami partycji. Obecnie wyższe limity wektorów nie są dostępne w następujących regionach, które podlegają limitom z lipca do kwietnia.
- Izrael Środkowy
- Katar Środkowy
- Hiszpania Środkowa
- Indie Południowe
Limity indeksatora
Maksymalny czas wykonywania ma na celu zapewnienie równowagi i stabilności całej usługi, ale większe zestawy danych mogą wymagać czasu indeksowania dłuższego niż dozwolony czas maksymalny. Jeśli zadanie indeksowania nie może zostać ukończone w maksymalnym dozwolonym czasie, spróbuj uruchomić je zgodnie z harmonogramem. Program harmonogramowania śledzi stan indeksowania. Jeśli zaplanowane zadanie indeksowania zostanie przerwane z jakiegokolwiek powodu, indeksator może kontynuować w miejscu, w którym zostało przerwane przy następnym zaplanowanym wykonaniu.
| Zasób | Bezpłatna 1 | Podstawowa 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Maksymalna liczba indeksatorów | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
| Maksymalna liczba źródeł danych | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
| Maksymalnie 4 zestawy umiejętności 4 | 3 | 5 lub 15 | 50 | 200 | 200 | Nie dotyczy | 10 | 10 |
| Maksymalne obciążenie indeksowania na wywołanie | 10 000 dokumentów | Ograniczone wyłącznie przez maksymalną liczbę dokumentów | Ograniczone wyłącznie przez maksymalną liczbę dokumentów | Ograniczone wyłącznie przez maksymalną liczbę dokumentów | Ograniczone wyłącznie przez maksymalną liczbę dokumentów | Nie dotyczy | Brak ograniczeń | Brak ograniczeń |
| Podstawowy harmonogram | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut |
| Maksymalny czas działania 5 | 1-3 lub 3-10 minut | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | 2 lub 24 godziny | Nie dotyczy | 2 lub 24 godziny | 2 lub 24 godziny |
| Indeksator blobów 7: maksymalny rozmiar bloba, MB | 16 | 16 | 128 | 256 | 256 | Nie dotyczy | 256 | 256 |
| Indeksator obiektów blob: maksymalna liczba znaków zawartości wyodrębnionej z obiektu blob 68 | 256,000 | 512 000 | 4 miliony | 8 mln | 16 milionów | Nie dotyczy | 4 miliony | 4 miliony |
1 Bezpłatne usługi mają maksymalny czas wykonywania indeksatora wynoszący 3 minuty dla źródeł obiektów blob i 1 minutę dla wszystkich innych źródeł danych. Wywołanie indeksatora jest co 180 sekund. W przypadku indeksowania sztucznej inteligencji, który wywołuje narzędzia Foundry Tools, bezpłatne usługi są ograniczone do 20 bezpłatnych transakcji na indeksator dziennie, gdzie transakcja jest zdefiniowana jako dokument, który pomyślnie przechodzi przez potok wzbogacania. (Porada: Możesz zresetować indeksator, aby zresetować jego liczbę).
2 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksatorów, źródeł danych i zestawów umiejętności.
3 Usługi S3 HD nie obejmują obsługi indeksatora.
4 Maksymalnie 30 umiejętności na zestaw umiejętności.
5 Jeśli chodzi o maksymalny czas trwania 2 lub 24 godzin dla indeksatorów: 2-godzinny maksymalny jest najbardziej typowy i jest to, co należy zaplanować. Odwołuje się on do indeksatorów uruchamianych w środowisku publicznym, które odciąża przetwarzanie intensywnie korzystające z obliczeń i pozostawia więcej zasobów dla zapytań. Limit 24-godzinny ma zastosowanie w przypadku skonfigurowania indeksatora do działania w środowisku prywatnym przy użyciu tylko infrastruktury przydzielonej do usługi wyszukiwania. Niektóre starsze indeksatory nie są w stanie działać w środowisku publicznym, a indeksatory zawsze mają 24-godzinny zakres przetwarzania. Jeśli masz nieplanowane indeksatory, które działają w sposób ciągły przez 24 godziny, możesz założyć, że nie można migrować tych indeksatorów do nowszej infrastruktury. Ogólnie rzecz biorąc, dla zadań indeksowania, które nie mogą zakończyć się w ciągu dwóch godzin, należy ustawić dla indeksatora harmonogram na 5 minut, aby mógł szybko kontynuować od miejsca, gdzie zakończył. W warstwie Bezpłatna maksymalny czas wykonywania wynoszący 3–10 minut jest przeznaczony dla indeksatorów z zestawami umiejętności.
6 Maksymalna liczba znaków jest oparta na jednostkach kodu Unicode, w szczególności UTF-16.
7 W przypadku korzystania z delimitedText trybu analizowania plików CSV stosowany jest limit rozmiaru buforu 10 MB na wiersz pliku.
8 W przypadku korzystania z delimitedText trybu analizowania plików CSV nie ma zastosowania limit "maksymalny rozmiar wyodrębnionej zawartości".
Uwaga
Zgodnie z opisem w temacie Limity indeksów indeksatory wymuszają również górny limit 3000 elementów we wszystkich złożonych kolekcjach na dokument, począwszy od najnowszej wersji interfejsu API ga obsługującej złożone typy (2019-05-06). Oznacza to, że w przypadku utworzenia indeksatora z poprzednią wersją interfejsu API nie będzie można podlegać temu limitowi. Aby zachować maksymalną zgodność, indeksator utworzony przy użyciu wcześniejszej wersji interfejsu API, a następnie zaktualizowany o wersję 2019-05-06 interfejsu API lub nowszą, nadal będzie wykluczony z limitów. Klienci powinni pamiętać o negatywnym wpływie bardzo dużych złożonych kolekcji (jak wspomniano wcześniej) i zdecydowanie zalecamy utworzenie nowych indeksatorów z najnowszą wersją interfejsu API ga.
Limity zasobów udostępnionego łącza prywatnego
Indeksatory mogą uzyskiwać dostęp do innych zasobów platformy Azure za pośrednictwem prywatnych punktów końcowych zarządzanych za pośrednictwem udostępnionego interfejsu API zasobu łącza prywatnego. W tej sekcji opisano limity skojarzone z tą funkcją.
| Zasób | Bezpłatna | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Obsługa indeksatora prywatnego punktu końcowego | Nie. | Tak | Tak | Tak | Tak | Nie. | Tak | Tak |
| Obsługa prywatnego punktu końcowego dla indeksatorów z zestawem umiejętności 1 | Nie. | Nie. | Tak | Tak | Tak | Nie. | Tak | Tak |
| Obsługa prywatnego punktu końcowego dla zestawów umiejętności z umiejętnościami osadzania 2 | Nie. | Tak | Tak | Tak | Tak | Nie. | Tak | Tak |
| Maksymalna liczba prywatnych punktów końcowych | Nie dotyczy | 10 lub 30 | 100 | 400 | 400 | Nie dotyczy | 20 | 20 |
| Maksymalna liczba unikatowych typów zasobów 3 | Nie dotyczy | 4 | 7 | 15 | 15 | Nie dotyczy | 4 | 4 |
1 Wzbogacanie sztucznej inteligencji i analiza obrazów są intensywnie obciążające obliczenia i zużywają nieproporcjonalne ilości dostępnej mocy obliczeniowej. Z tego powodu połączenia prywatne są wyłączone w niższych warstwach, aby zapewnić wydajność i stabilność samej usługi wyszukiwania. W przypadku usług podstawowych prywatne połączenia z zasobem Microsoft Foundry nie są obsługiwane w celu zachowania stabilności usługi. W przypadku warstwy S1 upewnij się, że usługa została utworzona z wyższymi limitami po 3 kwietnia 2024 r. Indeksatory z więcej niż 2 funkcjami osadzania Azure OpenAI lub osadzania wielomodalnego Azure Vision nie mogą być uruchamiane w środowisku prywatnym, i połączenia prywatne nie są dostępne.
2 Prywatne połączenia z modelem osadzania są obsługiwane w wysokowydajnych usługach wyszukiwania kategorii Podstawowa i S1, utworzonych po 3 kwietnia 2024 r., z wyższymi limitami dla przechowywania danych i przetwarzania obliczeniowego.
3 Liczba różnych typów zasobów jest obliczana jako liczba unikatowych groupId wartości używanych we wszystkich udostępnionych zasobach łącza prywatnego dla danej usługi wyszukiwania, niezależnie od stanu zasobu.
Limity synonimów
Maksymalna liczba map synonimów różni się w zależności od warstwy. Każda reguła może mieć maksymalnie 20 rozszerzeń, gdzie rozszerzenie jest równoważnym terminem. Na przykład, biorąc pod uwagę "kot", skojarzenie z "kitty", "kot" i "felis" (rodzaj kotów) będzie liczyć jako 3 rozszerzenia.
| Zasób | Bezpłatna | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Maksymalna liczba map synonimów | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
| Maksymalna liczba reguł na mapę | pięć tysięcy | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Limity aliasów indeksu
Maksymalna liczba aliasów indeksu zależy od daty utworzenia warstwy i usługi. W przypadku wszystkich warstw, jeśli usługa została utworzona po październiku 2022 r., maksymalna liczba aliasów jest dwukrotnie większa niż maksymalna liczba dozwolonych indeksów. Jeśli usługa została utworzona przed październikiem 2022 r., limit jest dozwoloną liczbą indeksów.
| Data utworzenia usługi | Bezpłatna | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Przed październikiem 2022 r. | 3 | 5 lub 15 1 | 50 | 200 | 200 | 1000 na partycję lub 3000 na usługę | 10 | 10 |
| Po październiku 2022 r. | 6 | 30 | 100 | 400 | 400 | 2000 na partycję lub 6000 na usługę | 20 | 20 |
1 Podstawowe usługi utworzone przed grudniem 2017 r. mają niższe limity (5 zamiast 15) dla indeksów.
Limity pobierania danych agenta
Baza wiedzy określa co najmniej jedno źródło wiedzy i wysiłek wnioskowania przy pobieraniu, który kontroluje poziom przetwarzania dużego modelu językowego (LLM) na potrzeby agentycznego pobierania. Limity różnią się w zależności od warstwy cenowej i poziomu nakładu pracy rozumowania.
| Zasób | Bezpłatna | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|---|
| Maksymalna liczba źródeł wiedzy na usługę | 3 | 5 lub 15 1 | 50 | 200 | 200 | 0 | 10 | 10 |
| Maksymalna liczba baz wiedzy na usługę | 3 | 5 lub 15 1 | 50 | 200 | 200 | 0 | 10 | 10 |
Maksymalna liczba źródeł wiedzy na bazę wiedzy (minimal) 2 |
3 | 5 lub 10 1 | 10 | 10 | 10 | 0 | 10 | 10 |
Maksymalna liczba źródeł wiedzy na bazę wiedzy (low) |
3 | 3 | 3 | 3 | 3 | 0 | 3 | 3 |
Maksymalna liczba źródeł wiedzy na bazę wiedzy (medium) |
3 | 5 | 5 | 5 | 5 | 0 | 5 | 5 |
1 Podstawowe usługi utworzone przed 3 kwietnia 2024 r. mają niższe limity (5) dotyczące źródeł wiedzy i baz wiedzy.
2 Wysiłek minimal rozumowania obsługuje więcej źródeł wiedzy niż low lub medium dlatego, że pomija planowanie zapytań opartych na LLM.
Limity danych (wzbogacanie sztucznej inteligencji)
Limity danych mają zastosowanie do potoku wzbogacania sztucznej inteligencji, który wykonuje wywołania usługi Azure Language in Foundry Tools na potrzeby rozpoznawania jednostek, łączenia jednostek, wyodrębniania kluczowych fraz, analizy tonacji, wykrywania języka i wykrywania informacji osobistych. Maksymalna wielkość rekordu powinna wynosić 50 000 znaków, mierzona za pomocą String.Length. Jeśli musisz podzielić dane przed wysłaniem ich do analizatora tonacji, użyj funkcji Dzielenie tekstu.
Limity przepustowości
Żądania interfejsu API są ograniczane, ponieważ system zbliża się do maksymalnej wydajności. Ograniczanie działa inaczej dla różnych API. Interfejsy API zapytań (wyszukiwanie/sugerowanie/autouzupełnianie) oraz indeksowania są dynamicznie ograniczane na podstawie obciążenia systemu. Interfejsy API indeksu i interfejs API operacji usług mają statyczne limity szybkości żądań.
Statyczne limity żądań szybkości dla operacji związanych z indeksem:
- Indeksy listy (GET /indexes): 3 na sekundę na jednostkę wyszukiwania
- Pobieranie indeksu (GET /indexes/myindex): 10 na sekundę na jednostkę wyszukiwania
- Tworzenie indeksu (POST /indexes): 12 na minutę na jednostkę wyszukiwania
- Tworzenie lub aktualizowanie indeksu (PUT /indexes/myindex): 6 na sekundę na jednostkę wyszukiwania
- Usuń indeks (DELETE /indexes/myindex): 12 na minutę na jednostkę wyszukiwania
Statyczne limity żądań szybkości dla operacji związanych z usługą:
- Statystyki usługi (GET /servicestats): 4 na sekundę na jednostkę wyszukiwania
Limity ograniczania klasyfikacji semantycznej
Punktator semantyczny używa systemu kolejkowania do zarządzania współbieżnymi żądaniami. Ten system umożliwia usługom wyszukiwania uzyskanie największej liczby zapytań na sekundę. Po osiągnięciu limitu współbieżnych żądań dodatkowe żądania są umieszczane w kolejce. Jeśli kolejka jest pełna, kolejne żądania są odrzucane i muszą zostać ponowione.
Całkowita liczba zapytań semantycznych na sekundę różni się w zależności od następujących czynników:
- Poziom usługi wyszukiwania. Zarówno pojemność kolejki, jak i limity żądań współbieżnych różnią się w zależności od warstwy.
- Liczba jednostek wyszukiwania w usłudze wyszukiwania. Najprostszym sposobem zwiększenia maksymalnej liczby współbieżnych zapytań przez semantyczny rangator jest dodanie kolejnych jednostek wyszukiwania do usługi.
- Łączna dostępna pojemność klasyfikatora semantycznego w regionie.
- Czas potrzebny na obsługę zapytania przy użyciu klasyfikatora semantycznego. Różni się to w zależności od tego, jak zajęta jest usługa wyszukiwania.
W poniższej tabeli opisano limity ograniczania klasyfikacji semantycznej według warstwy, z uwzględnieniem dostępnej pojemności w regionie. Możesz skontaktować się z pomocą techniczną firmy Microsoft, aby poprosić o zwiększenie limitu.
| Zasób | Basic | S1 | S2 | S3 | S3 (wysoka gęstość) | L1 | L2 |
|---|---|---|---|---|---|---|---|
| Maksymalna liczba współbieżnych żądań (na jednostkę wyszukiwania) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
| Maksymalny rozmiar kolejki żądań (na jednostkę wyszukiwania) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Limity żądań interfejsu API
Istnieją limity zapytań, ponieważ niezwiązane zapytania mogą zdestabilizować usługę wyszukiwania. Zazwyczaj takie zapytania są tworzone programowo. Jeśli aplikacja generuje zapytania wyszukiwania programowo, zalecamy zaprojektowanie go w taki sposób, aby nie generował zapytań o niezwiązany rozmiar.
Limity ładunków istnieją z podobnych powodów, zapewniając stabilność usługi wyszukiwania. Limit dotyczy całego żądania, włącznie ze wszystkimi jego składnikami. Na przykład, jeśli żądanie łączy kilka dokumentów lub poleceń, całe żądanie musi mieścić się w obsługiwanym limicie.
Jeśli musisz przekroczyć obsługiwany limit, należy przetestować obciążenie , aby wiedzieć, czego się spodziewać.
Z wyjątkiem przypadków, w których zaznaczono, następujące żądania interfejsu API dotyczą wszystkich programowalnych interfejsów, w tym zestawów SDK platformy Azure.
Ogólne:
- Obsługiwany maksymalny limit ładunku to 16 MB na potrzeby indeksowania i wysyłania zapytań za pośrednictwem interfejsu API REST i zestawów SDK.
- Maksymalna długość adresu URL 8 KB (dotyczy tylko interfejsów API REST).
API indeksowania
- Obsługiwane maksymalnie 1000 dokumentów na partię przekazywania indeksu, scalania lub usuwania.
- Każde żądanie obsługuje od 1 do 32 000 akcji indeksowania.
Interfejsy API zapytań:
- Maksymalnie 10 pól w zapytaniu wektorowym
- Maksymalnie 32 pola w klauzuli $orderby.
- Maksymalnie 100 000 znaków w klauzuli wyszukiwania.
- Maksymalna liczba klauzul w wyszukiwaniu wynosi 3000.
- Maksymalne limity dla zapytań z użyciem wildcard i wyrażeń regularnych, zgodnie z ograniczeniami wymuszanymi przez Lucene. Limituje liczbę wzorców, odmian lub dopasowań do 1000 wystąpień. Ten limit jest obowiązujący, aby uniknąć przeciążenia silnika.
Wyszukiwane terminy:
- Obsługiwany maksymalny rozmiar terminu wyszukiwania to 32 766 bajtów (32 KB minus 2 bajty) zakodowanego tekstu UTF-8. Dotyczy wyszukiwania słów kluczowych i właściwości tekstowej wyszukiwania wektorowego.
- Obsługiwany maksymalny rozmiar terminu wyszukiwania to 1000 znaków dla wyszukiwania prefiksów i wyszukiwania wyrażeń regularnych.
Limity odpowiedzi interfejsu API
- Maksymalnie 1000 dokumentów na stronę wyników wyszukiwania
- Maksymalnie 100 sugestii zwracanych na każde żądanie API Suggest
Aparat wyszukiwania zwraca domyślnie 50 wyników, ale można zastąpić ten parametr do maksymalnego limitu.
Limity kluczy interfejsu API
Klucze interfejsu API są używane do uwierzytelniania usługi. Są dwa typy. Klucze administratora są określone w nagłówku żądania i zapewniają pełny dostęp do odczytu i zapisu do usługi. Klucze zapytań są tylko do odczytu określone w adresie URL i zwykle dystrybuowane do aplikacji klienckich.
- Maksymalnie 2 klucze administracyjne na usługę
- Maksymalnie 50 kluczy zapytań na usługę