Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Maximální limity pro úložiště, pracovní zátěž a množství indexů a dalších objektů závisí na tom, zda vytvoříte Azure AI Search v cenových úrovních Free, Basic, Standard nebo Storage Optimized.
Free je sdílená služba pro více nájemců, která je součástí vašeho předplatného Azure.
Basic poskytuje dedikované výpočetní zdroje pro produkční zatížení v menším měřítku.
Standard běží na vyhrazených strojích s vyšší úložnou kapacitou a kapacitou zpracování na každé úrovni. Standard přichází ve čtyřech úrovních: S1, S2, S3 a S3 HD. S3 High Density (S3 HD) je navržen pro multi-tenancy a velké množství malých indexů (3 000 indexů na službu). S3 HD neposkytuje funkci indexeru a pro příjem dat je nutné používat API, které tlačí data ze zdroje do indexu.
Storage Optimized běží na dedikovaných strojích s větším celkovým úložištěm, šířkou pásma úložiště a pamětí než Standard. Tato úroveň cílí na velké, pomalu se měnící indexy. Úložiště Optimalizováno je k dispozici ve dvou úrovních: L1 a L2.
Limity předplatného
Můžete vytvořit více fakturovatelných vyhledávacích služeb (základních a vyšších), až do maximálního počtu služeb povoleného v každé úrovni, pro každý region. Například můžete vytvořit až 16 služeb v úrovni Basic a dalších 16 služeb v úrovni S1 v rámci stejného předplatného a regionu. Poté můžete vytvořit dalších 16 základních služeb v jiném regionu, což bude dohromady celkem 32 základních služeb v rámci stejného předplatného. Pro více informací o úrovních nahlédněte do Vyberte úroveň (nebo SKU) pro Azure AI Search.
Maximální limity služeb lze na vyžádání zvýšit. Pokud potřebujete další služby v rámci stejného předplatného, podejte žádost o podporu.
Zdroj | Zdarma 1 | Základní | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximální počet služeb na region | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maximální vyhledávací jednotky (SU)2 | není k dispozici | 3 SJ | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Na každé předplatné Azure můžete mít jednu bezplatnou vyhledávací službu. Bezplatná úroveň je založena na infrastruktuře sdílené s jinými zákazníky. Protože hardware není vyhrazený, škálování nahoru není podporováno a úložiště je omezeno na 50 MB. Bezplatná vyhledávací služba může být smazána po delších obdobích nečinnosti, aby se vytvořilo místo pro další služby.
2 Vyhledávací jednotky (SU) jsou fakturační jednotky, přidělené buď jako replika nebo jako část. Potřebujete obojí. Chcete-li se dozvědět více o kombinacích SU, podívejte se na Odhad a správa kapacity vyhledávací služby.
Limity služby
Následující tabulka se zabývá SLA, počtem oddílů a počtem replik na úrovni služby.
Zdroj | Bezplatný | Základní | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Smlouva o úrovni služeb (SLA) | Ne | Ano | Ano | Ano | Ano | Ano | Ano | Ano |
Oddíly | není k dispozici | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliky | není k dispozici | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Základní úroveň podporuje tři oddíly a tři repliky, tedy celkem devět vyhledávacích jednotek (VJ) na nových vyhledávacích službách vytvořených po 3. dubnu 2024. Starší základní služby jsou omezeny na jednu partition a tři repliky.
Služba vyhledávání podléhá maximálnímu limitu pro úložiště (velikost části vynásobená počtem částí) nebo pevnému limitu na maximální počet indexů nebo indexerů, podle toho, co nastane jako první.
Smlouvy o úrovni služeb (SLA) se vztahují na fakturovatelné služby, které mají dvě nebo více replik pro úlohy dotazů nebo tři nebo více replik pro úlohy dotazů a indexování. Počet oddílů není zohledněn v SLA. Pro více informací viz Reliability in Azure AI Search.
Bezplatné služby nemají pevné oddíly nebo repliky a sdílejí zdroje s ostatními účastníky.
Úložiště oddílu (GB)
Limity úložiště na službu se liší podle dvou věcí: data vytvoření služby a regionu. Existují vyšší limity pro novější služby ve většině podporovaných regionů.
Tato tabulka ukazuje postupné zvyšování kvóty úložiště v GB v průběhu času. Od dubna 2024 byly vysokokapacitní oddíly zprovozněny v regionech uvedených v poznámkách pod čarou. Pokud máte starší službu v podporovaném regionu, zjistěte, zda můžete svou službu vylepšit na vyšší limity úložiště.
Datum vytvoření služby | Základní | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Před 3. dubnem 2024 | 2 | 25 | 100 | 200 | 1,024 | 2 048 |
3. dubna 2024 až 17. května 2024 1 | 15 | 160 | 512 | 1,024 | 1,024 | 2 048 |
Po 17. květnu 2024 2 | 15 | 160 | 512 | 1,024 | 2,048 | 4,096 |
Po 10. únoru 2025 3 | 15 | 160 | 512 | 1,024 | 2 048 | 4,096 |
1 Vyšší kapacita úložiště pro Basic, S1, S2, S3 v těchto regionech. Amerika: Brazílie jih, Kanada střed, Kanada východ, Východní USA, Východní USA 2, Střední USA, Severní střed USA, Jižní střed USA, Západní USA, Západní USA 2, Západní USA 3, Západní střed USA. Evropa: Francie – střed. Itálie sever, Severní Evropa, Východní Norsko, Centrální Polsko, Severní Švýcarsko, Centrální Švédsko, Jihoanglie, Západní Anglie. Střední východ: Spojené arabské emiráty – sever. Afrika: Jižní Afrika – sever. Asie Tichomoří: Austrálie – východ, Austrálie – jihovýchod, Indie – střed, Jio Indie – západ, Východní Asie, Jihovýchodní Asie, Japonsko – východ, Japonsko – západ, Korea – střed, Korea – jih.
2 Úložiště s vyšší kapacitou pro L1 a L2. Více regionů poskytuje vyšší kapacitu na každé fakturační úrovni. Europe: Severní Německo, Středozápadní Německo, Západní Švýcarsko. Azure Government: Texas, Arizona, Virginia. Afrika: Jižní Afrika – sever. Asie a Tichomoří: Čína Sever 3, Čína Východ 3.
3 Úložiště s vyšší kapacitou je k dispozici v západní Evropě.
Důležité
V současné době nejsou vyšší limity úložiště dostupné v následujících oblastech, které podléhají limitům před 3. dubnem.
- Izrael – střed
- Střední Katar
- Španělsko – střed
- Indie – jih
Limity indexu
Zdroj | Bezplatný | Základní 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximální indexy | 3 | 5 nebo 15 | 50 | 200 | 200 | 1000 na oddíl nebo 3000 na službu | 10 | 10 |
Maximum jednoduchých polí na index 2 | 1 000 | 100 | 1 000 | 1 000 | 1 000 | 1 000 | 1 000 | 1 000 |
Maximální rozměry na vektorové pole | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 | 4096 |
Maximální počet komplexních kolekcí na index | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maximální počet prvků napříč všemi komplexními kolekcemi na dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maximální hloubka složitých polí | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maximum navrhovatelů na index | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maximální počet profilů hodnocení na index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maximální sémantická konfigurace na index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maximální počet funkcí na profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Maximální velikost indexu 4 | není k dispozici | není k dispozici | není k dispozici | 1,88 TB | 2,34 TB | 100 GB | není k dispozici | není k dispozici |
1 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) na indexy. Základní úroveň je jedinou úrovní, která má dolní limit 100 polí na index.
2 Horní limit polí zahrnuje jak pole první úrovně, tak vnořená podpole ve složité kolekci. Například pokud index obsahuje 15 polí a má dvě složitá kolekce, z nichž každá má pět podpolí, počet polí ve vašem indexu je 25. Indexy s velmi rozsáhlou kolekcí polí mohou být pomalé. Omezte pole a atributy pouze na ty, které potřebujete, a spusťte test indexace a dotazování, aby byla zajištěna přijatelná výkonnost.
3 Existuje horní limit pro prvky, protože velký počet z nich výrazně zvyšuje úložný prostor potřebný pro váš index. Prvkem složité kolekce je definován jako člen této kolekce. Například předpokládejme, že máte hotelský dokument s komplexní kolekcí pokojů, kde každý pokoj v této kolekci je považován za prvek. Během indexování může indexovací engine bezpečně zpracovat maximálně 3 000 prvků v rámci celého dokumentu.
Tento limit byl zaveden v api-version=2019-05-06
a vztahuje se pouze na složité kolekce, nikoli na kolekce řetězců nebo složité pole.
4 U většiny úrovní je maximální velikost indexu celková dostupná velikost úložiště ve vyhledávací službě. Pro služby S2, S3 a S3 HD s více oddíly a tedy větším úložištěm je v tabulce uvedena maximální velikost jednoho indexu. Platí pro vyhledávací služby vytvořené po 3. dubnu 2024.
Můžete zaznamenat určitou variabilitu v maximálních limitech, pokud je vaše služba zajištěna na výkonnějším klastru. Limity zde představují společného jmenovatele. Indexy vytvořené podle výše uvedených specifikací jsou přenosné napříč ekvivalentními servisními úrovněmi v jakékoli oblasti.
Limity dokumentu
Maximální počet dokumentů na index je:
- 24 miliard na Basic, S1, S2, S3
- 2 miliardy na S3 HD
- 288 miliard na L1
- 576 miliard na L2
Maximální velikost každého dokumentu je přibližně 16 megabajtů. Velikost dokumentu ve skutečnosti představuje limit velikosti uživatelského požadavku pro API indexaci, který je 16 megabajtů. Ten obsah může být jediný dokument nebo sada dokumentů. Pro dávku s jediným dokumentem je maximální velikost dokumentu 16 MB JSON.
Velikost dokumentu platí pro indexování v režimu push, což nahrává dokumenty na vyhledávací službu. Pokud používáte indexátor pro indexování ve stahovacím režimu, vaše zdrojové soubory mohou mít libovolnou velikost, ale musí splňovat omezení indexátoru. U indexeru blobů jsou limity velikosti souborů větší pro vyšší úrovně. Například limit pro S1 je 128 megabajtů, limit pro S2 je 256 megabajtů a tak dále.
Při odhadování velikosti dokumentu nezapomeňte indexovat pouze ta pole, která přinášejí hodnotu vašim vyhledávacím scénářům, a vyloučit všechna zdrojová pole, která nemají v úmyslu spuštěných dotazech žádný účel.
Limity velikosti vektorového indexu
Když indexujete dokumenty s vektorovými poli, Azure AI Search vytváří interní vektorové indexy pomocí parametrů algoritmu, které poskytnete. Velikost těchto vektorových indexů je omezena pamětí vyhrazenou pro vektorové vyhledávání pro úroveň vaší služby (nebo SKU
). Pro návod, jak spravovat a maximalizovat úložiště vektorů, viz Velikost indexu vektoru a zůstávání pod limity.
Limity vektorů se liší podle:
Vyšší vektorové limity od dubna 2024 existují na nových vyhledávacích službách v regionech poskytujících dodatečnou kapacitu, což je většina z nich. Pokud máte starší službu v podporované oblasti, zkontrolujte, jestli můžete službu upgradovat na vyšší limity vektorů.
Tato tabulka ukazuje postup zvyšování kvót vektoru v GB v průběhu času. Kvóta je na oddíl, takže pokud škálujete novou službu Standard (S1) na 6 oddílů, celková kvóta vektoru je 35 vynásobená 6.
Datum vytvoření služby | Základní | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Před 1. červencem 20231 | 0,5 | 1 | 6 | 12 | 12 | 36 |
1. července 2023 až 3. dubna 20242 | 1 | 3 | 12 | 36 | 12 | 36 |
3. dubna 2024 až 17. května 20243 | 5 | 35 | 150 | 300 | 12 | 36 |
Po 17. květnu 20244 | 5 | 35 | sto padesát | 300 | 150 | 300 |
1 Omezení počátečních vektorů v rané verzi Preview.
Během pozdějšího předzobrazení období platí omezení vektoru 2. Tři oblasti neměly vyšší limity: Německo západní střed, Západní Indie, Centrální Katar.
3 Vyšší kvóta vektorů založená na větších přihrádkách pro podporované úrovně a regiony.
4 Vyšší kvóty vektorů pro více úrovní a regionů na základě aktualizací velikosti oddílů.
Služba vynucuje kvótu velikosti vektorového indexu pro každou partition ve vaší vyhledávací službě. Každá další partition zvyšuje dostupnou kvótu velikosti vektorového indexu. Tato kvóta představuje striktní omezení, které zajišťuje, že vaše služba zůstane v dobrém stavu. To znamená, že pokud dojde k překročení tohoto limitu, další pokusy o indexaci nebudou úspěšné. Můžete obnovit indexování, jakmile uvolníte dostupnou kvótu buď odstraněním některých vektorových dokumentů, nebo navýšením počtu oddílů.
Důležité
Vyšší limity vektorů jsou svázané s většími velikostmi oddílů. V současné době nejsou vyšší limity vektorů dostupné v následujících oblastech, na které se vztahují limity z července do dubna.
- Izrael – střed
- Střední Katar
- Španělsko – střed
- Indie – jih
Omezení indexátoru
Maximální doby běhu existují, aby poskytovaly vyváženost a stabilitu službě jako celku, ale větší datové sady mohou potřebovat více času na indexování, než maximální doba povoluje. Pokud se úloha indexování nemůže dokončit v maximálním povoleném čase, zkuste ji spustit podle plánu. Plánovač sleduje stav indexování. Pokud je plánovaná práce indexování přerušena z jakéhokoliv důvodu, indexer může při příštím plánovaném spuštění pokračovat tam, kde skončil.
Zdroj | Zdarma 1 | Základní 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximální indexátory | 3 | 5 nebo 15 | 50 | 200 | 200 | není k dispozici | 10 | 10 |
Maximální datové zdroje | 3 | 5 nebo 15 | 50 | 200 | 200 | není k dispozici | 10 | 10 |
Maximální sady dovedností 4 | 3 | 5 nebo 15 | 50 | 200 | 200 | není k dispozici | 10 | 10 |
Maximální indexovací zatížení na jedno spuštění | 10,000 dokumentů | Omezeno pouze maximálním počtem dokumentů | Omezeno pouze maximálním počtem dokumentů | Omezeno pouze maximálním počtem dokumentů | Omezeno pouze maximálním počtem dokumentů | není k dispozici | Bez omezení | Bez omezení |
Minimální plán | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut | 5 minut |
Maximální doba běhu 5 | 1-3 nebo 3-10 minut | 2 nebo 24 hodin | 2 nebo 24 hodin | 2 nebo 24 hodin | 2 nebo 24 hodin | není k dispozici | 2 nebo 24 hodin | 2 nebo 24 hodin |
Blob indexer: maximální velikost bloku, MB | 16 | 16 | 128 | 256 | 256 | není k dispozici | 256 | 256 |
Obsahová indexace blobů: maximální počet znaků obsahu extrahovaného z blobu 6 | 32,000 | 64,000 | 4 miliony | 8 milion | 16 milionů | není k dispozici | 4 miliony | 4 miliony |
1 Bezplatné služby mají maximální dobu vykonání indexeru 3 minuty pro blobové zdroje a 1 minutu pro všechny ostatní datové zdroje. Vyvolání indexeru je jednou za 180 sekund. Pro indexování AI, které volá služby Azure AI, jsou bezplatné služby omezené na 20 bezplatných transakcí na indexer za den, kde je transakce definována jako dokument, který úspěšně prochází kanálem rozšiřování (tip: Můžete resetovat indexer a resetovat jeho počet).
2 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexerů, zdrojů dat a sad dovedností.
3 Služby S3 HD nezahrnují podporu indexeru.
4 Maximálně 30 dovedností na sadu dovedností.
5 Pokud jde o maximální délku trvání 2 nebo 24 hodin pro indexery: nejběžnější je maximální délka 2 hodiny a s tou byste měli počítat. Odkazuje na indexery, které běží ve veřejném prostředí, které se používají k přenesení výpočetně náročného zpracování a ponechání dalších prostředků pro dotazy. Limit 24 hodin platí, pokud indexer nakonfigurujete tak, aby běžel v privátním prostředí pouze pomocí infrastruktury, která je přidělená vaší vyhledávací službě. Všimněte si, že některé starší indexéry nejsou schopné běžet ve veřejném prostředí, a tyto indexéry vždy mají 24hodinový rozsah zpracování. Pokud máte neplánované indexery, které běží nepřetržitě 24 hodin, můžete předpokládat, že tyto indexery nelze migrovat na novější infrastrukturu. Obecně platí, že pro indexovací úlohy, které se nedokáží dokončit do dvou hodin, nastavte indexer na rozvrh každých 5 minut, aby indexer mohl rychle navázat tam, kde skončil. Na bezplatné úrovni je maximální doba běhu 3-10 minut určena pro indexátory s dovednostmi.
6 Maximální počet znaků je založen na jednotkách kódu Unicode, konkrétně UTF-16.
Poznámka
Jak je uvedeno v Index limits, indexery budou také uplatňovat horní limit 3000 prvků napříč všemi komplexními kolekcemi na dokument, počínaje nejnovější verzí GA API, která podporuje komplexní typy (2019-05-06
) a dále. To znamená, že pokud jste vytvořili svůj indexátor se starší verzí API, nebude se na vás tento limit vztahovat. Aby byla zachována maximální kompatibilita, indexer vytvořený s předchozí verzí API a následně aktualizovaný na verzi API 2019-05-06
nebo novější, bude stále vyloučen z limitů. Zákazníci by si měli být vědomi negativních dopadů, které mohou mít velmi velké složité kolekce (jak bylo již dříve uvedeno) a důrazně doporučujeme vytvářet nové indexátory s nejnovější verzí GA API.
Limity prostředků sdíleného soukromého odkazu
Indexery mohou přistupovat k dalším zdrojům Azure přes privátní koncové body spravované prostřednictvím API pro sdílené zdroje privátních odkazů. Tato sekce popisuje omezení spojená s touto schopností.
Zdroj | Bezplatný | Základní | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Podpora indexeru privátního koncového bodu | Ne | Ano | Ano | Ano | Ano | Ne | Ano | Ano |
Podpora soukromého koncového bodu pro indexery se sadu dovedností 1 | Ne | Ne | Ano | Ano | Ano | Ne | Ano | Ano |
Podpora privátního koncového bodu pro skillsety s embedovanou dovedností 2 | Ne | Ano | Ano | Ano | Ano | Ne | Ano | Ano |
Maximální počet privátních koncových bodů | není k dispozici | 10 nebo 30 | 100 | 400 | 400 | není k dispozici | 20 | 20 |
Maximální počet různých typů zdrojů 3 | není k dispozici | 4 | 7 | 15 | 15 | není k dispozici | 4 | 4 |
1 Obohacení AI a analýza obrazu jsou výpočetně náročné a spotřebovávají nepřiměřené množství dostupného výpočetního výkonu. Z tohoto důvodu jsou na nižších úrovních deaktivována soukromá připojení, aby byla zajištěna výkonnost a stabilita samotné vyhledávací služby. U služeb Basic nejsou privátní připojení k prostředku služeb Azure AI s více službami podporována, aby se zachovala stabilita služeb. Pro úroveň S1 se ujistěte, že služba byla vytvořena s vyššími limity po 3. dubnu 2024.
2 Privátní připojení k vkládacímu modelu se podporují ve vysokokapacitních vyhledávacích službách Basic a S1 vytvořených po 3. dubnu 2024 s vyššími limity pro ukládání a výpočetní zpracování.
3 Počet různých typů zdrojů se vypočítá jako počet jedinečných groupId
hodnot použitých ve všech sdílených prostředcích soukromého spojení pro danou vyhledávací službu, bez ohledu na stav zdroje.
Omezení synonym
Maximální počet synonymních map se liší podle úrovně. Každé pravidlo může mít až 20 rozšíření, kde jedno rozšíření je ekvivalentní termín. Například, pokud máme slovo "kočka", asociace se slovy "kotě", "feline" a "felis" (rod koček) by se počítaly jako 3 rozšíření.
Zdroj | Bezplatný | Základní | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximální mapy synonym | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maximální počet pravidel na mapu | 5 000 | 20 000 | 20 000 | 20 000 | 20 000 | 20 000 | 20 000 | 20 000 |
Limity aliasů indexu
Maximální počet aliasů indexů se liší podle úrovně a data vytvoření služby. Ve všech úrovních, pokud byla služba vytvořena po říjnu 2022, je maximální počet aliasů dvojnásobkem povoleného maximálního počtu indexů. Pokud byla služba vytvořena před říjnem 2022, limit je počet povolených indexů.
Datum vytvoření služby | Bezplatný | Základní | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Před říjnem 2022 | 3 | 5 nebo 15 1 | 50 | 200 | 200 | 1000 na oddíl nebo 3000 na službu | 10 | 10 |
Po říjnu 2022 | 6 | 30 | 100 | 400 | 400 | 2000 na oddíl nebo 6000 na službu | 20 | 20 |
1 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) na indexy.
Datové limity (obohacení AI)
Potrubí na obohacení AI, které volá prostředek Azure AI Language pro rozpoznávání entit, propojení entit, extrakci klíčových frází, analýzu sentimentu, detekci jazyka a detekci osobních údajů, podléhá datovým limitům. Maximální velikost záznamu by měla být 50 000 znaků měřeno pomocí String.Length
. Pokud potřebujete rozdělit svá data před jejich odesláním do analyzátoru sentimentu, použijte dovednost Text Split.
Limity škrcení
Požadavky na API jsou omezeny, jakmile se systém blíží ke špičkové kapacitě. Omezování se chová odlišně pro různé API. Dotazovací API (vyhledávání/navrhování/autodokončování) a indexační API dynamicky regulují svou aktivitu na základě zatížení služby. Rozhraní indexových API a API pro operace služeb mají statické limity rychlosti požadavků.
Statické limity rychlosti požadavků pro operace související s indexem.
- Seznam indexů (GET /indexes): 3 za sekundu na vyhledávací jednotku
- Získat index (GET /indexes/myindex): 10 za sekundu na vyhledávací jednotku
- Vytvořit index (POST /indexes): 12 za minutu na vyhledávací jednotku
- Vytvoření nebo aktualizace indexu (PUT /indexes/myindex): 6 za sekundu na vyhledávací jednotku
- Smazat index (DELETE /indexes/myindex): 12 za minutu na vyhledávací jednotku
Statické limity rychlosti požadavků pro operace související se službou:
- Statistiky služby (GET /sluzebnistatistiky): 4 za sekundu na vyhledávací jednotku
Omezení regulace semantického hodnotitele
Semantic ranker používá frontový systém ke správě souběžných požadavků. Tento systém umožňuje vyhledávacím službám dosáhnout maximálního počtu dotazů za sekundu. Když je dosaženo limitu souběžných požadavků, další požadavky jsou zařazeny do fronty. Pokud je fronta plná, další požadavky jsou odmítnuty a musí být opakovány.
Celkový počet dotazů pro sémantický hodnotitel za sekundu se liší v závislosti na následujících faktorech:
- Úroveň vyhledávací služby. Kapacita fronty a limity současných požadavků se liší podle úrovně.
- Počet vyhledávacích jednotek ve vyhledávací službě. Nejjednodušší způsob, jak zvýšit maximální počet současných dotazů na sémantický řadič, je přidat více vyhledávacích jednotek do vaší vyhledávací služby.
- Celková dostupná kapacita sémantického pořadí v regionu.
- Doba, kterou trvá obsluhovat dotaz pomocí sémantického rankeru. To se liší podle toho, jak vytížená je služba vyhledávání.
Následující tabulka popisuje omezení škrcení sémantického rankeru podle úrovně, s ohledem na dostupnou kapacitu v regionu. Pokud chcete požádat o navýšení limitu, můžete kontaktovat podporu Microsoftu.
Zdroj | Základní | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|
Maximální současné požadavky (na vyhledávací jednotku) | 2 | 3 | 4 | 4 | 4 | 4 | 4 |
Maximální velikost fronty požadavků (na vyhledávací jednotku) | 4 | 6 | 8 | 8 | 8 | 8 | 8 |
Limity požadavků API
Omezení dotazů existují, protože neomezené dotazy mohou destabilizovat vaši vyhledávací službu. Tyto dotazy se obvykle vytvářejí prostřednictvím kódu programu. Pokud vaše aplikace generuje vyhledávací dotazy programově, doporučujeme ji navrhnout tak, aby nevytvářela dotazy neomezené velikosti.
Omezení na užitečné zatížení existují ze stejných důvodů, zajišťující stabilitu vaší vyhledávací služby. Omezení platí pro celou žádost včetně všech jejích součástí. Například pokud žádost seskupuje několik dokumentů nebo příkazů, musí se celá žádost vejít do podporovaného limitu.
Pokud musíte překročit podporovaný limit, měli byste otestovat svou zátěž, abyste věděli, co můžete očekávat.
Pokud není uvedeno jinak, následující požadavky na API platí pro všechny programovatelné rozhraní, včetně Azure SDKs.
Obecné:
- Podporovaný maximální limit velikosti datového balíku je 16 MB pro indexování a dotazování prostřednictvím REST API a SDK.
- Maximální délka adresy URL 8 kB (platí jenom pro rozhraní REST API).
Rozhraní API indexování:
- Podpora maximálně 1 000 dokumentů na jednu dávku pro nahrávání, slučování nebo mazání indexů.
Dotazovací API:
- Maximálně 10 polí v vektorovém dotazu
- Maximálně 32 polí v klauzuli $orderby.
- Maximálně 100 000 znaků v jedné vyhledávací podmínce.
- Maximální počet klauzulí ve vyhledávání je 3 000.
- Maximální limity pro dotazy s zástupnými znaky a regulárními výrazy, jak jsou vynuceny Lucene. Omezuje počet vzorců, variací nebo shod na 1 000 případů. Tento limit je zaveden, aby se zabránilo přetížení motoru.
Vyhledávací dotazy:
- Maximální podporovaná velikost vyhledávacího termínu je 32 766 bajtů (32 KB minus 2 bajty) UTF-8 kódovaného textu. Platí pro vyhledávání pomocí klíčových slov a vlastnost textu pro vektorové vyhledávání.
- Maximální podporovaná délka vyhledávacího termínu je 1 000 znaků pro vyhledávání s předponou a vyhledávání s regulárními výrazy.
Limity pro reakce API
- Maximálně 1 000 dokumentů vrácených na stránku výsledků vyhledávání
- Maximálně 100 návrhů vrácených na jeden požadavek Suggest API.
Vyhledávač vrací ve výchozím nastavení 50 výsledků, ale tento parametr můžete přepsat až do maximálního limitu.
Limity klíče API
Klíče API se používají pro autentizaci služeb. Existují dva typy. Admin klíče jsou specifikovány v záhlaví žádosti a poskytují plný přístup k službě pro čtení i zápis. Dotazovací klíče jsou pouze pro čtení, určené v URL a obvykle distribuovány klientským aplikacím.
- Maximálně 2 klíče správce na službu
- Maximálně 50 klíčů pro dotazy na službu