Limity služeb ve službě Azure AI Search

Maximální limity úložiště, úloh a množství indexů a dalších objektů závisí na tom, jestli službu Azure AI Search zřizujete na cenových úrovních Free, Basic, Standard nebo Storage Optimized.

  • Free je víceklientová sdílená služba, která je součástí vašeho předplatného Azure.

  • Basic poskytuje vyhrazené výpočetní prostředky pro produkční úlohy v menším měřítku, ale sdílí určitou síťovou infrastrukturu s jinými tenanty.

  • Standard běží na vyhrazených počítačích s větší kapacitou úložiště a zpracování na všech úrovních. Standard má čtyři úrovně: S1, S2, S3 a S3 HD. S3 High Density (S3 HD) je navržen pro víceklientskou architekturu a velké množství malých indexů (tři tisíce indexů na službu). S3 HD neposkytuje funkci indexeru a příjem dat musí používat rozhraní API, která nasdílí data ze zdroje do indexu.

  • Optimalizováno pro úložiště běží na vyhrazených počítačích s větší celkovou velikostí úložiště, šířkou pásma úložiště a pamětí než standard. Tato úroveň cílí na velké pomalé indexy. Optimalizované úložiště má dvě úrovně: L1 a L2.

Omezení předplatného

Můžete vytvořit více fakturovatelných vyhledávacích služeb (Basic a vyšší), až do maximálního počtu služeb povolených na každé úrovni. Můžete například vytvořit až 16 služeb na úrovni Basic a dalších 16 služeb na úrovni S1 v rámci stejného předplatného. Další informace o úrovních najdete v tématu Volba úrovně (nebo skladové položky) pro Azure AI Search.

Maximální limity služeb je možné na vyžádání zvýšit. Pokud potřebujete více služeb ve stejném předplatném, vytvořte žádost o podporu.

Prostředek Zdarma 1 Basic S1 S2 S3 S3 HD L1 L2
Maximální počet služeb 0 16 16 8 6 6 6 6
Maximální počet jednotek vyhledávání (SU)2 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Můžete mít jednu bezplatnou vyhledávací službu pro každé předplatné Azure. Úroveň Free je založená na infrastruktuře sdílené s ostatními zákazníky. Vzhledem k tomu, že hardware není vyhrazený, vertikální navýšení kapacity se nepodporuje a úložiště je omezené na 50 MB.

2 Jednotky vyhledávání (SU) jsou fakturační jednotky přidělené jako replikanebo oddíl. Potřebujete obojí. Další informace o kombinacích SU najdete v tématu Odhad a správa kapacity vyhledávací služby.

Omezení služby

Vyhledávací služba podléhá maximálnímu limitu úložiště (velikost oddílu vynásobené počtem oddílů) nebo pevným limitem maximálního počtu indexů nebo indexerů podle toho, co nastane dříve.

Prostředek Zdarma 1 Základní 1 S1 S2 S3 S3 HD L1 L2
Smlouva o úrovni služeb (SLA) 2 No Ano Ano Ano Ano Ano Ano Yes
Úložiště (velikost oddílu) 50 MB 3 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Oddíly 0 12 12 12 3 12 12
Repliky 3 12 12 12 12 12 12

1 Basic má jeden pevný oddíl. Můžete zadat až 3 další jednotky vyhledávání pro přidání replik pro větší objemy dotazů a vysokou dostupnost.

2 Smlouvy o úrovni služeb se vztahují na fakturovatelné služby s vyhrazenými prostředky. Bezplatné služby a funkce preview nemají žádnou smlouvu SLA. U fakturovatelných služeb se smlouvy SLA projeví, když pro službu zřídíte dostatečnou redundanci. Pro smlouvy SLA pro dotazy (čtení) se vyžadují dvě nebo více replik. Pro smlouvy SLA pro dotazy a indexování (čtení a zápis) se vyžadují tři nebo více replik. Počet oddílů není důležitým aspektem smlouvy SLA. Další informace o replikách a vysoké dostupnosti najdete v tématu Spolehlivost ve službě Azure AI Search .

3 Bezplatné služby nemají vyhrazený oddíl. Limit úložiště 50 MB odkazuje na maximální prostor přidělený bezplatné vyhledávací službě v infrastruktuře sdílené s ostatními zákazníky.

Omezení indexu

Prostředek Free Základní 1 S1 S2 S3 S3 HD L1 L2
Maximální počet indexů 3 5 nebo 15 50 200 200 1 000 na oddíl nebo 3 000 na službu 10 10
Maximální počet jednoduchých polí na index 2 1000 100 1000 1000 1000 1000 1000 1000
Maximální rozměry na vektorové pole 3072 3072 3072 3072 3072 3072 3072 3072
Maximální počet složitých kolekcí na index 40 40 40 40 40 40 40 40
Maximální počet prvků ve všech složitých kolekcích na dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximální hloubka složitých polí 10 10 10 10 10 10 10 10
Maximální počet návrhy na index 1 1 1 1 1 1 1 1
Maximální bodovací profily na index 100 100 100 100 100 100 100 100
Maximální počet funkcí na profil 8 8 8 8 8 8 8 8

1 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexů. Úroveň Basic je jediná skladová položka s nižším limitem 100 polí na index.

2 Horní limit polí zahrnuje pole první úrovně i vnořené podpole v komplexní kolekci. Pokud například index obsahuje 15 polí a má dvě komplexní kolekce s pěti dílčími poli, počet polí indexu je 25. Indexy s velmi velkou kolekcí polí můžou být pomalé. Omezte pole a atributy jenom na ty, které potřebujete, a spusťte indexování a test dotazů, abyste měli jistotu, že je výkon přijatelný.

3 Horní limit existuje pro prvky, protože s velkým počtem z nich výrazně zvyšuje úložiště požadované pro váš index. Prvek komplexní kolekce je definován jako člen této kolekce. Předpokládejme například, že hotelový dokument se složitou kolekcí Rooms je každý pokoj v kolekci Rooms považován za prvek. Během indexování může modul indexování bezpečně zpracovat maximálně 3 000 prvků v celém dokumentu. Tento limit byl zaveden a api-version=2019-05-06 vztahuje se pouze na složité kolekce, a ne na kolekce řetězců nebo na složitá pole.

Pokud se vaše služba zřídí v výkonnějším clusteru, může dojít k určité variantě maximálních limitů. Zde uvedené limity představují společný jmenovatel. Indexy vytvořené podle výše uvedených specifikací jsou přenositelné napříč ekvivalentními úrovněmi služby v libovolné oblasti.

Omezení dokumentů

Pro vyhledávací služby Basic, S1, S2, S3, L1 a L2 můžete mít přibližně 24 miliard dokumentů na index. Pro S3 HD je limit 2 miliardy dokumentů na index. Každá instance komplexní kolekce se počítá jako samostatný dokument z hlediska těchto limitů.

Omezení velikosti dokumentu na volání rozhraní API

Maximální velikost dokumentu při volání rozhraní API indexu je přibližně 16 megabajtů.

Velikost dokumentu je ve skutečnosti limitem velikosti textu požadavku rozhraní API indexu. Vzhledem k tomu, že do rozhraní API indexu najednou můžete předat dávku více dokumentů, limit velikosti realisticky závisí na tom, kolik dokumentů je v dávce. V případě dávky s jedním dokumentem je maximální velikost dokumentu 16 MB json.

Při odhadu velikosti dokumentu nezapomeňte vzít v úvahu pouze pole, která může vyhledávací služba využívat. Z výpočtů by se měla vynechat jakákoli binární nebo obrazová data ve zdrojových dokumentech.

Omezení velikosti vektorových indexů

Když indexujete dokumenty s vektorovými poli, Azure AI Search vytvoří interní vektorové indexy pomocí parametrů algoritmu, které zadáte. Velikost těchto vektorových indexů je omezena pamětí vyhrazenou pro vektorové vyhledávání vrstvy vaší služby (nebo skladové položky).

Služba vynucuje kvótu velikosti vektorového indexu pro každý oddíl ve vyhledávací službě. Každý další oddíl zvyšuje dostupnou kvótu velikosti vektorového indexu. Tato kvóta je pevný limit, který zajistí, že vaše služba zůstane v pořádku, což znamená, že další pokusy o indexování po překročení limitu způsobí selhání. Jakmile uvolníte dostupnou kvótu, můžete obnovit indexování odstraněním některých vektorových dokumentů nebo vertikálním navýšením kapacity v oddílech.

Tabulka popisuje kvótu velikosti vektorového indexu na oddíl napříč úrovněmi služby (nebo skladovou jednotkou). Kontext zahrnuje:

  • Omezení úložiště oddílů pro každou úroveň, která se tady opakuje pro kontext.
  • Množství každého oddílu (v GB) dostupného pro vektorové indexy (vytvořené při přidání vektorových polí do indexu).
  • Přibližný počet vkládání (hodnoty s plovoucí desetinou čárkou) na oddíl.

K načtení kvóty velikosti vektorového indexu použijte rozhraní GET /servicestats (Get Service Statistics API). Další podrobnosti najdete v naší dokumentaci k velikosti vektorových indexů.

Služby vytvořené před 1. červencem 2023

Úroveň Kvóta úložiště (GB) Kvóta vektorů na oddíl (GB) Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic 2 0.5 115 milionů
S1 25 0 235 milionů
S2 100 6 1,400 milionů
S3 200 12 2 800 milionů
L1 1000 12 2 800 milionů
L2 2 000 36 8,400 milionů

Služby vytvořené po 1. červenci 2023 v podporovaných oblastech

Azure AI Search zavádí pro nové vyhledávací služby po celém světě zvýšené limity velikosti indexu vektorů, ale tým vytváří kapacitu infrastruktury v určitých oblastech. Stávající služby bohužel nejde migrovat na nové limity.

Následující oblasti nepodporují zvýšené limity:

  • Německo – středozápad
  • Západ Indie
  • Střední Katar
Úroveň Kvóta úložiště (GB) Kvóta vektorů na oddíl (GB) Přibližně plovoucí hodnoty na oddíl (za předpokladu režie 15 % )
Basic 2 0 235 milionů
S1 25 3 700 milionů
S2 100 12 2 800 milionů
S3 200 36 8,400 milionů
L1 1000 12 2 800 milionů
L2 2 000 36 8,400 milionů

Omezení indexeru

Existují limity maximální doby běhu, které zajišťují rovnováhu a stabilitu v rámci služby, ale větší datové sady můžou vyžadovat více času na indexování, než je povolené maximum. Pokud se úloha indexování nemůže dokončit v maximální povolené době, zkuste ji spustit podle plánu. Plánovač sleduje stav indexování. Pokud je naplánovaná úloha indexování z nějakého důvodu přerušena, může indexer vyzvednout místo, kde naposledy skončil při dalším naplánovaném spuštění.

Prostředek Zdarma 1 Základní 2 S1 S2 S3 S3 HD 3 L1 L2
Maximální počet indexerů 3 5 nebo 15 50 200 200 10 10
Maximální počet zdrojů dat 3 5 nebo 15 50 200 200 10 10
Maximální počet dovedností 4 3 5 nebo 15 50 200 200 10 10
Maximální zatížení indexování na volání 10 000 dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Omezeno pouze maximálním počtem dokumentů Bez omezení Bez omezení
Minimální plán 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut 5 minut
Maximální doba běhu 5 1–3 minuty 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin 2 nebo 24 hodin
Maximální doba běhu pro indexery se sadou dovedností 6 3–10 minut 2 hodiny 2 hodiny 2 hodiny 2 hodiny 2 hodiny 2 hodiny
Indexer objektů blob: maximální velikost objektu blob, MB 16 16 128 256 256 256 256
Indexer objektů blob: maximální počet znaků obsahu extrahovaného z objektu blob 32,000 64,000 4 miliony 8 milionů 16 milionů 4 miliony 4 miliony

1 bezplatné služby mají maximální dobu provádění indexeru 3 minuty pro zdroje objektů blob a 1 minutu pro všechny ostatní zdroje dat. Vyvolání indexeru je jednou za 180 sekund. Pro indexování AI, které volá služby Azure AI, jsou bezplatné služby omezené na 20 bezplatných transakcí na indexer za den, kde je transakce definována jako dokument, který úspěšně prochází kanálem rozšiřování (tip: Můžete resetovat indexer a resetovat jeho počet).

2 Základní služby vytvořené před prosincem 2017 mají nižší limity (5 místo 15) u indexerů, zdrojů dat a sad dovedností.

3 Služby S3 HD nezahrnují podporu indexeru.

4 Maximálně 30 dovedností na sadu dovedností.

5 Týkající se maximální doby trvání indexerů 2 nebo 24 hodin: 2hodinový maximum je nejběžnější a je to, co byste měli naplánovat. 24hodinový limit pochází ze starší implementace indexeru. Pokud máte neplánované indexery, které běží nepřetržitě po dobu 24 hodin, je to proto, že tyto indexery nešlo migrovat do novější infrastruktury. Obecně platí, že pro úlohy indexování, které se nedají dokončit do dvou hodin, umístěte indexer do 2hodinového plánu. Po dokončení prvního 2hodinového intervalu indexer převezme místo, kde skončil při spuštění dalšího 2hodinového intervalu.

6 Provádění sady dovedností a zejména analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Doba běhu pro tyto úlohy byla zkrácena, aby ostatní úlohy ve frontě získaly větší příležitost ke spuštění.

Poznámka:

Jak je uvedeno v limitech indexů, indexery také vynucují horní limit 3000 prvků ve všech složitých kolekcích na dokument počínaje nejnovější verzí rozhraní GA API, která podporuje komplexní typy (2019-05-06). To znamená, že pokud jste indexer vytvořili s předchozí verzí rozhraní API, nebudete pod tímto limitem. Aby se zachovala maximální kompatibilita, indexer vytvořený s předchozí verzí rozhraní API a potom aktualizovaný verzí 2019-05-06 rozhraní API nebo novějším, bude stále vyloučen z limitů. Zákazníci by měli vědět o nepříznivém dopadu na velmi rozsáhlé komplexní kolekce (jak jsme uvedli dříve) a důrazně doporučujeme vytvářet nové indexery s nejnovější verzí rozhraní GA API.

Indexery mají přístup k dalším prostředkům Azure přes privátní koncové body spravované přes rozhraní API prostředku sdíleného privátního propojení. Tato část popisuje omezení spojená s touto funkcí.

Prostředek Free Basic S1 S2 S3 S3 HD L1 L2
Podpora indexeru privátního koncového bodu No Ano Ano Ano Ano Ne Ano Yes
Podpora privátních koncových bodů pro indexery se sadoudovedností 1 No No No Ano Ano Ne Ano Yes
Maximální počet privátních koncových bodů 10 nebo 30 100 400 400 20 20
Maximální počet různých typůprostředků 2 4 7 15 15 4 4

1 Obohacení umělé inteligence a analýza obrázků jsou výpočetně náročné a spotřebovávají nepřiměřeně velké množství dostupného výpočetního výkonu. Z tohoto důvodu jsou privátní připojení zakázaná na nižších úrovních, aby se zajistil výkon a stabilita samotné vyhledávací služby.

2 Počet různých typů prostředků se vypočítá jako počet jedinečných groupId hodnot používaných ve všech prostředcích sdíleného privátního propojení pro danou vyhledávací službu bez ohledu na stav prostředku.

Omezení synonym

Maximální počet map synonym se liší podle úrovně. Každé pravidlo může mít až 20 rozšíření, kde rozšíření je ekvivalentní termín. Například s ohledem na "kočku", spojení s "kočička", "feline" a "felis" (rod pro kočky) by se spočítalo jako 3 rozšíření.

Prostředek Free Basic S1 S2 S3 S3-HD L1 L2
Maximální počet map synonym 3 3 5 10 20 20 10 10
Maximální počet pravidel na mapu 5000 20 000 20 000 20 000 20 000 20 000 20 000 20 000

Omezení aliasů indexu

Maximální počet aliasů indexu se liší podle úrovně. Ve všech úrovních je maximální počet aliasů dvojnásobný maximální povolený počet indexů.

Prostředek Free Basic S1 S2 S3 S3-HD L1 L2
Maximální počet aliasů 6 10 nebo 30 100 400 400 2000 na oddíl nebo 6000 na službu 20 20

Omezení dat (rozšiřování AI)

Kanál rozšiřování AI, který volá prostředek azure AI Language pro rozpoznávání entit, propojení entit, extrakci klíčových frází, analýzu mínění, rozpoznávání jazyka a detekci osobních informací, podléhá omezením dat. Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data před odesláním do analyzátoru mínění rozdělit, použijte dovednost Rozdělení textu.

Omezení omezování

Požadavky rozhraní API jsou omezené, protože systém přistupuje ke špičce kapacity. Omezování se chová jinak pro různá rozhraní API. Rozhraní API dotazů (vyhledávání, návrhy, automatické dokončování) a indexování rozhraní API dynamicky omezují na základě zatížení služby. Rozhraní API indexu a rozhraní API operací služby mají omezení statické rychlosti požadavků.

Omezení požadavků na statickou rychlost pro operace související s indexem:

  • Indexy seznamu (GET /indexy): 3 za sekundu za jednotku hledání
  • Získání indexu (GET /indexes/myindex): 10 za sekundu za jednotku hledání
  • Vytvoření indexu (POST /indexy): 12 za minutu za jednotku hledání
  • Vytvoření nebo aktualizace indexu (PUT /indexes/myindex): 6 za sekundu za jednotku vyhledávání
  • Odstranit index (DELETE /indexes/myindex): 12 za minutu za jednotku hledání

Omezení požadavků na statickou rychlost pro operace související se službou:

  • Statistika služby (GET /servicestats): 4 za sekundu za jednotku vyhledávání

Limity požadavků rozhraní API

  • Maximálně 16 MB na požadavek 1
  • Maximální délka adresy URL 8 kB
  • Maximálně 1 000 dokumentů na dávku nahrávání, slučování nebo odstraňování indexů
  • Maximálně 32 polí v klauzuli $orderby
  • Maximálně 100 000 znaků ve vyhledávací klauzuli
  • Maximální počet klauzulí v search (výrazy oddělené operátorem AND nebo OR) je 1024.
  • Maximální velikost hledaného termínu je 32 766 bajtů (32 kB minus 2 bajty) zakódovaného textu UTF-8
  • Maximální velikost hledaného termínu je 1000 znaků pro vyhledávání předpon a hledání regulárních výrazů.
  • Vyhledávání pomocí zástupných znaků a hledání regulárních výrazů je omezeno na maximálně 1 000 stavů při zpracování lucene.

1 Ve službě Azure AI Search platí, že text požadavku podléhá hornímu limitu 16 MB a ukládá praktický limit obsahu jednotlivých polí nebo kolekcí, které nejsou jinak omezeny teoretickými limity (další informace o složení a omezeních polí najdete v tématu Podporované datové typy ).

Omezení velikosti a složení dotazu existují, protože nevázané dotazy můžou vaši vyhledávací službu synchronizovat. Tyto dotazy se obvykle vytvářejí prostřednictvím kódu programu. Pokud vaše aplikace generuje vyhledávací dotazy prostřednictvím kódu programu, doporučujeme ho navrhnout tak, aby negenerovala dotazy s nevázanou velikostí.

Limity odpovědí rozhraní API

  • Maximálně 1000 dokumentů vrácených na stránku výsledků hledání
  • Maximálně 100 návrhů vrácených na požadavek rozhraní API pro návrhy

Limity klíčů rozhraní API

Klíče rozhraní API se používají k ověřování služby. Existují dva typy. Správa klíče jsou zadány v hlavičce požadavku a udělují službě úplný přístup pro čtení i zápis. Klíče dotazů jsou určené jen pro čtení, zadané na adrese URL a obvykle se distribuují do klientských aplikací.

  • Maximálně 2 klíče správce na službu
  • Maximálně 50 klíčů dotazů na službu