Tjänstbegränsningar i Azure AI Search

Artikel
09/29/2024

Maximala gränser för lagring, arbetsbelastningar och mängder index och andra objekt beror på om du skapar Azure AI Search på prisnivåerna Kostnadsfri, Basic, Standard eller Lagringsoptimerad .

Kostnadsfri är en delad tjänst med flera klienter som medföljer din Azure-prenumeration.
Basic tillhandahåller dedikerade beräkningsresurser för produktionsarbetsbelastningar i mindre skala, men delar en del nätverksinfrastruktur med andra klienter.
Standard körs på dedikerade datorer med mer lagrings- och bearbetningskapacitet på alla nivåer. Standard finns i fyra nivåer: S1, S2, S3 och S3 HD. S3 High Density (S3 HD) är konstruerad för flera innehavare och stora mängder små index (3 000 index per tjänst). S3 HD tillhandahåller inte indexerarens funktion och datainmatning måste använda API:er som skickar data från källa till index.
Lagringsoptimerad körs på dedikerade datorer med mer total lagring, lagringsbandbredd och minne än Standard. Den här nivån riktar sig till stora, långsamt föränderliga index. Lagringsoptimerad finns på två nivåer: L1 och L2.

Prenumerationsgränser

Du kan skapa flera fakturerbara söktjänster (Basic och högre), upp till det maximala antalet tjänster som tillåts på varje nivå. Du kan till exempel skapa upp till 16 tjänster på basic-nivån och ytterligare 16 tjänster på S1-nivån inom samma prenumeration. Mer information om nivåer finns i Välj en nivå (eller SKU) för Azure AI Search.

Maximala tjänstgränser kan höjas vid begäran. Om du behöver fler tjänster i samma prenumeration skickar du en supportbegäran.

Resurs	Gratis ¹	Grundläggande	S1	S2	S3	S3 HD	L1	L2
Maximalt antal tjänster	1	16	16	8	6	6	6	6
Maximalt antal sökenheter (SU)²	Ej tillämpligt	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Du kan ha en kostnadsfri söktjänst per Azure-prenumeration. Den kostnadsfria nivån baseras på infrastruktur som delas med andra kunder. Eftersom maskinvaran inte är dedikerad stöds inte uppskalning och lagringen är begränsad till 50 MB.

² Sökenheter (SU) är faktureringsenheter som allokerats som antingen en replik eller en partition. Du behöver båda. Mer information om SU-kombinationer finns i Uppskatta och hantera kapaciteten för en söktjänst.

Tjänstbegränsningar

I följande tabell beskrivs serviceavtal, antal partitioner och repliker på tjänstnivå.

Resurs	Kostnadsfri	Grundläggande	S1	S2	S3	S3 HD	L1	L2
Serviceavtal (SLA)	Nej	Ja	Ja	Ja	Ja	Ja	Ja	Ja
Partitioner	Ej tillämpligt	3 ¹	12	12	12	3	12	12
Repliker	Ej tillämpligt	3	12	12	12	12	12	12

¹ Basic-nivån stöder tre partitioner och tre repliker, för totalt nio sökenheter (SU) på nya söktjänster som skapats efter den 3 april 2024. Äldre grundläggande tjänster är begränsade till en partition och tre repliker.

En söktjänst omfattas av en maximal lagringsgräns (partitionsstorlek multiplicerat med antalet partitioner) eller med en hård gräns för det maximala antalet index eller indexerare, beroende på vilket som inträffar först.

Serviceavtal (SLA) gäller för fakturerbara tjänster som har två eller flera repliker för frågearbetsbelastningar, eller tre eller fler repliker för arbetsbelastningar för frågor och indexering. Antalet partitioner är inte ett SLA-övervägande. Mer information finns i Tillförlitlighet i Azure AI Search.

Kostnadsfria tjänster har inte fasta partitioner eller repliker och de delar resurser med andra prenumeranter.

Partitionslagring (GB)

Lagringsgränserna per tjänst varierar beroende på två saker: datum för skapande av tjänst och region. Det finns högre gränser för nyare tjänster i de flesta regioner som stöds.

Den här tabellen visar hur lagringskvoten ökar i GB över tid. Partitioner med högre kapacitet togs online från och med april 2024, i de regioner som anges i fotnoterna. Högre kapacitet är begränsad till nya söktjänster. Det finns ingen uppgradering på plats just nu.

Datum då tjänsten skapades	Grundläggande	S1	S2	S3/HD	L1	L2
Före den 3 april 2024	2	25	100	200	1,024	2 048
3 april 2024 till och med 17 maj 2024 ¹	15	160	512	1,024	1,024	2 048
Efter den 17 maj 2024 ²	15	160	512	1,024	2,048	4,096

¹ Lagring med högre kapacitet för Basic, S1, S2, S3 i dessa regioner. Amerika: Brasilien, södra, Kanada, centrala, Kanada, östra, USA, östra, USA, östra 2, USA, centrala, USA, norra centrala, USA, södra centrala, USA, västra, USA, västra 2, USA, västra 3, USA, västra centrala. Europa: Frankrike, centrala. Italien, norra, Europa, norra, Norge, östra, Polen, centrala, Schweiz, norra, Sverige, centrala, Storbritannien, södra, Storbritannien, västra. Mellanöstern: Förenade Arabemiraten, norra. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Australien, östra, Australien, sydöstra, Indien, centrala, Jio Indien, västra, Asien, östra, Sydostasien, Japan, östra, Japan, västra, Korea, centrala, Sydkorea, södra.

² Lagring med högre kapacitet för L1 och L2. Fler regioner ger högre kapacitet på varje fakturerbar nivå. Europa: Tyskland, norra, Tyskland, västra centrala, Schweiz, västra. Azure Government: Texas, Arizona, Virginia. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Kina, norra 3, Kina, östra 3.

Några regioner körs fortfarande på äldre infrastruktur, med förbehåll för gränserna för 3 april. Innan du skapar en ny tjänst kontrollerar du vilka regioner som stöds för att se till att valfri region ger den extra kapaciteten.

Indexgränser

Resurs	Kostnadsfri	Grundläggande ¹	S1	S2	S3	S3 HD	L1	L2
Maximalt antal index	3	5 eller 15	50	200	200	1 000 per partition eller 3 000 per tjänst	10	10
Maximalt antal enkla fält per index ²	1000	100	1 000	1 000	1 000	1 000	1 000	1 000
Maximala dimensioner per vektorfält	4098	4098	4098	4098	4098	4098	4098	4098
Maximalt antal komplexa samlingar per index	40	40	40	40	40	40	40	40
Maximalt antal element i alla komplexa samlingar per dokument ³	3000	3000	3000	3000	3000	3000	3000	3000
Maximalt djup för komplexa fält	10	10	10	10	10	10	10	10
Maximalt antal förslag per index	1	1	1	1	1	1	1	1
Maximalt antal bedömningsprofiler per index	100	100	100	100	100	100	100	100
Maximalt antal funktioner per profil	8	8	8	8	8	8	8	8
Maximal indexstorlek ⁴	Saknas	Saknas	Saknas	1,88 TB	2,34 TB	100 GB	Saknas	Saknas

¹ Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för index. Basic-nivån är den enda nivån med en lägre gräns på 100 fält per index.

² Den övre gränsen för fält innehåller både fält på första nivån och kapslade underfält i en komplex samling. Om ett index till exempel innehåller 15 fält och har två komplexa samlingar med fem underfält vardera är fältantalet för ditt index 25. Index med en mycket stor fältsamling kan vara långsamma. Begränsa fält och attribut till bara de du behöver och kör indexerings- och frågetestet för att säkerställa att prestandan är acceptabel.

³ Det finns en övre gräns för element eftersom ett stort antal av dem avsevärt ökar det lagringsutrymme som krävs för ditt index. Ett element i en komplex samling definieras som medlem i samlingen. Anta till exempel att ett hotelldokument med en rumskomplex samling, varje rum i samlingen Rum betraktas som ett element. Under indexeringen kan indexeringsmotorn på ett säkert sätt bearbeta högst 3 000 element i hela dokumentet. Den här gränsen infördes i api-version=2019-05-06 och gäller endast för komplexa samlingar och inte för strängsamlingar eller komplexa fält.

⁴ På de flesta nivåer är den maximala indexstorleken all tillgänglig lagring i söktjänsten. För S2, S3 och S3 HD är den maximala storleken på ett index det antal som anges i tabellen. Gäller för söktjänster som skapats efter den 3 april 2024.

Du kan hitta en viss variation i maximala gränser om din tjänst råkar etableras i ett mer kraftfullt kluster. Gränserna här representerar den gemensamma nämnaren. Index som skapats enligt ovanstående specifikationer är portabla på motsvarande tjänstnivåer i alla regioner.

Dokumentbegränsningar

Maximalt antal dokument per index är:

24 miljarder på söktjänsterna Basic, S1, S2, S3, L1 och L2.
2 miljarder på S3 HD.

Varje instans av en komplex samling räknas som ett separat dokument när det gäller dessa gränser.

Den maximala dokumentstorleken när du anropar ett Index-API är cirka 16 megabyte.

Dokumentstorleken är faktiskt en gräns för storleken på index-API-begärandetexten. Eftersom du kan skicka en batch med flera dokument till index-API:et samtidigt beror storleksgränsen realistiskt på hur många dokument som finns i batchen. För en batch med ett enda dokument är den maximala dokumentstorleken 16 MB JSON.

När du beräknar dokumentstorleken bör du bara tänka på de fält som lägger till värde i dina sökscenarier och exkludera alla källfält som inte har något syfte i de frågor som du tänker köra.

Storleksgränser för vektorindex

När du indexerar dokument med vektorfält skapar Azure AI Search interna vektorindex med hjälp av de algoritmparametrar du anger. Storleken på dessa vektorindex begränsas av det minne som är reserverat för vektorsökning efter tjänstens nivå (eller SKU). Vägledning om hur du hanterar och maximerar vektorlagring finns i Vektorindexstorlek och att hålla sig under gränser.

Vektorgränser varierar beroende på:

Det finns högre vektorgränser från april 2024 och framåt på nya söktjänster i regioner som tillhandahåller den extra kapaciteten, vilket är de flesta av dem.

Den här tabellen visar utvecklingen av vektorkvotökningar i GB över tid. Kvoten är per partition, så om du skalar en ny standardtjänst (S1) till 6 partitioner är den totala vektorkvoten 35 multiplicerad med 6.

Datum då tjänsten skapades	Grundläggande	S1	S2	S3/HD	L1	L2
Före den 1 juli 2023 ¹	0,5	1	6	12	12	36
1 juli 2023 till 3 april 2024 ²	1	3	12	36	12	36
3 april 2024 till och med 17 maj 2024 ³	5	35	150	300	12	36
Efter den 17 maj 2024 ⁴	5	35	150	300	150	300

¹ Inledande vektorgränser under tidig förhandsversion.

² Vektorgränser under den senare förhandsgranskningsperioden. Tre regioner hade inte de högre gränserna: Tyskland, västra centrala, Indien, västra, Qatar Centrala.

³ Högre vektorkvot baserat på de större partitionerna för nivåer och regioner som stöds.

⁴ Högre vektorkvot för fler nivåer och regioner baserat på uppdateringar av partitionsstorlek.

Tjänsten tillämpar en vektorindexstorlekskvot för varje partition i söktjänsten. Varje extra partition ökar den tillgängliga vektorindexstorlekskvoten. Den här kvoten är en hård gräns för att säkerställa att tjänsten förblir felfri, vilket innebär att ytterligare indexeringsförsök när gränsen överskrids resulterar i fel. Du kan återuppta indexeringen när du frigör den tillgängliga kvoten genom att antingen ta bort vissa vektordokument eller genom att skala upp i partitioner.

Viktigt!

Högre vektorgränser är knutna till större partitionsstorlekar. Regioner som körs på äldre infrastruktur omfattas av gränserna för juli-april. Granska regionslistan för status för partitionslagringsgränser.

Indexerares gränser

Det finns maximala körningstider för att ge balans och stabilitet till tjänsten som helhet, men större datamängder kan behöva mer indexeringstid än vad maxgränsen tillåter. Om ett indexeringsjobb inte kan slutföras inom den maximala tillåtna tiden kan du prova att köra det enligt ett schema. Schemaläggaren håller reda på indexeringsstatusen. Om ett schemalagt indexeringsjobb avbryts av någon anledning kan indexeraren fortsätta där det senast slutade vid nästa schemalagda körning.

Resurs	Gratis ¹	Grundläggande ²	S1	S2	S3	S3 HD ³	L1	L2
Maximalt antal indexerare	3	5 eller 15	50	200	200	Ej tillämpligt	10	10
Maximalt antal datakällor	3	5 eller 15	50	200	200	Ej tillämpligt	10	10
Maximala kompetensuppsättningar ⁴	3	5 eller 15	50	200	200	Ej tillämpligt	10	10
Maximal indexeringsbelastning per anrop	10 000 dokument	Begränsas endast av maximalt antal dokument	Begränsas endast av maximalt antal dokument	Begränsas endast av maximalt antal dokument	Begränsas endast av maximalt antal dokument	Ej tillämpligt	Ingen begränsning	Ingen begränsning
Minsta schema	5 minuter	5 minuter	5 minuter	5 minuter	5 minuter	5 minuter	5 minuter	5 minuter
Maximal körningstid ⁵	1–3 minuter	2 eller 24 timmar	2 eller 24 timmar	2 eller 24 timmar	2 eller 24 timmar	Ej tillämpligt	2 eller 24 timmar	2 eller 24 timmar
Maximal körtid för indexerare med en kompetensuppsättning ⁶	3–10 minuter	2 timmar	2 timmar	2 timmar	2 timmar	Ej tillämpligt	2 timmar	2 timmar
Blob-indexerare: maximal blobstorlek, MB	16	16	128	256	256	Ej tillämpligt	256	256
Blob-indexerare: maximala tecken på innehåll som extraherats från en blob	32,000	64,000	4 miljoner	8 miljoner	16 miljoner	Ej tillämpligt	4 miljoner	4 miljoner

¹ Kostnadsfria tjänster har en maximal körningstid på 3 minuter för blobkällor och 1 minut för alla andra datakällor. Indexerarens anrop är en gång var 180:e sekund. För AI-indexering som anropar till Azure AI-tjänster är kostnadsfria tjänster begränsade till 20 kostnadsfria transaktioner per indexerare per dag, där en transaktion definieras som ett dokument som har passerat via berikande pipelinen (tips: du kan återställa en indexerare för att återställa antalet).

² Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för indexerare, datakällor och kompetensuppsättningar.

³ S3 HD-tjänster innehåller inte stöd för indexerare.

⁴ Högst 30 färdigheter per kompetensuppsättning.

⁵ Vad gäller den maximala varaktigheten på 2 eller 24 timmar för indexerare: ett maxvärde på 2 timmar är det vanligaste och det är vad du bör planera för. Gränsen på 24 timmar kommer från en äldre indexerareimplementering. Om du har oplanerade indexerare som körs kontinuerligt i 24 timmar beror det på att indexerarna inte kunde migreras till den nyare infrastrukturen. För indexeringsjobb som inte kan slutföras inom två timmar bör indexeraren som en allmän regel placera indexeraren enligt ett 2-timmarsschema. När det första 2-timmarsintervallet är klart, fortsätter indexeraren där den slutade när nästa 2-timmarsintervall startas.

⁶ Körning av kompetensuppsättningar, och i synnerhet bildanalys, är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Körningstiden för dessa arbetsbelastningar är kortare så att andra jobb i kön har större möjlighet att köras.

Kommentar

Som anges i indexgränserna framtvingar indexerare också den övre gränsen på 3 000 element i alla komplexa samlingar per dokument som börjar med den senaste GA API-versionen som stöder komplexa typer (2019-05-06) och senare. Det innebär att om du har skapat indexeraren med en tidigare API-version kommer du inte att omfattas av den här gränsen. För att bevara maximal kompatibilitet undantas fortfarande en indexerare som skapades med en tidigare API-version och sedan uppdaterades med en API-version 2019-05-06 eller senare från gränserna. Kunder bör vara medvetna om den negativa effekten av att ha mycket stora komplexa samlingar (som tidigare nämnts) och vi rekommenderar starkt att du skapar nya indexerare med den senaste GA API-versionen.

Resursbegränsningar för delad privat länk

Indexerare kan komma åt andra Azure-resurser via privata slutpunkter som hanteras via resurs-API:et för delad privat länk. I det här avsnittet beskrivs de gränser som är associerade med den här funktionen.

Resurs	Kostnadsfri	Grundläggande	S1	S2	S3	S3 HD	L1	L2
Stöd för privat slutpunktsindexerare	Nej	Ja	Ja	Ja	Ja	No	Ja	Ja
Stöd för privat slutpunkt för indexerare med en kompetensuppsättning¹	Nej	Nej	Nej	Ja	Ja	No	Ja	Ja
Maximalt antal privata slutpunkter	Ej tillämpligt	10 eller 30	100	400	400	Ej tillämpligt	20	20
Maximalt antal distinkta resurstyper²	Ej tillämpligt	4	7	15	15	Ej tillämpligt	4	4

¹ AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Därför inaktiveras privata anslutningar på lägre nivåer för att säkerställa prestanda och stabilitet för själva söktjänsten.

² Antalet distinkta resurstyper beräknas som antalet unika groupId värden som används för alla delade privata länkresurser för en viss söktjänst, oavsett resursens status.

Synonymgränser

Maximalt antal synonymkartor varierar beroende på nivå. Varje regel kan ha upp till 20 expansioner, där en expansion är en motsvarande term. Till exempel skulle givet "katt", association med "kitty", "kattdjur" och "felis" (släktet för katter) räknas som 3 expansioner.

Resurs	Kostnadsfri	Grundläggande	S1	S2	S3	S3-HD	L1	L2
Maximalt antal synonymkartor	3	3	5	10	20	20	10	10
Maximalt antal regler per karta	5000	20000	20000	20000	20000	20000	20000	20000

Indexaliasgränser

Det maximala antalet indexalias varierar beroende på nivå. På alla nivåer är det maximala antalet alias dubbelt så många index som tillåts.

Resurs	Kostnadsfri	Grundläggande	S1	S2	S3	S3-HD	L1	L2
Maximalt antal alias	6	10 eller 30	100	400	400	2 000 per partition eller 6 000 per tjänst	20	20

Datagränser (AI-berikning)

En PIPELINE för AI-berikande som anropar en Azure AI Language-resurs för entitetsigenkänning, entitetslänkning, extrahering av nyckelfraser, attitydanalys, språkidentifiering och identifiering av personlig information omfattas av datagränser. Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till attitydanalysatorn använder du färdigheten Textdelning.

Begränsningsgränser

API-begäranden begränsas när systemet närmar sig högsta kapacitet. Begränsning fungerar annorlunda för olika API:er. Fråge-API:er (Sök/föreslå/komplettera automatiskt) och indexera API:er begränsas dynamiskt baserat på belastningen på tjänsten. Api:er för index- och tjänståtgärder har gränser för statiska begäranden.

Gränser för begäranden om statisk hastighet för åtgärder relaterade till ett index:

Listindex (GET /index): 3 per sekund per sökenhet
Hämta index (GET /index/myindex): 10 per sekund per sökenhet
Skapa index (POST /index): 12 per minut per sökenhet
Skapa eller uppdatera index (PUT /index/myindex): 6 per sekund per sökenhet
Ta bort index (DELETE /index/myindex): 12 per minut per sökenhet

Gränser för statiska begäranden för åtgärder relaterade till en tjänst:

Tjänststatistik (GET/servicestats): 4 per sekund per sökenhet

L2-omrankning med hjälp av semantisk reranker har en förväntad volym:

Upp till 10 samtidiga frågor per replik. Om du förväntar dig konsekventa dataflödeskrav nära, på eller högre än den här nivån kan du skicka in ett supportärende så att vi kan etablera för din arbetsbelastning.

API-begärandens gränser

Maximalt 16 MB per begäran ¹
Maximal längd på 8 KB URL
Maximalt 1 000 dokument per batch med indexuppladdningar, sammanslagningar eller borttagningar
Maximalt 32 fält i $orderby-sats
Maximalt 100 000 tecken i en söksats
Det maximala antalet satser i search (uttryck avgränsade med AND eller OR) är 1024
Maximal söktermsstorlek är 32 766 byte (32 KB minus 2 byte) AV UTF-8-kodad text
Maximal söktermsstorlek är 1 000 tecken för prefixsökning och regex-sökning
Sökning efter jokertecken och reguljära uttryck är begränsade till högst 1 000 tillstånd när de bearbetas av Lucene.

¹ I Azure AI Search omfattas en begärans brödtext av en övre gräns på 16 MB, vilket medför en praktisk gräns för innehållet i enskilda fält eller samlingar som annars inte begränsas av teoretiska gränser (se Datatyper som stöds för mer information om fältsammansättning och begränsningar).

Det finns gränser för frågestorlek och sammansättning eftersom obundna frågor kan destabilisera söktjänsten. Vanligtvis skapas sådana frågor programmatiskt. Om ditt program genererar sökfrågor programmatiskt rekommenderar vi att du utformar det på ett sådant sätt att det inte genererar frågor av obundna storlekar.

API-svarsgränser

Maximalt 1 000 dokument som returneras per sida med sökresultat
Maximalt 100 förslag som returneras per förslag på API-begäran

API-nyckelgränser

API-nycklar används för tjänstautentisering. Det finns två typer. Administratörsnycklar anges i begärandehuvudet och ger fullständig läs- och skrivbehörighet till tjänsten. Frågenycklar är skrivskyddade, anges på URL:en och distribueras vanligtvis till klientprogram.

Maximalt 2 administratörsnycklar per tjänst
Maximalt 50 frågenycklar per tjänst

Dela via