Tjänstbegränsningar i Azure AI Search
Maximala gränser för lagring, arbetsbelastningar och mängder index och andra objekt beror på om du skapar Azure AI Search på prisnivåerna Kostnadsfri, Basic, Standard eller Lagringsoptimerad .
Kostnadsfri är en delad tjänst med flera klienter som medföljer din Azure-prenumeration.
Basic tillhandahåller dedikerade beräkningsresurser för produktionsarbetsbelastningar i mindre skala, men delar en del nätverksinfrastruktur med andra klienter.
Standard körs på dedikerade datorer med mer lagrings- och bearbetningskapacitet på alla nivåer. Standard finns i fyra nivåer: S1, S2, S3 och S3 HD. S3 High Density (S3 HD) är konstruerad för flera innehavare och stora mängder små index (3 000 index per tjänst). S3 HD tillhandahåller inte indexerarens funktion och datainmatning måste använda API:er som skickar data från källa till index.
Lagringsoptimerad körs på dedikerade datorer med mer total lagring, lagringsbandbredd och minne än Standard. Den här nivån riktar sig till stora, långsamt föränderliga index. Lagringsoptimerad finns på två nivåer: L1 och L2.
Prenumerationsgränser
Du kan skapa flera fakturerbara söktjänster (Basic och högre), upp till det maximala antalet tjänster som tillåts på varje nivå. Du kan till exempel skapa upp till 16 tjänster på basic-nivån och ytterligare 16 tjänster på S1-nivån inom samma prenumeration. Mer information om nivåer finns i Välj en nivå (eller SKU) för Azure AI Search.
Maximala tjänstgränser kan höjas vid begäran. Om du behöver fler tjänster i samma prenumeration skickar du en supportbegäran.
Resurs | Gratis 1 | Grundläggande | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal tjänster | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maximalt antal sökenheter (SU)2 | Ej tillämpligt | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Du kan ha en kostnadsfri söktjänst per Azure-prenumeration. Den kostnadsfria nivån baseras på infrastruktur som delas med andra kunder. Eftersom maskinvaran inte är dedikerad stöds inte uppskalning och lagringen är begränsad till 50 MB.
2 Sökenheter (SU) är faktureringsenheter som allokerats som antingen en replik eller en partition. Du behöver båda. Mer information om SU-kombinationer finns i Uppskatta och hantera kapaciteten för en söktjänst.
Tjänstbegränsningar
I följande tabell beskrivs serviceavtal, antal partitioner och repliker på tjänstnivå.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Serviceavtal (SLA) | Nej | Ja | Ja | Ja | Ja | Ja | Ja | Ja |
Partitioner | Ej tillämpligt | 3 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Repliker | Ej tillämpligt | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Basic-nivån stöder tre partitioner och tre repliker, för totalt nio sökenheter (SU) på nya söktjänster som skapats efter den 3 april 2024. Äldre grundläggande tjänster är begränsade till en partition och tre repliker.
En söktjänst omfattas av en maximal lagringsgräns (partitionsstorlek multiplicerat med antalet partitioner) eller med en hård gräns för det maximala antalet index eller indexerare, beroende på vilket som inträffar först.
Serviceavtal (SLA) gäller för fakturerbara tjänster som har två eller flera repliker för frågearbetsbelastningar, eller tre eller fler repliker för arbetsbelastningar för frågor och indexering. Antalet partitioner är inte ett SLA-övervägande. Mer information finns i Tillförlitlighet i Azure AI Search.
Kostnadsfria tjänster har inte fasta partitioner eller repliker och de delar resurser med andra prenumeranter.
Partitionslagring (GB)
Lagringsgränserna per tjänst varierar beroende på två saker: datum för skapande av tjänst och region. Det finns högre gränser för nyare tjänster i de flesta regioner som stöds.
Den här tabellen visar hur lagringskvoten ökar i GB över tid. Partitioner med högre kapacitet togs online från och med april 2024, i de regioner som anges i fotnoterna. Högre kapacitet är begränsad till nya söktjänster. Det finns ingen uppgradering på plats just nu.
Datum då tjänsten skapades | Grundläggande | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Före den 3 april 2024 | 2 | 25 | 100 | 200 | 1,024 | 2 048 |
3 april 2024 till och med 17 maj 2024 1 | 15 | 160 | 512 | 1,024 | 1,024 | 2 048 |
Efter den 17 maj 2024 2 | 15 | 160 | 512 | 1,024 | 2,048 | 4,096 |
1 Lagring med högre kapacitet för Basic, S1, S2, S3 i dessa regioner. Amerika: Brasilien, södra, Kanada, centrala, Kanada, östra, USA, östra, USA, östra 2, USA, centrala, USA, norra centrala, USA, södra centrala, USA, västra, USA, västra 2, USA, västra 3, USA, västra centrala. Europa: Frankrike, centrala. Italien, norra, Europa, norra, Norge, östra, Polen, centrala, Schweiz, norra, Sverige, centrala, Storbritannien, södra, Storbritannien, västra. Mellanöstern: Förenade Arabemiraten, norra. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Australien, östra, Australien, sydöstra, Indien, centrala, Jio Indien, västra, Asien, östra, Sydostasien, Japan, östra, Japan, västra, Korea, centrala, Sydkorea, södra.
2 Lagring med högre kapacitet för L1 och L2. Fler regioner ger högre kapacitet på varje fakturerbar nivå. Europa: Tyskland, norra, Tyskland, västra centrala, Schweiz, västra. Azure Government: Texas, Arizona, Virginia. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Kina, norra 3, Kina, östra 3.
Några regioner körs fortfarande på äldre infrastruktur, med förbehåll för gränserna för 3 april. Innan du skapar en ny tjänst kontrollerar du vilka regioner som stöds för att se till att valfri region ger den extra kapaciteten.
Indexgränser
Resurs | Kostnadsfri | Grundläggande 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal index | 3 | 5 eller 15 | 50 | 200 | 200 | 1 000 per partition eller 3 000 per tjänst | 10 | 10 |
Maximalt antal enkla fält per index 2 | 1000 | 100 | 1 000 | 1 000 | 1 000 | 1 000 | 1 000 | 1 000 |
Maximala dimensioner per vektorfält | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 | 4098 |
Maximalt antal komplexa samlingar per index | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maximalt antal element i alla komplexa samlingar per dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maximalt djup för komplexa fält | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maximalt antal förslag per index | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maximalt antal bedömningsprofiler per index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maximalt antal funktioner per profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
Maximal indexstorlek 4 | Saknas | Saknas | Saknas | 1,88 TB | 2,34 TB | 100 GB | Saknas | Saknas |
1 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för index. Basic-nivån är den enda nivån med en lägre gräns på 100 fält per index.
2 Den övre gränsen för fält innehåller både fält på första nivån och kapslade underfält i en komplex samling. Om ett index till exempel innehåller 15 fält och har två komplexa samlingar med fem underfält vardera är fältantalet för ditt index 25. Index med en mycket stor fältsamling kan vara långsamma. Begränsa fält och attribut till bara de du behöver och kör indexerings- och frågetestet för att säkerställa att prestandan är acceptabel.
3 Det finns en övre gräns för element eftersom ett stort antal av dem avsevärt ökar det lagringsutrymme som krävs för ditt index. Ett element i en komplex samling definieras som medlem i samlingen. Anta till exempel att ett hotelldokument med en rumskomplex samling, varje rum i samlingen Rum betraktas som ett element. Under indexeringen kan indexeringsmotorn på ett säkert sätt bearbeta högst 3 000 element i hela dokumentet. Den här gränsen infördes i api-version=2019-05-06
och gäller endast för komplexa samlingar och inte för strängsamlingar eller komplexa fält.
4 På de flesta nivåer är den maximala indexstorleken all tillgänglig lagring i söktjänsten. För S2, S3 och S3 HD är den maximala storleken på ett index det antal som anges i tabellen. Gäller för söktjänster som skapats efter den 3 april 2024.
Du kan hitta en viss variation i maximala gränser om din tjänst råkar etableras i ett mer kraftfullt kluster. Gränserna här representerar den gemensamma nämnaren. Index som skapats enligt ovanstående specifikationer är portabla på motsvarande tjänstnivåer i alla regioner.
Dokumentbegränsningar
Maximalt antal dokument per index är:
- 24 miljarder på söktjänsterna Basic, S1, S2, S3, L1 och L2.
- 2 miljarder på S3 HD.
Varje instans av en komplex samling räknas som ett separat dokument när det gäller dessa gränser.
Den maximala dokumentstorleken när du anropar ett Index-API är cirka 16 megabyte.
Dokumentstorleken är faktiskt en gräns för storleken på index-API-begärandetexten. Eftersom du kan skicka en batch med flera dokument till index-API:et samtidigt beror storleksgränsen realistiskt på hur många dokument som finns i batchen. För en batch med ett enda dokument är den maximala dokumentstorleken 16 MB JSON.
När du beräknar dokumentstorleken bör du bara tänka på de fält som lägger till värde i dina sökscenarier och exkludera alla källfält som inte har något syfte i de frågor som du tänker köra.
Storleksgränser för vektorindex
När du indexerar dokument med vektorfält skapar Azure AI Search interna vektorindex med hjälp av de algoritmparametrar du anger. Storleken på dessa vektorindex begränsas av det minne som är reserverat för vektorsökning efter tjänstens nivå (eller SKU
). Vägledning om hur du hanterar och maximerar vektorlagring finns i Vektorindexstorlek och att hålla sig under gränser.
Vektorgränser varierar beroende på:
Det finns högre vektorgränser från april 2024 och framåt på nya söktjänster i regioner som tillhandahåller den extra kapaciteten, vilket är de flesta av dem.
Den här tabellen visar utvecklingen av vektorkvotökningar i GB över tid. Kvoten är per partition, så om du skalar en ny standardtjänst (S1) till 6 partitioner är den totala vektorkvoten 35 multiplicerad med 6.
Datum då tjänsten skapades | Grundläggande | S1 | S2 | S3/HD | L1 | L2 |
---|---|---|---|---|---|---|
Före den 1 juli 2023 1 | 0,5 | 1 | 6 | 12 | 12 | 36 |
1 juli 2023 till 3 april 2024 2 | 1 | 3 | 12 | 36 | 12 | 36 |
3 april 2024 till och med 17 maj 2024 3 | 5 | 35 | 150 | 300 | 12 | 36 |
Efter den 17 maj 2024 4 | 5 | 35 | 150 | 300 | 150 | 300 |
1 Inledande vektorgränser under tidig förhandsversion.
2 Vektorgränser under den senare förhandsgranskningsperioden. Tre regioner hade inte de högre gränserna: Tyskland, västra centrala, Indien, västra, Qatar Centrala.
3 Högre vektorkvot baserat på de större partitionerna för nivåer och regioner som stöds.
4 Högre vektorkvot för fler nivåer och regioner baserat på uppdateringar av partitionsstorlek.
Tjänsten tillämpar en vektorindexstorlekskvot för varje partition i söktjänsten. Varje extra partition ökar den tillgängliga vektorindexstorlekskvoten. Den här kvoten är en hård gräns för att säkerställa att tjänsten förblir felfri, vilket innebär att ytterligare indexeringsförsök när gränsen överskrids resulterar i fel. Du kan återuppta indexeringen när du frigör den tillgängliga kvoten genom att antingen ta bort vissa vektordokument eller genom att skala upp i partitioner.
Viktigt!
Högre vektorgränser är knutna till större partitionsstorlekar. Regioner som körs på äldre infrastruktur omfattas av gränserna för juli-april. Granska regionslistan för status för partitionslagringsgränser.
Indexerares gränser
Det finns maximala körningstider för att ge balans och stabilitet till tjänsten som helhet, men större datamängder kan behöva mer indexeringstid än vad maxgränsen tillåter. Om ett indexeringsjobb inte kan slutföras inom den maximala tillåtna tiden kan du prova att köra det enligt ett schema. Schemaläggaren håller reda på indexeringsstatusen. Om ett schemalagt indexeringsjobb avbryts av någon anledning kan indexeraren fortsätta där det senast slutade vid nästa schemalagda körning.
Resurs | Gratis 1 | Grundläggande 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal indexerare | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Maximalt antal datakällor | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Maximala kompetensuppsättningar 4 | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Maximal indexeringsbelastning per anrop | 10 000 dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Ej tillämpligt | Ingen begränsning | Ingen begränsning |
Minsta schema | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter |
Maximal körningstid 5 | 1–3 minuter | 2 eller 24 timmar | 2 eller 24 timmar | 2 eller 24 timmar | 2 eller 24 timmar | Ej tillämpligt | 2 eller 24 timmar | 2 eller 24 timmar |
Maximal körtid för indexerare med en kompetensuppsättning 6 | 3–10 minuter | 2 timmar | 2 timmar | 2 timmar | 2 timmar | Ej tillämpligt | 2 timmar | 2 timmar |
Blob-indexerare: maximal blobstorlek, MB | 16 | 16 | 128 | 256 | 256 | Ej tillämpligt | 256 | 256 |
Blob-indexerare: maximala tecken på innehåll som extraherats från en blob | 32,000 | 64,000 | 4 miljoner | 8 miljoner | 16 miljoner | Ej tillämpligt | 4 miljoner | 4 miljoner |
1 Kostnadsfria tjänster har en maximal körningstid på 3 minuter för blobkällor och 1 minut för alla andra datakällor. Indexerarens anrop är en gång var 180:e sekund. För AI-indexering som anropar till Azure AI-tjänster är kostnadsfria tjänster begränsade till 20 kostnadsfria transaktioner per indexerare per dag, där en transaktion definieras som ett dokument som har passerat via berikande pipelinen (tips: du kan återställa en indexerare för att återställa antalet).
2 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för indexerare, datakällor och kompetensuppsättningar.
3 S3 HD-tjänster innehåller inte stöd för indexerare.
4 Högst 30 färdigheter per kompetensuppsättning.
5 Vad gäller den maximala varaktigheten på 2 eller 24 timmar för indexerare: ett maxvärde på 2 timmar är det vanligaste och det är vad du bör planera för. Gränsen på 24 timmar kommer från en äldre indexerareimplementering. Om du har oplanerade indexerare som körs kontinuerligt i 24 timmar beror det på att indexerarna inte kunde migreras till den nyare infrastrukturen. För indexeringsjobb som inte kan slutföras inom två timmar bör indexeraren som en allmän regel placera indexeraren enligt ett 2-timmarsschema. När det första 2-timmarsintervallet är klart, fortsätter indexeraren där den slutade när nästa 2-timmarsintervall startas.
6 Körning av kompetensuppsättningar, och i synnerhet bildanalys, är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Körningstiden för dessa arbetsbelastningar är kortare så att andra jobb i kön har större möjlighet att köras.
Kommentar
Som anges i indexgränserna framtvingar indexerare också den övre gränsen på 3 000 element i alla komplexa samlingar per dokument som börjar med den senaste GA API-versionen som stöder komplexa typer (2019-05-06
) och senare. Det innebär att om du har skapat indexeraren med en tidigare API-version kommer du inte att omfattas av den här gränsen. För att bevara maximal kompatibilitet undantas fortfarande en indexerare som skapades med en tidigare API-version och sedan uppdaterades med en API-version 2019-05-06
eller senare från gränserna. Kunder bör vara medvetna om den negativa effekten av att ha mycket stora komplexa samlingar (som tidigare nämnts) och vi rekommenderar starkt att du skapar nya indexerare med den senaste GA API-versionen.
Resursbegränsningar för delad privat länk
Indexerare kan komma åt andra Azure-resurser via privata slutpunkter som hanteras via resurs-API:et för delad privat länk. I det här avsnittet beskrivs de gränser som är associerade med den här funktionen.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Stöd för privat slutpunktsindexerare | Nej | Ja | Ja | Ja | Ja | No | Ja | Ja |
Stöd för privat slutpunkt för indexerare med en kompetensuppsättning1 | Nej | Nej | Nej | Ja | Ja | No | Ja | Ja |
Maximalt antal privata slutpunkter | Ej tillämpligt | 10 eller 30 | 100 | 400 | 400 | Ej tillämpligt | 20 | 20 |
Maximalt antal distinkta resurstyper2 | Ej tillämpligt | 4 | 7 | 15 | 15 | Ej tillämpligt | 4 | 4 |
1 AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Därför inaktiveras privata anslutningar på lägre nivåer för att säkerställa prestanda och stabilitet för själva söktjänsten.
2 Antalet distinkta resurstyper beräknas som antalet unika groupId
värden som används för alla delade privata länkresurser för en viss söktjänst, oavsett resursens status.
Synonymgränser
Maximalt antal synonymkartor varierar beroende på nivå. Varje regel kan ha upp till 20 expansioner, där en expansion är en motsvarande term. Till exempel skulle givet "katt", association med "kitty", "kattdjur" och "felis" (släktet för katter) räknas som 3 expansioner.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal synonymkartor | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maximalt antal regler per karta | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Indexaliasgränser
Det maximala antalet indexalias varierar beroende på nivå. På alla nivåer är det maximala antalet alias dubbelt så många index som tillåts.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal alias | 6 | 10 eller 30 | 100 | 400 | 400 | 2 000 per partition eller 6 000 per tjänst | 20 | 20 |
Datagränser (AI-berikning)
En PIPELINE för AI-berikande som anropar en Azure AI Language-resurs för entitetsigenkänning, entitetslänkning, extrahering av nyckelfraser, attitydanalys, språkidentifiering och identifiering av personlig information omfattas av datagränser. Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length
. Om du behöver dela upp dina data innan du skickar dem till attitydanalysatorn använder du färdigheten Textdelning.
Begränsningsgränser
API-begäranden begränsas när systemet närmar sig högsta kapacitet. Begränsning fungerar annorlunda för olika API:er. Fråge-API:er (Sök/föreslå/komplettera automatiskt) och indexera API:er begränsas dynamiskt baserat på belastningen på tjänsten. Api:er för index- och tjänståtgärder har gränser för statiska begäranden.
Gränser för begäranden om statisk hastighet för åtgärder relaterade till ett index:
- Listindex (GET /index): 3 per sekund per sökenhet
- Hämta index (GET /index/myindex): 10 per sekund per sökenhet
- Skapa index (POST /index): 12 per minut per sökenhet
- Skapa eller uppdatera index (PUT /index/myindex): 6 per sekund per sökenhet
- Ta bort index (DELETE /index/myindex): 12 per minut per sökenhet
Gränser för statiska begäranden för åtgärder relaterade till en tjänst:
- Tjänststatistik (GET/servicestats): 4 per sekund per sökenhet
L2-omrankning med hjälp av semantisk reranker har en förväntad volym:
- Upp till 10 samtidiga frågor per replik. Om du förväntar dig konsekventa dataflödeskrav nära, på eller högre än den här nivån kan du skicka in ett supportärende så att vi kan etablera för din arbetsbelastning.
API-begärandens gränser
- Maximalt 16 MB per begäran 1
- Maximal längd på 8 KB URL
- Maximalt 1 000 dokument per batch med indexuppladdningar, sammanslagningar eller borttagningar
- Maximalt 32 fält i $orderby-sats
- Maximalt 100 000 tecken i en söksats
- Det maximala antalet satser i
search
(uttryck avgränsade med AND eller OR) är 1024 - Maximal söktermsstorlek är 32 766 byte (32 KB minus 2 byte) AV UTF-8-kodad text
- Maximal söktermsstorlek är 1 000 tecken för prefixsökning och regex-sökning
- Sökning efter jokertecken och reguljära uttryck är begränsade till högst 1 000 tillstånd när de bearbetas av Lucene.
1 I Azure AI Search omfattas en begärans brödtext av en övre gräns på 16 MB, vilket medför en praktisk gräns för innehållet i enskilda fält eller samlingar som annars inte begränsas av teoretiska gränser (se Datatyper som stöds för mer information om fältsammansättning och begränsningar).
Det finns gränser för frågestorlek och sammansättning eftersom obundna frågor kan destabilisera söktjänsten. Vanligtvis skapas sådana frågor programmatiskt. Om ditt program genererar sökfrågor programmatiskt rekommenderar vi att du utformar det på ett sådant sätt att det inte genererar frågor av obundna storlekar.
API-svarsgränser
- Maximalt 1 000 dokument som returneras per sida med sökresultat
- Maximalt 100 förslag som returneras per förslag på API-begäran
API-nyckelgränser
API-nycklar används för tjänstautentisering. Det finns två typer. Administratörsnycklar anges i begärandehuvudet och ger fullständig läs- och skrivbehörighet till tjänsten. Frågenycklar är skrivskyddade, anges på URL:en och distribueras vanligtvis till klientprogram.
- Maximalt 2 administratörsnycklar per tjänst
- Maximalt 50 frågenycklar per tjänst