Dela via


Tjänstbegränsningar i Azure AI Search

Maximala gränser för lagring, arbetsbelastningar och mängder index och andra objekt beror på om du skapar Azure AI Searchprisnivåerna Kostnadsfri, Basic, Standard eller Lagringsoptimerad .

  • Kostnadsfri är en delad tjänst med flera klienter som medföljer din Azure-prenumeration.

  • Basic tillhandahåller dedikerade beräkningsresurser för produktionsarbetsbelastningar i mindre skala, men delar en del nätverksinfrastruktur med andra klienter.

  • Standard körs på dedikerade datorer med mer lagrings- och bearbetningskapacitet på alla nivåer. Standard finns i fyra nivåer: S1, S2, S3 och S3 HD. S3 High Density (S3 HD) är konstruerad för flera innehavare och stora mängder små index (3 000 index per tjänst). S3 HD tillhandahåller inte indexerarens funktion och datainmatning måste använda API:er som skickar data från källa till index.

  • Lagringsoptimerad körs på dedikerade datorer med mer total lagring, lagringsbandbredd och minne än Standard. Den här nivån riktar sig till stora, långsamt föränderliga index. Lagringsoptimerad finns på två nivåer: L1 och L2.

Prenumerationsgränser

Du kan skapa flera fakturerbara söktjänster (Basic och högre), upp till det maximala antalet tjänster som tillåts på varje nivå, per region. Du kan till exempel skapa upp till 16 tjänster på basic-nivån och ytterligare 16 tjänster på S1-nivån inom samma prenumeration och region. Du kan sedan skapa ytterligare 16 grundläggande tjänster i en annan region för sammanlagt 32 Basic-tjänster under samma prenumeration. Mer information om nivåer finns i Välj en nivå (eller SKU) för Azure AI Search.

Maximala tjänstgränser kan höjas vid begäran. Om du behöver fler tjänster i samma prenumeration skickar du en supportbegäran.

Resurs Gratis 1 Grundläggande S1 S2 S3 S3 HD L1 L2
Maximalt antal tjänster per region 1 16 16 8 6 6 6 6
Maximalt antal sökenheter (SU)2 Ej tillämpligt 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Du kan ha en kostnadsfri söktjänst per Azure-prenumeration. Den kostnadsfria nivån baseras på infrastruktur som delas med andra kunder. Eftersom maskinvaran inte är dedikerad stöds inte uppskalning och lagringen är begränsad till 50 MB. En kostnadsfri söktjänst kan tas bort efter längre perioder av inaktivitet för att göra plats för fler tjänster.

2 Sökenheter (SU) är faktureringsenheter som allokerats som antingen en replik eller en partition. Du behöver båda. Mer information om SU-kombinationer finns i Uppskatta och hantera kapaciteten för en söktjänst.

Tjänstbegränsningar

I följande tabell beskrivs serviceavtal, antal partitioner och repliker på tjänstnivå.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3 HD L1 L2
Serviceavtal (SLA) Nej Ja Ja Ja Ja Ja Ja Ja
Partitioner Ej tillämpligt 3 1 12 12 12 3 12 12
Repliker Ej tillämpligt 3 12 12 12 12 12 12

1 Basic-nivån stöder tre partitioner och tre repliker, för totalt nio sökenheter (SU) på nya söktjänster som skapats efter den 3 april 2024. Äldre grundläggande tjänster är begränsade till en partition och tre repliker.

En söktjänst omfattas av en maximal lagringsgräns (partitionsstorlek multiplicerat med antalet partitioner) eller med en hård gräns för det maximala antalet index eller indexerare, beroende på vilket som inträffar först.

Serviceavtal (SLA) gäller för fakturerbara tjänster som har två eller flera repliker för frågearbetsbelastningar, eller tre eller fler repliker för arbetsbelastningar för frågor och indexering. Antalet partitioner är inte ett SLA-övervägande. Mer information finns i Tillförlitlighet i Azure AI Search.

Kostnadsfria tjänster har inte fasta partitioner eller repliker och de delar resurser med andra prenumeranter.

Partitionslagring (GB)

Lagringsgränserna per tjänst varierar beroende på två saker: datum för skapande av tjänst och region. Det finns högre gränser för nyare tjänster i de flesta regioner som stöds.

Den här tabellen visar hur lagringskvoten ökar i GB över tid. Partitioner med högre kapacitet togs online från och med april 2024, i de regioner som anges i fotnoterna. Högre kapacitet är begränsad till nya söktjänster. Det finns ingen uppgradering på plats just nu.

Datum då tjänsten skapades Grundläggande S1 S2 S3/HD L1 L2
Före den 3 april 2024 2 25 100 200 1,024 2 048
3 april 2024 till och med 17 maj 2024 1 15 160 512 1,024 1,024 2 048
Efter den 17 maj 2024 2 15 160 512 1,024 2,048 4,096

1 Lagring med högre kapacitet för Basic, S1, S2, S3 i dessa regioner. Amerika: Brasilien, södra, Kanada, centrala, Kanada, östra, USA, östra, USA, östra 2, USA, centrala, USA, norra centrala, USA, södra centrala, USA, västra, USA, västra 2, USA, västra 3, USA, västra centrala. Europa: Frankrike, centrala. Italien, norra, Europa, norra, Norge, östra, Polen, centrala, Schweiz, norra, Sverige, centrala, Storbritannien, södra, Storbritannien, västra. Mellanöstern: Förenade Arabemiraten, norra. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Australien, östra, Australien, sydöstra, Indien, centrala, Jio Indien, västra, Asien, östra, Sydostasien, Japan, östra, Japan, västra, Korea, centrala, Sydkorea, södra.

2 Lagring med högre kapacitet för L1 och L2. Fler regioner ger högre kapacitet på varje fakturerbar nivå. Europa: Tyskland, norra, Tyskland, västra centrala, Schweiz, västra. Azure Government: Texas, Arizona, Virginia. Afrika: Sydafrika, norra. Asien och stillahavsområdet: Kina, norra 3, Kina, östra 3.

Några regioner körs fortfarande på äldre infrastruktur, med förbehåll för gränserna för 3 april. Innan du skapar en ny tjänst kontrollerar du vilka regioner som stöds för att se till att valfri region ger den extra kapaciteten.

Indexgränser

Resurs Kostnadsfri Grundläggande 1 S1 S2 S3 S3 HD L1 L2
Maximalt antal index 3 5 eller 15 50 200 200 1 000 per partition eller 3 000 per tjänst 10 10
Maximalt antal enkla fält per index 2 1000 100 1 000 1 000 1 000 1 000 1 000 1 000
Maximala dimensioner per vektorfält 4098 4098 4098 4098 4098 4098 4098 4098
Maximalt antal komplexa samlingar per index 40 40 40 40 40 40 40 40
Maximalt antal element i alla komplexa samlingar per dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximalt djup för komplexa fält 10 10 10 10 10 10 10 10
Maximalt antal förslag per index 1 1 1 1 1 1 1 1
Maximalt antal bedömningsprofiler per index 100 100 100 100 100 100 100 100
Maximalt antal funktioner per profil 8 8 8 8 8 8 8 8
Maximal indexstorlek 4 Saknas Saknas Saknas 1,88 TB 2,34 TB 100 GB Saknas Saknas

1 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för index. Basic-nivån är den enda nivån med en lägre gräns på 100 fält per index.

2 Den övre gränsen för fält innehåller både fält på första nivån och kapslade underfält i en komplex samling. Om ett index till exempel innehåller 15 fält och har två komplexa samlingar med fem underfält vardera är fältantalet för ditt index 25. Index med en mycket stor fältsamling kan vara långsamma. Begränsa fält och attribut till bara de du behöver och kör indexerings- och frågetestet för att säkerställa att prestandan är acceptabel.

3 Det finns en övre gräns för element eftersom ett stort antal av dem avsevärt ökar det lagringsutrymme som krävs för ditt index. Ett element i en komplex samling definieras som medlem i samlingen. Anta till exempel att ett hotelldokument med en rumskomplex samling, varje rum i samlingen Rum betraktas som ett element. Under indexeringen kan indexeringsmotorn på ett säkert sätt bearbeta högst 3 000 element i hela dokumentet. Den här gränsen infördes i api-version=2019-05-06 och gäller endast för komplexa samlingar och inte för strängsamlingar eller komplexa fält.

4 På de flesta nivåer är den maximala indexstorleken all tillgänglig lagring i söktjänsten. För S2, S3 och S3 HD är den maximala storleken på ett index det antal som anges i tabellen. Gäller för söktjänster som skapats efter den 3 april 2024.

Du kan hitta en viss variation i maximala gränser om din tjänst råkar etableras i ett mer kraftfullt kluster. Gränserna här representerar den gemensamma nämnaren. Index som skapats enligt ovanstående specifikationer är portabla på motsvarande tjänstnivåer i alla regioner.

Dokumentbegränsningar

Maximalt antal dokument per index är:

  • 24 miljarder på Basic, S1, S2, S3
  • 2 miljarder på S3 HD
  • 288 miljarder på L1
  • 576 miljarder på L2

Varje instans av en komplex samling räknas som ett separat dokument när det gäller dessa gränser.

Maximal storlek för varje dokument är cirka 16 megabyte. Dokumentstorleken är faktiskt en gräns för storleken på nyttolasten för indexerings-API:ets begäran, som är 16 megabyte. Den nyttolasten kan vara ett enda dokument eller en batch med dokument. För en batch med ett enda dokument är den maximala dokumentstorleken 16 MB JSON.

Dokumentstorleken gäller för push-lägesindexering som överför dokument till en söktjänst. Om du använder en indexerare för pull-lägesindexering kan källfilerna vara valfri filstorlek, med indexeringsgränser. För blobindexeraren är filstorleksgränserna större för högre nivåer. S1-gränsen är till exempel 128 megabyte, S2-gränsen är 256 megabyte och så vidare.

När du beräknar dokumentstorleken bör du bara indexera de fält som lägger till värde i dina sökscenarier och exkludera källfält som inte har något syfte i de frågor som du tänker köra.

Storleksgränser för vektorindex

När du indexerar dokument med vektorfält skapar Azure AI Search interna vektorindex med hjälp av de algoritmparametrar du anger. Storleken på dessa vektorindex begränsas av det minne som är reserverat för vektorsökning efter tjänstens nivå (eller SKU). Vägledning om hur du hanterar och maximerar vektorlagring finns i Vektorindexstorlek och att hålla sig under gränser.

Vektorgränser varierar beroende på:

Det finns högre vektorgränser från april 2024 och framåt på nya söktjänster i regioner som tillhandahåller den extra kapaciteten, vilket är de flesta av dem.

Den här tabellen visar utvecklingen av vektorkvotökningar i GB över tid. Kvoten är per partition, så om du skalar en ny standardtjänst (S1) till 6 partitioner är den totala vektorkvoten 35 multiplicerad med 6.

Datum då tjänsten skapades Grundläggande S1 S2 S3/HD L1 L2
Före den 1 juli 2023 1 0,5 1 6 12 12 36
1 juli 2023 till 3 april 2024 2 1 3 12 36 12 36
3 april 2024 till och med 17 maj 2024 3 5 35 150 300 12 36
Efter den 17 maj 2024 4 5 35 150 300 150 300

1 Inledande vektorgränser under tidig förhandsversion.

2 Vektorgränser under den senare förhandsgranskningsperioden. Tre regioner hade inte de högre gränserna: Tyskland, västra centrala, Indien, västra, Qatar Centrala.

3 Högre vektorkvot baserat på de större partitionerna för nivåer och regioner som stöds.

4 Högre vektorkvot för fler nivåer och regioner baserat på uppdateringar av partitionsstorlek.

Tjänsten tillämpar en vektorindexstorlekskvot för varje partition i söktjänsten. Varje extra partition ökar den tillgängliga vektorindexstorlekskvoten. Den här kvoten är en hård gräns för att säkerställa att tjänsten förblir felfri, vilket innebär att ytterligare indexeringsförsök när gränsen överskrids resulterar i fel. Du kan återuppta indexeringen när du frigör den tillgängliga kvoten genom att antingen ta bort vissa vektordokument eller genom att skala upp i partitioner.

Viktigt!

Högre vektorgränser är knutna till större partitionsstorlekar. Regioner som körs på äldre infrastruktur omfattas av gränserna för juli-april. Granska regionslistan för status för partitionslagringsgränser.

Indexerares gränser

Det finns maximala körningstider för att ge balans och stabilitet till tjänsten som helhet, men större datamängder kan behöva mer indexeringstid än vad maxgränsen tillåter. Om ett indexeringsjobb inte kan slutföras inom den maximala tillåtna tiden kan du prova att köra det enligt ett schema. Schemaläggaren håller reda på indexeringsstatusen. Om ett schemalagt indexeringsjobb avbryts av någon anledning kan indexeraren fortsätta där det senast slutade vid nästa schemalagda körning.

Resurs Gratis 1 Grundläggande 2 S1 S2 S3 S3 HD 3 L1 L2
Maximalt antal indexerare 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximalt antal datakällor 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximala kompetensuppsättningar 4 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximal indexeringsbelastning per anrop 10 000 dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Ej tillämpligt Ingen begränsning Ingen begränsning
Minsta schema 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter
Maximal körningstid 5 1-3 eller 3-10 minuter 2 eller 24 timmar 2 eller 24 timmar 2 eller 24 timmar 2 eller 24 timmar Ej tillämpligt 2 eller 24 timmar 2 eller 24 timmar
Blob-indexerare: maximal blobstorlek, MB 16 16 128 256 256 Ej tillämpligt 256 256
Blob-indexerare: maximala tecken på innehåll som extraherats från en blob 6 32,000 64,000 4 miljoner 8 miljoner 16 miljoner Ej tillämpligt 4 miljoner 4 miljoner

1 Kostnadsfria tjänster har en maximal körningstid på 3 minuter för blobkällor och 1 minut för alla andra datakällor. Indexerarens anrop är en gång var 180:e sekund. För AI-indexering som anropar till Azure AI-tjänster är kostnadsfria tjänster begränsade till 20 kostnadsfria transaktioner per indexerare per dag, där en transaktion definieras som ett dokument som har passerat via berikande pipelinen (tips: du kan återställa en indexerare för att återställa antalet).

2 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för indexerare, datakällor och kompetensuppsättningar.

3 S3 HD-tjänster innehåller inte stöd för indexerare.

4 Högst 30 färdigheter per kompetensuppsättning.

5 Vad gäller den maximala varaktigheten på 2 eller 24 timmar för indexerare: ett maxvärde på 2 timmar är det vanligaste och det är vad du bör planera för. Den refererar till indexerare som körs i den offentliga miljön, som används för att avlasta beräkningsintensiv bearbetning och lämna fler resurser för frågor. Gränsen på 24 timmar gäller om du konfigurerar indexeraren att köras i en privat miljö med endast den infrastruktur som har allokerats till söktjänsten. Observera att vissa äldre indexerare inte kan köras i den offentliga miljön, och dessa indexerare har alltid ett 24-timmars bearbetningsintervall. Om du har oplanerade indexerare som körs kontinuerligt i 24 timmar kan du anta att indexerarna inte kunde migreras till den nyare infrastrukturen. För indexeringsjobb som inte kan slutföras inom två timmar bör indexeraren som en allmän regel placera indexeraren enligt ett schema på 5 minuter så att indexeraren snabbt kan fortsätta där den slutade. På den kostnadsfria nivån är den maximala körningstiden på 3–10 minuter för indexerare med kompetensuppsättningar.

6 Det maximala antalet tecken baseras på Unicode-kodenheter, särskilt UTF-16.

Kommentar

Som anges i indexgränserna framtvingar indexerare också den övre gränsen på 3 000 element i alla komplexa samlingar per dokument som börjar med den senaste GA API-versionen som stöder komplexa typer (2019-05-06) och senare. Det innebär att om du har skapat indexeraren med en tidigare API-version kommer du inte att omfattas av den här gränsen. För att bevara maximal kompatibilitet undantas fortfarande en indexerare som skapades med en tidigare API-version och sedan uppdaterades med en API-version 2019-05-06 eller senare från gränserna. Kunder bör vara medvetna om den negativa effekten av att ha mycket stora komplexa samlingar (som tidigare nämnts) och vi rekommenderar starkt att du skapar nya indexerare med den senaste GA API-versionen.

Indexerare kan komma åt andra Azure-resurser via privata slutpunkter som hanteras via resurs-API:et för delad privat länk. I det här avsnittet beskrivs de gränser som är associerade med den här funktionen.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3 HD L1 L2
Stöd för privat slutpunktsindexerare Nej Ja Ja Ja Ja No Ja Ja
Stöd för privat slutpunkt för indexerare med en kompetensuppsättning1 Nej Nej Nej Ja Ja No Ja Ja
Stöd för privat slutpunkt för indexerare med en kompetensuppsättning och integrerad vektorisering 2 Nej Ja Ja Ja Ja No Ja Ja
Maximalt antal privata slutpunkter Ej tillämpligt 10 eller 30 100 400 400 Ej tillämpligt 20 20
Maximalt antal distinkta resurstyper3 Ej tillämpligt 4 7 15 15 Ej tillämpligt 4 4

1 AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Därför inaktiveras privata anslutningar på lägre nivåer för att säkerställa prestanda och stabilitet för själva söktjänsten.

2 Tjänster med hög kapacitet som skapats efter den 3 april 2024 i de regioner som anges under Partition Storage och som kör integrerade vektoriseringsarbetsbelastningar vid indexeringstiden stöder delade privata länkar på betalda nivåer. Systemet måste identifiera minst en färdighet som bäddar in data.

3 Antalet distinkta resurstyper beräknas som antalet unika groupId värden som används för alla delade privata länkresurser för en viss söktjänst, oavsett resursens status.

Synonymgränser

Maximalt antal synonymkartor varierar beroende på nivå. Varje regel kan ha upp till 20 expansioner, där en expansion är en motsvarande term. Till exempel skulle givet "katt", association med "kitty", "kattdjur" och "felis" (släktet för katter) räknas som 3 expansioner.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3-HD L1 L2
Maximalt antal synonymkartor 3 3 5 10 20 20 10 10
Maximalt antal regler per karta 5000 20000 20000 20000 20000 20000 20000 20000

Indexaliasgränser

Det maximala antalet indexalias varierar beroende på datum för skapande av nivå och tjänst. Om tjänsten skapades efter oktober 2022 på alla nivåer är det maximala antalet alias dubbelt så många index som tillåts. Om tjänsten skapades före oktober 2022 är gränsen antalet index som tillåts.

Datum då tjänsten skapades Kostnadsfri Grundläggande S1 S2 S3 S3-HD L1 L2
Före oktober 2022 3 5 eller 15 1 50 200 200 1 000 per partition eller 3 000 per tjänst 10 10
Efter oktober 2022 6 30 100 400 400 2 000 per partition eller 6 000 per tjänst 20 20

1 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för index

Datagränser (AI-berikning)

En PIPELINE för AI-berikande som anropar en Azure AI Language-resurs för entitetsigenkänning, entitetslänkning, extrahering av nyckelfraser, attitydanalys, språkidentifiering och identifiering av personlig information omfattas av datagränser. Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till attitydanalysatorn använder du färdigheten Textdelning.

Begränsningsgränser

API-begäranden begränsas när systemet närmar sig högsta kapacitet. Begränsning fungerar annorlunda för olika API:er. Fråge-API:er (Sök/föreslå/komplettera automatiskt) och indexera API:er begränsas dynamiskt baserat på belastningen på tjänsten. Api:er för index- och tjänståtgärder har gränser för statiska begäranden.

Gränser för begäranden om statisk hastighet för åtgärder relaterade till ett index:

  • Listindex (GET /index): 3 per sekund per sökenhet
  • Hämta index (GET /index/myindex): 10 per sekund per sökenhet
  • Skapa index (POST /index): 12 per minut per sökenhet
  • Skapa eller uppdatera index (PUT /index/myindex): 6 per sekund per sökenhet
  • Ta bort index (DELETE /index/myindex): 12 per minut per sökenhet

Gränser för statiska begäranden för åtgärder relaterade till en tjänst:

  • Tjänststatistik (GET/servicestats): 4 per sekund per sökenhet

L2-omrankning med hjälp av semantisk reranker har en förväntad volym:

  • Upp till 10 samtidiga frågor per replik. Om du förväntar dig konsekventa dataflödeskrav nära, på eller högre än den här nivån kan du skicka in ett supportärende så att vi kan etablera för din arbetsbelastning.

API-begärandens gränser

Förutom där detta anges gäller följande API-begäranden för alla programmerbara gränssnitt, inklusive Azure SDK:er.

  • Maximalt 16 MB per indexerings- eller frågebegäran när du skickar en nyttolast till söktjänsten 1
  • Maximal url-längd på 8 KB (gäller endast REST-API:er)
  • Maximalt 1 000 dokument per batch med indexuppladdningar, sammanslagningar eller borttagningar
  • Maximalt 32 fält i $orderby-sats
  • Maximalt 100 000 tecken i en söksats
  • Det maximala antalet satser i search (uttryck avgränsade med AND eller OR) är 1024
  • Maximal söktermsstorlek är 32 766 byte (32 KB minus 2 byte) AV UTF-8-kodad text
  • Maximal söktermsstorlek är 1 000 tecken för prefixsökning och regex-sökning
  • Sökning efter jokertecken och reguljära uttryck är begränsade till högst 1 000 tillstånd när de bearbetas av Lucene.

1 I Azure AI Search omfattas en begärans brödtext av en övre gräns på 16 MB, vilket medför en praktisk gräns för innehållet i enskilda fält eller samlingar som annars inte begränsas av teoretiska gränser (se Datatyper som stöds för mer information om fältsammansättning och begränsningar).

Det finns gränser för frågestorlek och sammansättning eftersom obundna frågor kan destabilisera söktjänsten. Vanligtvis skapas sådana frågor programmatiskt. Om ditt program genererar sökfrågor programmatiskt rekommenderar vi att du utformar det på ett sådant sätt att det inte genererar frågor av obundna storlekar.

API-svarsgränser

  • Maximalt 1 000 dokument som returneras per sida med sökresultat
  • Maximalt 100 förslag som returneras per förslag på API-begäran

API-nyckelgränser

API-nycklar används för tjänstautentisering. Det finns två typer. Administratörsnycklar anges i begärandehuvudet och ger fullständig läs- och skrivbehörighet till tjänsten. Frågenycklar är skrivskyddade, anges på URL:en och distribueras vanligtvis till klientprogram.

  • Maximalt 2 administratörsnycklar per tjänst
  • Maximalt 50 frågenycklar per tjänst