Tjänstbegränsningar i Azure AI Search

Maximala gränser för lagring, arbetsbelastningar och mängder index och andra objekt beror på om du skapar Azure AI Searchprisnivåerna Kostnadsfri, Basic, Standard eller Lagringsoptimerad .

  • Kostnadsfri är en delad tjänst med flera klienter som medföljer din Azure-prenumeration.

  • Basic tillhandahåller dedikerade beräkningsresurser för produktionsarbetsbelastningar i mindre skala, men delar en del nätverksinfrastruktur med andra klienter.

  • Standard körs på dedikerade datorer med mer lagrings- och bearbetningskapacitet på alla nivåer. Standard finns i fyra nivåer: S1, S2, S3 och S3 HD. S3 High Density (S3 HD) är konstruerad för flera innehavare och stora mängder små index (3 000 index per tjänst). S3 HD tillhandahåller inte indexerarens funktion och datainmatning måste använda API:er som skickar data från källa till index.

  • Lagringsoptimerad körs på dedikerade datorer med mer total lagring, lagringsbandbredd och minne än Standard. Den här nivån riktar sig till stora, långsamt föränderliga index. Lagringsoptimerad finns på två nivåer: L1 och L2.

Prenumerationsgränser

Du kan skapa flera fakturerbara söktjänster (Basic och högre), upp till det maximala antalet tjänster som tillåts på varje nivå. Du kan till exempel skapa upp till 16 tjänster på basic-nivån och ytterligare 16 tjänster på S1-nivån inom samma prenumeration. Mer information om nivåer finns i Välj en nivå (eller SKU) för Azure AI Search.

Maximala tjänstgränser kan höjas vid begäran. Om du behöver fler tjänster i samma prenumeration skickar du en supportbegäran.

Resurs Gratis 1 Grundläggande S1 S2 S3 S3 HD L1 L2
Maximalt antal tjänster 1 16 16 8 6 6 6 6
Maximalt antal sökenheter (SU)2 Ej tillämpligt 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 Du kan ha en kostnadsfri söktjänst per Azure-prenumeration. Den kostnadsfria nivån baseras på infrastruktur som delas med andra kunder. Eftersom maskinvaran inte är dedikerad stöds inte uppskalning och lagringen är begränsad till 50 MB.

2 Sökenheter (SU) är faktureringsenheter som allokerats som antingen en replik eller en partition. Du behöver båda. Mer information om SU-kombinationer finns i Uppskatta och hantera kapaciteten för en söktjänst.

Tjänstbegränsningar

tjänsten Search gränserna för lagring, partitioner och repliker varierar beroende på datum då tjänsten skapas, med högre gränser för nyare tjänster i regioner som stöds.

En söktjänst omfattas av en maximal lagringsgräns (partitionsstorlek multiplicerat med antalet partitioner) eller med en hård gräns för det maximala antalet index eller indexerare, beroende på vilket som inträffar först.

Serviceavtal (SLA) gäller för fakturerbara tjänster som har två eller flera repliker för frågearbetsbelastningar, eller tre eller fler repliker för arbetsbelastningar för frågor och indexering. Antalet partitioner är inte ett SLA-övervägande. Mer information finns i Tillförlitlighet i Azure AI Search.

Kostnadsfria tjänster har inte fasta partitioner eller repliker och de delar resurser med andra prenumeranter.

Före den 3 april 2024

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3 HD L1 L2
Serviceavtal (SLA) Nej Ja Ja Ja Ja Ja Ja Ja
Lagring (partitionsstorlek) 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partitioner Ej tillämpligt 1 12 12 12 3 12 12
Repliker Ej tillämpligt 3 12 12 12 12 12 12

Efter den 3 april 2024

För nya tjänster som skapats efter den 3 april 2024:

  • Basic-nivån kan ha upp till tre partitioner och tre repliker och totalt nio sökenheter (SU).
  • Basic, S1, S2, S3 har mer lagringsutrymme per partition, allt från 3 till 7 gånger mer, beroende på nivå.
  • Den nya söktjänsten måste finnas i en region som stöds för att få den extra kapaciteten för Basic- och andra nivåer.

För närvarande finns det ingen uppgradering på plats. Du bör skapa en ny söktjänst för att dra nytta av det extra lagringsutrymmet.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3 HD L1 L2
Serviceavtal (SLA) Nej Ja Ja Ja Ja Ja Ja Ja
Lagring (partitionsstorlek) 50 MB 15 GB 160 GB 350 GB 700 GB 200 GB 1 TB 2 TB
Partitioner Ej tillämpligt 3 12 12 12 3 12 12
Repliker Ej tillämpligt 3 12 12 12 12 12 12

Regioner som stöds med högre lagringsgränser

Tjänster som skapats efter den 3 april 2024 måste finnas i någon av följande regioner för att få extra lagringsutrymme. Håll utkik efter meddelanden i Nyheter i Azure AI Search för expansion till andra regioner.

Land Regioner som tillhandahåller extra kapacitet per partition
USA USA, östra, USA, östra 2, USA, centrala, USA, norra centrala, USA, södra centrala, USA, västra, USA, västra 2, USA, västra 3, USA, västra centrala
Storbritannien Storbritannien, södra, Storbritannien, västra
Förenade Arabemiraten Förenade Arabemiraten, norra
Schweiz Schweiz, västra
Sverige Sverige, centrala
Polen Polen, centrala
Norge Norge, östra
Korea Sydkorea, centrala, Sydkorea, södra
Japan Japan, östra, Japan, västra
Italien Italien, norra
Indien Indien, centrala, Jio, indien, västra
Frankrike Frankrike, centrala
Europa Europa, norra
Kanada Kanada, centrala, Kanada, östra
Bazil Brasilien, södra
Asien och stillahavsområdet Asien, östra, Sydostasien
Australien Australien, östra, Australien, sydöstra

Indexgränser

Resurs Kostnadsfri Grundläggande 1 S1 S2 S3 S3 HD L1 L2
Maximalt antal index 3 5 eller 15 50 200 200 1 000 per partition eller 3 000 per tjänst 10 10
Maximalt antal enkla fält per index 2 1000 100 1 000 1 000 1 000 1 000 1 000 1 000
Maximala dimensioner per vektorfält 3072 3072 3072 3072 3072 3072 3072 3072
Maximalt antal komplexa samlingar per index 40 40 40 40 40 40 40 40
Maximalt antal element i alla komplexa samlingar per dokument 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximalt djup för komplexa fält 10 10 10 10 10 10 10 10
Maximalt antal förslag per index 1 1 1 1 1 1 1 1
Maximalt antal bedömningsprofiler per index 100 100 100 100 100 100 100 100
Maximalt antal funktioner per profil 8 8 8 8 8 8 8 8
Maximal indexstorlek 4 Saknas Saknas Saknas 1,92 TB 2,4 TB 100 GB Saknas Saknas

1 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för index. Basic-nivån är den enda nivån med en lägre gräns på 100 fält per index.

2 Den övre gränsen för fält innehåller både fält på första nivån och kapslade underfält i en komplex samling. Om ett index till exempel innehåller 15 fält och har två komplexa samlingar med fem underfält vardera är fältantalet för ditt index 25. Index med en mycket stor fältsamling kan vara långsamma. Begränsa fält och attribut till bara de du behöver och kör indexerings- och frågetestet för att säkerställa att prestandan är acceptabel.

3 Det finns en övre gräns för element eftersom ett stort antal av dem avsevärt ökar det lagringsutrymme som krävs för ditt index. Ett element i en komplex samling definieras som medlem i samlingen. Anta till exempel att ett hotelldokument med en rumskomplex samling, varje rum i samlingen Rum betraktas som ett element. Under indexeringen kan indexeringsmotorn på ett säkert sätt bearbeta högst 3 000 element i hela dokumentet. Den här gränsen infördes i api-version=2019-05-06 och gäller endast för komplexa samlingar och inte för strängsamlingar eller komplexa fält.

4 På de flesta nivåer är den maximala indexstorleken all tillgänglig lagring i söktjänsten. För S2, S3 och S3 HD är den maximala storleken på ett index det antal som anges i tabellen. Gäller för söktjänster som skapats efter den 3 april 2024.

Du kan hitta en viss variation i maximala gränser om din tjänst råkar etableras i ett mer kraftfullt kluster. Gränserna här representerar den gemensamma nämnaren. Index som skapats enligt ovanstående specifikationer är portabla på motsvarande tjänstnivåer i alla regioner.

Dokumentbegränsningar

Du kan ha cirka 24 miljarder dokument per index på söktjänsterna Basic, S1, S2, S3, L1 och L2. För S3 HD är gränsen 2 miljarder dokument per index. Varje instans av en komplex samling räknas som ett separat dokument när det gäller dessa gränser.

Begränsningar för dokumentstorlek per API-anrop

Den maximala dokumentstorleken när du anropar ett Index-API är cirka 16 megabyte.

Dokumentstorleken är faktiskt en gräns för storleken på index-API-begärandetexten. Eftersom du kan skicka en batch med flera dokument till index-API:et samtidigt beror storleksgränsen realistiskt på hur många dokument som finns i batchen. För en batch med ett enda dokument är den maximala dokumentstorleken 16 MB JSON.

När du beräknar dokumentstorleken bör du bara tänka på de fält som kan användas av en söktjänst. Binära data eller bilddata i källdokument bör utelämnas från dina beräkningar.

Storleksgränser för vektorindex

När du indexerar dokument med vektorfält skapar Azure AI Search interna vektorindex med hjälp av de algoritmparametrar du anger. Storleken på dessa vektorindex begränsas av det minne som är reserverat för vektorsökning efter tjänstens nivå (eller SKU).

Tjänsten tillämpar en vektorindexstorlekskvot för varje partition i söktjänsten. Varje extra partition ökar den tillgängliga vektorindexstorlekskvoten. Den här kvoten är en hård gräns för att säkerställa att tjänsten förblir felfri, vilket innebär att ytterligare indexeringsförsök när gränsen överskrids resulterar i fel. Du kan återuppta indexeringen när du frigör den tillgängliga kvoten genom att antingen ta bort vissa vektordokument eller genom att skala upp i partitioner.

Tabellen beskriver vektorindexets storlekskvot per partition över tjänstnivåerna. I kontexten ingår följande:

  • Partitionslagringsgränser för varje nivå, som upprepas här för kontext.
  • Mängden av varje partition (i GB) som är tillgänglig för vektorindex (skapas när du lägger till vektorfält i ett index).
  • Ungefärligt antal inbäddningar (flyttalsvärden) per partition.

Använd GET-tjänststatistik för att hämta vektorindexets storlekskvot eller granska sidan Index eller fliken Användning i Azure-portalen.

Vektorgränser varierar beroende på datum och nivå för tjänstskapande. Om du vill kontrollera din söktjänsts ålder och lära dig mer om vektorindex kan du läsa Vektorindexstorlek och hålla dig under gränser.

Vektorgränser för tjänster som skapats efter den 3 april 2024 i regioner som stöds

De högsta vektorgränserna är tillgängliga för söktjänster som skapats efter den 3 april 2024 i en region som stöds.

Nivå Lagringskvot (GB) Vektorkvot per partition (GB) Ca. floats per partition (förutsatt 15 % omkostnader)
Grundläggande 15 5 1 100 miljoner
S1 160 35 8 200 miljoner
S2 350 100 23 500 miljoner
S3 700 200 47 000 miljoner
L1 1 000 12 2 800 miljoner
L2 2 000 36 8 400 miljoner

Observera att L1- och L2-gränserna är oförändrade i distributionen den 3 april.

Vektorgränser för tjänster som skapats mellan 1 juli 2023 och 3 april 2024

Följande begränsningar gäller för nya tjänster som skapats mellan 1 juli och 3 april 2024, med undantag för följande regioner, som har de ursprungliga gränserna från före den 1 juli 2023:

  • Tyskland, västra centrala
  • Västra Indien
  • Qatar, centrala

Alla andra regioner har följande gränser:

Nivå Lagringskvot (GB) Vektorkvot per partition (GB) Ca. floats per partition (förutsatt 15 % omkostnader)
Grundläggande 2 1 235 miljoner
S1 25 3 700 miljoner
S2 100 12 2 800 miljoner
S3 200 36 8 400 miljoner
L1 1 000 12 2 800 miljoner
L2 2 000 36 8 400 miljoner

Vektorgränser för tjänster som skapats före den 1 juli 2023

Nivå Lagringskvot (GB) Vektorkvot per partition (GB) Ca. floats per partition (förutsatt 15 % omkostnader)
Grundläggande 2 0,5 115 miljoner
S1 25 1 235 miljoner
S2 100 6 1 400 miljoner
S3 200 12 2 800 miljoner
L1 1 000 12 2 800 miljoner
L2 2 000 36 8 400 miljoner

Indexerares gränser

Det finns maximala körningstider för att ge balans och stabilitet till tjänsten som helhet, men större datamängder kan behöva mer indexeringstid än vad maxgränsen tillåter. Om ett indexeringsjobb inte kan slutföras inom den maximala tillåtna tiden kan du prova att köra det enligt ett schema. Schemaläggaren håller reda på indexeringsstatusen. Om ett schemalagt indexeringsjobb avbryts av någon anledning kan indexeraren fortsätta där det senast slutade vid nästa schemalagda körning.

Resurs Gratis 1 Grundläggande 2 S1 S2 S3 S3 HD 3 L1 L2
Maximalt antal indexerare 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximalt antal datakällor 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximala kompetensuppsättningar 4 3 5 eller 15 50 200 200 Ej tillämpligt 10 10
Maximal indexeringsbelastning per anrop 10 000 dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Begränsas endast av maximalt antal dokument Ej tillämpligt Ingen begränsning Ingen begränsning
Minsta schema 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter 5 minuter
Maximal körningstid 5 1–3 minuter 2 eller 24 timmar 2 eller 24 timmar 2 eller 24 timmar 2 eller 24 timmar Ej tillämpligt 2 eller 24 timmar 2 eller 24 timmar
Maximal körtid för indexerare med en kompetensuppsättning 6 3–10 minuter 2 timmar 2 timmar 2 timmar 2 timmar Ej tillämpligt 2 timmar 2 timmar
Blob-indexerare: maximal blobstorlek, MB 16 16 128 256 256 Ej tillämpligt 256 256
Blob-indexerare: maximala tecken på innehåll som extraherats från en blob 32,000 64,000 4 miljoner 8 miljoner 16 miljoner Ej tillämpligt 4 miljoner 4 miljoner

1 Kostnadsfria tjänster har en maximal körningstid på 3 minuter för blobkällor och 1 minut för alla andra datakällor. Indexerarens anrop är en gång var 180:e sekund. För AI-indexering som anropar till Azure AI-tjänster är kostnadsfria tjänster begränsade till 20 kostnadsfria transaktioner per indexerare per dag, där en transaktion definieras som ett dokument som har passerat via berikande pipelinen (tips: du kan återställa en indexerare för att återställa antalet).

2 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för indexerare, datakällor och kompetensuppsättningar.

3 S3 HD-tjänster innehåller inte stöd för indexerare.

4 Högst 30 färdigheter per kompetensuppsättning.

5 Vad gäller den maximala varaktigheten på 2 eller 24 timmar för indexerare: ett maxvärde på 2 timmar är det vanligaste och det är vad du bör planera för. Gränsen på 24 timmar kommer från en äldre indexerareimplementering. Om du har oplanerade indexerare som körs kontinuerligt i 24 timmar beror det på att indexerarna inte kunde migreras till den nyare infrastrukturen. För indexeringsjobb som inte kan slutföras inom två timmar bör indexeraren som en allmän regel placera indexeraren enligt ett 2-timmarsschema. När det första 2-timmarsintervallet är klart, fortsätter indexeraren där den slutade när nästa 2-timmarsintervall startas.

6 Körning av kompetensuppsättningar, och i synnerhet bildanalys, är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Körningstiden för dessa arbetsbelastningar har förkortats för att ge andra jobb i kön större möjlighet att köras.

Kommentar

Som anges i indexgränserna framtvingar indexerare också den övre gränsen på 3 000 element i alla komplexa samlingar per dokument som börjar med den senaste GA API-versionen som stöder komplexa typer (2019-05-06) och senare. Det innebär att om du har skapat indexeraren med en tidigare API-version kommer du inte att omfattas av den här gränsen. För att bevara maximal kompatibilitet undantas fortfarande en indexerare som skapades med en tidigare API-version och sedan uppdaterades med en API-version 2019-05-06 eller senare från gränserna. Kunder bör vara medvetna om den negativa effekten av att ha mycket stora komplexa samlingar (som tidigare nämnts) och vi rekommenderar starkt att du skapar nya indexerare med den senaste GA API-versionen.

Indexerare kan komma åt andra Azure-resurser via privata slutpunkter som hanteras via resurs-API:et för delad privat länk. I det här avsnittet beskrivs de gränser som är associerade med den här funktionen.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3 HD L1 L2
Stöd för privat slutpunktsindexerare Nej Ja Ja Ja Ja No Ja Ja
Stöd för privat slutpunkt för indexerare med en kompetensuppsättning1 Nej Nej Nej Ja Ja No Ja Ja
Maximalt antal privata slutpunkter Ej tillämpligt 10 eller 30 100 400 400 Ej tillämpligt 20 20
Maximalt antal distinkta resurstyper2 Ej tillämpligt 4 7 15 15 Ej tillämpligt 4 4

1 AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Därför inaktiveras privata anslutningar på lägre nivåer för att säkerställa prestanda och stabilitet för själva söktjänsten.

2 Antalet distinkta resurstyper beräknas som antalet unika groupId värden som används för alla delade privata länkresurser för en viss söktjänst, oavsett resursens status.

Synonymgränser

Maximalt antal synonymkartor varierar beroende på nivå. Varje regel kan ha upp till 20 expansioner, där en expansion är en motsvarande term. Till exempel skulle givet "katt", association med "kitty", "kattdjur" och "felis" (släktet för katter) räknas som 3 expansioner.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3-HD L1 L2
Maximalt antal synonymkartor 3 3 5 10 20 20 10 10
Maximalt antal regler per karta 5000 20000 20000 20000 20000 20000 20000 20000

Indexaliasgränser

Det maximala antalet indexalias varierar beroende på nivå. På alla nivåer är det maximala antalet alias dubbelt så många index som tillåts.

Resurs Kostnadsfri Grundläggande S1 S2 S3 S3-HD L1 L2
Maximalt antal alias 6 10 eller 30 100 400 400 2 000 per partition eller 6 000 per tjänst 20 20

Datagränser (AI-berikning)

En PIPELINE för AI-berikande som anropar en Azure AI Language-resurs för entitetsigenkänning, entitetslänkning, extrahering av nyckelfraser, attitydanalys, språkidentifiering och identifiering av personlig information omfattas av datagränser. Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till attitydanalysatorn använder du färdigheten Textdelning.

Begränsningsgränser

API-begäranden begränsas när systemet närmar sig högsta kapacitet. Begränsning fungerar annorlunda för olika API:er. Fråge-API:er (Sök/föreslå/komplettera automatiskt) och indexera API:er begränsas dynamiskt baserat på belastningen på tjänsten. Api:er för index- och tjänståtgärder har gränser för statiska begäranden.

Gränser för begäranden om statisk hastighet för åtgärder relaterade till ett index:

  • Listindex (GET /index): 3 per sekund per sökenhet
  • Hämta index (GET /index/myindex): 10 per sekund per sökenhet
  • Skapa index (POST /index): 12 per minut per sökenhet
  • Skapa eller uppdatera index (PUT /index/myindex): 6 per sekund per sökenhet
  • Ta bort index (DELETE /index/myindex): 12 per minut per sökenhet

Gränser för statiska begäranden för åtgärder relaterade till en tjänst:

  • Tjänststatistik (GET/servicestats): 4 per sekund per sökenhet

API-begärandens gränser

  • Maximalt 16 MB per begäran 1
  • Maximal längd på 8 KB URL
  • Maximalt 1 000 dokument per batch med indexuppladdningar, sammanslagningar eller borttagningar
  • Maximalt 32 fält i $orderby-sats
  • Maximalt 100 000 tecken i en söksats
  • Det maximala antalet satser i search (uttryck avgränsade med AND eller OR) är 1024
  • Maximal söktermsstorlek är 32 766 byte (32 KB minus 2 byte) AV UTF-8-kodad text
  • Maximal söktermsstorlek är 1 000 tecken för prefixsökning och regex-sökning
  • Sökning efter jokertecken och reguljära uttryck är begränsade till högst 1 000 tillstånd när de bearbetas av Lucene.

1 I Azure AI Search omfattas en begärans brödtext av en övre gräns på 16 MB, vilket medför en praktisk gräns för innehållet i enskilda fält eller samlingar som annars inte begränsas av teoretiska gränser (se Datatyper som stöds för mer information om fältsammansättning och begränsningar).

Det finns gränser för frågestorlek och sammansättning eftersom obundna frågor kan destabilisera söktjänsten. Vanligtvis skapas sådana frågor programmatiskt. Om ditt program genererar sökfrågor programmatiskt rekommenderar vi att du utformar det på ett sådant sätt att det inte genererar frågor av obundna storlekar.

API-svarsgränser

  • Maximalt 1 000 dokument som returneras per sida med sökresultat
  • Maximalt 100 förslag som returneras per förslag på API-begäran

API-nyckelgränser

API-nycklar används för tjänstautentisering. Det finns två typer. Administratörsnycklar anges i begärandehuvudet och ger fullständig läs- och skrivbehörighet till tjänsten. Frågenycklar är skrivskyddade, anges på URL:en och distribueras vanligtvis till klientprogram.

  • Maximalt 2 administratörsnycklar per tjänst
  • Maximalt 50 frågenycklar per tjänst