Servicelimieten in Azure AI Search

Maximumlimieten voor opslag, workloads en hoeveelheden indexen en andere objecten zijn afhankelijk van of u Azure AI Search maakt op de prijscategorieën Gratis, Basic, Standard of Geoptimaliseerd voor opslag.

  • Gratis is een gedeelde multitenant-service die deel uitmaakt van uw Azure-abonnement.

  • Basic biedt toegewezen rekenresources voor productieworkloads op kleinere schaal, maar deelt een netwerkinfrastructuur met andere tenants.

  • Standard wordt uitgevoerd op toegewezen machines met meer opslag- en verwerkingscapaciteit op elk niveau. Standard heeft vier niveaus: S1, S2, S3 en S3 HD. S3 High Density (S3 HD) is ontworpen voor multitenancy en grote hoeveelheden kleine indexen (3000 indexen per service). S3 HD biedt de functie voor de indexeerfunctie niet en gegevensopname moet GEBRUIKMAKEN van API's die gegevens van bron naar index pushen.

  • Geoptimaliseerde opslag wordt uitgevoerd op toegewezen machines met meer totale opslag, opslagbandbreedte en geheugen dan Standard. Deze laag is gericht op grote, langzaam veranderende indexen. Geoptimaliseerde opslag heeft twee niveaus: L1 en L2.

Abonnementslimieten

U kunt meerdere factureerbare zoekservices (Basic en hoger) maken tot het maximum aantal services dat voor elke laag is toegestaan. U kunt bijvoorbeeld maximaal 16 services maken op de Basic-laag en nog eens 16 services op de S1-laag binnen hetzelfde abonnement. Zie Een laag (of SKU) kiezen voor Azure AI Search voor meer informatie over lagen.

De limieten voor het maximumaantal services kunnen op aanvraag worden verhoogd. Als u meer services binnen hetzelfde abonnement nodig hebt, dient u een ondersteuningsaanvraag in.

Bron Gratis 1 Basis S1 S2 S3 S3 HD L1 L2
Maximumaantal services 1 16 16 8 6 6 6 6
Maximum aantal zoekeenheden (SU)2 N.v.t. 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 U kunt één gratis zoekservice per Azure-abonnement hebben. De gratis laag is gebaseerd op infrastructuur die wordt gedeeld met andere klanten. Omdat de hardware niet is toegewezen, wordt omhoog schalen niet ondersteund en is opslag beperkt tot 50 MB.

2 Zoekeenheden (SU) zijn factureringseenheden, toegewezen als een replica of een partitie. U hebt beide nodig. Zie De capaciteit van een zoekservice schatten en beheren voor meer informatie over SU-combinaties.

Servicelimieten

Search-service limieten voor opslag, partities en replica's variëren per aanmaakdatum van de service, met hogere limieten voor nieuwere services in ondersteunde regio's.

Een zoekservice is onderworpen aan een maximale opslaglimiet (partitiegrootte vermenigvuldigd met het aantal partities) of met een vaste limiet voor het maximum aantal indexen of indexeerfuncties, afhankelijk van wat het eerst voorkomt.

Service level agreements (SLA's) zijn van toepassing op factureerbare services met twee of meer replica's voor queryworkloads of drie of meer replica's voor query- en indexeringsworkloads. Het aantal partities is geen SLA-overweging. Zie Betrouwbaarheid in Azure AI Search voor meer informatie.

Gratis services hebben geen vaste partities of replica's en ze delen resources met andere abonnees.

Vóór 3 april 2024

Bron Gratis Basis S1 S2 S3 S3 HD L1 L2
Service level agreement (SLA) Nr. Ja Ja Ja Ja Ja Ja Ja
Opslag (partitiegrootte) 50 MB 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partities N.v.t. 1 12 12 12 3 12 12
Replica's N.v.t. 3 12 12 12 12 12 12

Na 3 april 2024

Voor nieuwe services die na 3 april 2024 zijn gemaakt:

  • De Basic-laag kan maximaal drie partities en drie replica's en een totaal van negen zoekeenheden (SU) hebben.
  • Basic, S1, S2, S3 hebben meer opslag per partitie, variërend van 3-7 keer meer, afhankelijk van de laag.
  • Uw nieuwe zoekservice moet zich in een ondersteunde regio bevinden om de extra capaciteit voor Basic en andere lagen te krijgen.

Er is momenteel geen in-place upgrade. U moet een nieuwe zoekservice maken om te profiteren van de extra opslagruimte.

Bron Gratis Basis S1 S2 S3 S3 HD L1 L2
Service level agreement (SLA) Nr. Ja Ja Ja Ja Ja Ja Ja
Opslag (partitiegrootte) 50 MB 15 GB 160 GB 350 GB 700 GB 700 GB 1 TB 2 TB
Partities N.v.t. 3 12 12 12 3 12 12
Replica's N.v.t. 3 12 12 12 12 12 12

Ondersteunde regio's met hogere opslaglimieten

Services die na 3 april 2024 zijn gemaakt, moeten zich in een van de volgende regio's bevinden om de extra opslagruimte op te halen. Bekijk aankondigingen in What's New in Azure AI Search voor uitbreiding naar andere regio's.

Land/regio Regio's die extra capaciteit per partitie bieden
Verenigde Staten VS - oost, VS - oost 2, VS - centraal, VS - noord-centraal, VS - zuid-centraal, VS - west, VS - west 2, VS - west 3, VS - west-centraal
Verenigd Koninkrijk VK - zuid, VK - west
Verenigde Arabische Emiraten UAE - noord
Zwitserland Zwitserland - west
Zweden Zweden - centraal
Polen Polen - centraal
Noorwegen Noorwegen - oost
Korea Korea - centraal, Korea - zuid
Japan Japan - oost, Japan - west
Italië Italië - noord
India India - centraal, Jio India - west
Frankrijk Frankrijk - centraal
Europa Europa - noord
Canada Canada - centraal, Canada - oost
Bazil Brazilië - zuid
Azië en Stille Oceaan Azië - oost, Azië - zuidoost
Australië Australië - oost, Australië - zuidoost

Indexlimieten

Bron Gratis Basic 1 S1 S2 S3 S3 HD L1 L2
Maximale aantal indexen 3 5 of 15 50 200 200 1000 per partitie of 3000 per service 10 10
Maximum aantal eenvoudige velden per index 2 1000 100 1000 1000 1000 1000 1000 1000
Maximumdimensies per vectorveld 3072 3072 3072 3072 3072 3072 3072 3072
Maximum aantal complexe verzamelingen per index 40 40 40 40 40 40 40 40
Maximum aantal elementen voor alle complexe verzamelingen per document 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximale diepte van complexe velden 10 10 10 10 10 10 10 10
Maximum aantal suggesties per index 1 1 1 1 1 1 1 1
Maximale scoreprofielen per index 100 100 100 100 100 100 100 100
Maximum aantal functies per profiel 8 8 8 8 8 8 8 8
Maximale indexgrootte 4 N.v.t. N.v.t. N.v.t. 1,92 TB 2,4 TB 100 GB N.v.t. N.v.t.

1 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexen. De Basic-laag is de enige laag met een ondergrens van 100 velden per index.

2 De bovengrens voor velden omvat zowel velden op het eerste niveau als geneste subvelden in een complexe verzameling. Als een index bijvoorbeeld 15 velden bevat en twee complexe verzamelingen met elk vijf subvelden heeft, is het aantal velden van uw index 25. Indexen met een zeer grote verzameling velden kunnen traag zijn. Beperk velden en kenmerken tot alleen de velden en kenmerken die u nodig hebt, en voer indexering en querytest uit om ervoor te zorgen dat de prestaties acceptabel zijn.

3 Er bestaat een bovengrens voor elementen omdat met een groot aantal elementen de benodigde opslagruimte voor uw index aanzienlijk wordt verhoogd. Een element van een complexe verzameling wordt gedefinieerd als lid van die verzameling. Stel bijvoorbeeld dat een hoteldocument met een complexe verzameling ruimten wordt beschouwd als een element in elke kamer in de verzameling Ruimten. Tijdens het indexeren kan de indexeringsengine maximaal 3000 elementen in het hele document veilig verwerken. Deze limiet is alleen geïntroduceerd in api-version=2019-05-06 complexe verzamelingen en is niet van toepassing op tekenreeksverzamelingen of complexe velden.

4 Op de meeste lagen is de maximale indexgrootte alle beschikbare opslag in uw zoekservice. Voor S2, S3 en S3 HD is de maximale grootte van een index het getal in de tabel. Van toepassing op zoekservices die zijn gemaakt na 3 april 2024.

Mogelijk vindt u een aantal variaties in maximumlimieten als uw service wordt ingericht op een krachtiger cluster. De limieten hier vertegenwoordigen de gemeenschappelijke noemer. Indexen die zijn gebouwd aan de bovenstaande specificaties, zijn overdraagbaar over equivalente servicelagen in elke regio.

Documentlimieten

U kunt ongeveer 24 miljard documenten per index hebben voor de zoekservices Basic, S1, S2, S3, L1 en L2. Voor S3 HD is de limiet 2 miljard documenten per index. Elk exemplaar van een complexe verzameling telt als een afzonderlijk document in termen van deze limieten.

Limieten voor documentgrootten per API-aanroep

De maximale documentgrootte bij het aanroepen van een index-API is ongeveer 16 megabytes.

Documentgrootte is in feite een limiet voor de grootte van de hoofdtekst van de index-API-aanvraag. Omdat u een batch met meerdere documenten tegelijk aan de Index-API kunt doorgeven, is de groottelimiet realistisch afhankelijk van het aantal documenten in de batch. Voor een batch met één document is de maximale documentgrootte 16 MB JSON.

Houd bij het schatten van de documentgrootte rekening met alleen de velden die door een zoekservice kunnen worden gebruikt. Binaire of afbeeldingsgegevens in brondocumenten moeten worden weggelaten uit uw berekeningen.

Limieten voor de grootte van vectorindexen

Wanneer u documenten indexeert met vectorvelden, maakt Azure AI Search interne vectorindexen met behulp van de algoritmeparameters die u opgeeft. De grootte van deze vectorindexen wordt beperkt door het geheugen dat is gereserveerd voor vectorzoekopdrachten voor de servicelaag (of SKU).

De service dwingt een quotum voor vectorindexgrootte af voor elke partitie in uw zoekservice. Elke extra partitie verhoogt het quotum voor de beschikbare vectorindexgrootte. Dit quotum is een vaste limiet om ervoor te zorgen dat uw service in orde blijft, wat betekent dat verdere indexeringspogingen zodra de limiet is overschreden, mislukt. U kunt de indexering hervatten zodra u het beschikbare quotum vrijgeeft door enkele vectordocumenten te verwijderen of door omhoog te schalen in partities.

In de tabel wordt het quotum voor de vectorindexgrootte per partitie in de servicelagen beschreven. Voor context omvat deze het volgende:

  • Partitieopslaglimieten voor elke laag, die hier worden herhaald voor context.
  • De hoeveelheid van elke partitie (in GB) die beschikbaar is voor vectorindexen (gemaakt wanneer u vectorvelden aan een index toevoegt).
  • Geschat aantal insluitingen (drijvendekommawaarden) per partitie.

Gebruik de GET-servicestatistieken om het quotum voor de grootte van de vectorindex op te halen of bekijk de pagina Indexen of het tabblad Gebruik in Azure Portal.

Vectorlimieten variëren per datum en laag voor het maken van services. Als u de leeftijd van uw zoekservice wilt controleren en meer wilt weten over vectorindexen, raadpleegt u De grootte van de Vector-index en blijft u onder limieten.

Vectorlimieten voor services die zijn gemaakt na 3 april 2024 in ondersteunde regio's

De hoogste vectorlimieten zijn beschikbaar voor zoekservices die zijn gemaakt na 3 april 2024 in een ondersteunde regio.

Laag Opslagquotum (GB) Vectorquotum per partitie (GB) Ca. floats per partitie (uitgaande van 15% overhead)
Basis 15 5 1.100 miljoen
S1 160 35 8.200 miljoen
S2 350 100 23.500 miljoen
S3 700 200 47.000 miljoen
L1 1.000 12 2.800 miljoen
L2 2.000 36 8.400 miljoen

U ziet dat L1- en L2-limieten in de implementatie van 3 april ongewijzigd blijven.

Vectorlimieten voor services die zijn gemaakt tussen 1 juli 2023 en 3 april 2024

De volgende limieten gelden voor nieuwe services die zijn gemaakt tussen 1 juli en 3 april 2024, met uitzondering van de volgende regio's, die de oorspronkelijke limieten hebben van vóór 1 juli 2023:

  • Duitsland - west-centraal
  • India - west
  • Qatar - centraal

Alle andere regio's hebben deze limieten:

Laag Opslagquotum (GB) Vectorquotum per partitie (GB) Ca. floats per partitie (uitgaande van 15% overhead)
Basis 2 1 235 miljoen
S1 25 3 700 miljoen
S2 100 12 2.800 miljoen
S3 200 36 8.400 miljoen
L1 1.000 12 2.800 miljoen
L2 2.000 36 8.400 miljoen

Vectorlimieten voor services die vóór 1 juli 2023 zijn gemaakt

Laag Opslagquotum (GB) Vectorquotum per partitie (GB) Ca. floats per partitie (uitgaande van 15% overhead)
Basis 2 0,5 115 miljoen
S1 25 1 235 miljoen
S2 100 6 1400 miljoen
S3 200 12 2.800 miljoen
L1 1.000 12 2.800 miljoen
L2 2.000 36 8.400 miljoen

Limieten voor indexeerfuncties

Er bestaan maximale uitvoeringstijden om de service in zijn geheel evenwicht en stabiliteit te bieden, maar grotere gegevenssets hebben mogelijk meer indexeringstijd nodig dan het maximum toestaat. Als een indexeringstaak niet kan worden voltooid binnen de toegestane maximale tijd, voert u deze uit volgens een schema. De scheduler houdt de indexeringsstatus bij. Als een geplande indexeringstaak om welke reden dan ook wordt onderbroken, kan de indexeerfunctie ophalen waar deze voor het laatst is gebleven bij de volgende geplande uitvoering.

Bron Gratis 1 Basic 2 S1 S2 S3 S3 HD 3 L1 L2
Maximale aantal indexeerfuncties 3 5 of 15 50 200 200 N.v.t. 10 10
Maximale aantal gegevensbronnen 3 5 of 15 50 200 200 N.v.t. 10 10
Maximum aantal vaardighedensets 4 3 5 of 15 50 200 200 N.v.t. 10 10
Maximale indexeringsbelasting per aanroep 10.000 documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten N.v.t. Geen limiet Geen limiet
Minimale planning 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten
Maximale uitvoeringstijd 5 1-3 minuten 2 of 24 uur 2 of 24 uur 2 of 24 uur 2 of 24 uur N.v.t. 2 of 24 uur 2 of 24 uur
Maximale uitvoeringstijd voor indexeerfuncties met een vaardighedenset 6 3-10 minuten 2 uur 2 uur 2 uur 2 uur N.v.t. 2 uur 2 uur
Blob-indexeerfunctie: maximale blobgrootte, MB 16 16 128 256 256 N.v.t. 256 256
Blob-indexeerfunctie: maximum aantal tekens van inhoud dat is geëxtraheerd uit een blob 32,000 64,000 4 miljoen 8 miljoen 16 miljoen N.v.t. 4 miljoen 4 miljoen

1 Gratis services hebben de maximale uitvoeringstijd van 3 minuten voor blobbronnen en 1 minuut voor alle andere gegevensbronnen. De aanroep van de indexeerfunctie is eenmaal per 180 seconden. Voor AI-indexering die aanroept in Azure AI-services, zijn gratis services beperkt tot 20 gratis transacties per indexeerfunctie per dag, waarbij een transactie wordt gedefinieerd als een document dat de verrijkingspijplijn heeft doorlopen (tip: u kunt een indexeerfunctie opnieuw instellen om het aantal opnieuw in te stellen).

2 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexeerfuncties, gegevensbronnen en vaardighedensets.

3 S3 HD-services bevatten geen ondersteuning voor indexeerfuncties.

4 Maximaal 30 vaardigheden per vaardighedenset.

5 Met betrekking tot de maximale duur van 2 of 24 uur voor indexeerfuncties: een maximum van 2 uur is het meest gebruikelijk en het is waarvoor u moet plannen. De limiet van 24 uur is afkomstig van een oudere indexeerfunctie-implementatie. Als u ongeplande indexeerfuncties hebt die gedurende 24 uur continu worden uitgevoerd, komt dit doordat deze indexeerfuncties niet naar de nieuwere infrastructuur kunnen worden gemigreerd. Voor het indexeren van taken die niet binnen twee uur kunnen worden voltooid, plaatst u de indexeerfunctie in een schema van 2 uur. Wanneer het eerste interval van 2 uur is voltooid, wordt de indexeerfunctie opgehaald waar het was gebleven bij het starten van het volgende interval van 2 uur.

6 Vaardighedensetuitvoering en afbeeldingsanalyse zijn met name rekenintensief en verbruiken onevenredige hoeveelheden beschikbare verwerkingskracht. De uitvoeringstijd voor deze workloads is verkort om andere taken in de wachtrij meer mogelijkheden te geven om uit te voeren.

Notitie

Zoals vermeld in de indexlimieten, dwingen indexeerfuncties ook de bovengrens van 3000 elementen af voor alle complexe verzamelingen per document, te beginnen met de nieuwste GA API-versie die complexe typen (2019-05-06) ondersteunt. Dit betekent dat als u uw indexeerfunctie hebt gemaakt met een eerdere API-versie, u niet onderhevig bent aan deze limiet. Als u de maximale compatibiliteit wilt behouden, wordt een indexeerfunctie die is gemaakt met een eerdere API-versie en vervolgens bijgewerkt met een API-versie 2019-05-06 of hoger, nog steeds uitgesloten van de limieten. Klanten moeten zich bewust zijn van de nadelige gevolgen van het hebben van zeer grote complexe verzamelingen (zoals eerder vermeld) en we raden u ten zeerste aan nieuwe indexeerfuncties te maken met de nieuwste GA API-versie.

Indexeerfuncties hebben toegang tot andere Azure-resources via privé-eindpunten die worden beheerd via de gedeelde private link-resource-API. In deze sectie worden de limieten beschreven die aan deze mogelijkheid zijn gekoppeld.

Bron Gratis Basis S1 S2 S3 S3 HD L1 L2
Ondersteuning voor indexeerfunctie voor privé-eindpunten Nr. Ja Ja Ja Ja No Ja Ja
Ondersteuning voor privé-eindpunten voor indexeerfuncties met een vaardighedenset1 Nee No No Ja Ja No Ja Ja
Maximum aantal privé-eindpunten N.v.t. 10 of 30 100 400 400 N.v.t. 20 20
Maximum aantal afzonderlijke resourcetypen2 N.v.t. 4 7 15 15 N.v.t. 4 4

1 AI-verrijking en afbeeldingsanalyse zijn rekenintensief en verbruiken onevenredige hoeveelheden beschikbare verwerkingskracht. Daarom worden privéverbindingen uitgeschakeld op lagere lagen om de prestaties en stabiliteit van de zoekservice zelf te garanderen.

2 Het aantal afzonderlijke resourcetypen wordt berekend als het aantal unieke groupId waarden dat wordt gebruikt voor alle gedeelde private link-resources voor een bepaalde zoekservice, ongeacht de status van de resource.

Limieten voor synoniemen

Het maximum aantal synoniemenkaarten verschilt per laag. Elke regel kan maximaal 20 uitbreidingen hebben, waarbij een uitbreiding een equivalente term is. Bijvoorbeeld, gegeven "kat", associatie met "kitty", "feline" en "felis" (het geslacht voor katten) telt als 3 uitbreidingen.

Bron Gratis Basis S1 S2 S3 S3-HD L1 L2
Maximum aantal synoniemenkaarten 3 3 5 10 20 20 10 10
Maximum aantal regels per kaart 5000 20000 20000 20000 20000 20000 20000 20000

Limieten voor indexalias

Het maximum aantal indexaliassen varieert per laag. In alle lagen is het maximum aantal aliassen het maximum aantal toegestane indexen verdubbeld.

Bron Gratis Basis S1 S2 S3 S3-HD L1 L2
Maximum aantal aliassen 6 10 of 30 100 400 400 2000 per partitie of 6000 per service 20 20

Gegevenslimieten (AI-verrijking)

Een AI-verrijkingspijplijn die aanroept naar een Azure AI-taalresource voor entiteitsherkenning, entiteitskoppeling, sleuteltermextractie, sentimentanalyse, taaldetectie en detectie van persoonlijke gegevens, is onderhevig aan gegevenslimieten. De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length. Als u uw gegevens wilt opsplitsen voordat u deze naar de sentimentanalyse verzendt, gebruikt u de vaardigheid Tekst splitsen.

Beperkingslimieten

API-aanvragen worden beperkt naarmate het systeem piekcapaciteit nadert. Beperking gedraagt zich anders voor verschillende API's. Query-API's (Search/Suggest/AutoComplete) en indexerings-API's beperken dynamisch op basis van de belasting van de service. Index-API's en servicebewerkingen-API's hebben statische limieten voor aanvraagsnelheid.

Limieten voor statische frequentieaanvragen voor bewerkingen met betrekking tot een index:

  • Lijstindexen (GET/indexen): 3 per seconde per zoekeenheid
  • Index ophalen (GET /indexen/myindex): 10 per seconde per zoekeenheid
  • Index maken (POST/indexen): 12 per minuut per zoekeenheid
  • Index maken of bijwerken (PUT /indexes/myindex): 6 per seconde per zoekeenheid
  • Index verwijderen (DELETE /indexen/myindex): 12 per minuut per zoekeenheid

Limieten voor statische frequentieaanvragen voor bewerkingen met betrekking tot een service:

  • Servicestatistieken (GET/servicestats): 4 per seconde per zoekeenheid

API-aanvraaglimieten

  • Maximum van 16 MB per aanvraag 1
  • Maximale lengte van 8 kB-URL's
  • Maximaal 1000 documenten per batch indexuploads, samenvoegingen of verwijderingen
  • Maximaal 32 velden in $orderby component
  • Maximaal 100.000 tekens in een zoekcomponent
  • Het maximum aantal componenten in search (expressies gescheiden door AND of OR) is 1024
  • Maximale zoektermgrootte is 32.766 bytes (32 kB min 2 bytes) van UTF-8 gecodeerde tekst
  • De maximale zoektermgrootte is 1000 tekens voor zoeken in voorvoegsels en regex-zoekopdrachten
  • Zoekopdrachten met jokertekens en reguliere expressies zijn beperkt tot maximaal 1000 statussen wanneer ze worden verwerkt door Lucene.

1 In Azure AI Search is de hoofdtekst van een aanvraag onderworpen aan een bovengrens van 16 MB, waarbij een praktische limiet wordt opgelegd voor de inhoud van afzonderlijke velden of verzamelingen die niet anders worden beperkt door theoretische limieten (zie Ondersteunde gegevenstypen voor meer informatie over veldsamenstelling en beperkingen).

Limieten voor de querygrootte en -samenstelling bestaan omdat niet-gebonden query's uw zoekservice kunnen stabiliseren. Dergelijke query's worden doorgaans programmatisch gemaakt. Als uw toepassing programmatisch zoekquery's genereert, raden we u aan deze zo te ontwerpen dat er geen query's met een niet-gebonden grootte worden gegenereerd.

API-antwoordlimieten

  • Maximaal 1000 documenten geretourneerd per pagina met zoekresultaten
  • Maximaal 100 suggesties geretourneerd per API-aanvraag voorstellen

API-sleutellimieten

API-sleutels worden gebruikt voor serviceverificatie. Er zijn twee typen. Beheer sleutels worden opgegeven in de aanvraagheader en volledige lees-/schrijftoegang verlenen tot de service. Querysleutels zijn alleen-lezen, opgegeven in de URL en worden doorgaans gedistribueerd naar clienttoepassingen.

  • Maximaal 2 beheerderssleutels per service
  • Maximaal 50 querysleutels per service