Servicelimieten in Azure AI Search

Maximumlimieten voor opslag, workloads en hoeveelheden indexen en andere objecten zijn afhankelijk van het feit of u Azure AI Search inricht op prijscategorieën Gratis, Basic, Standard of Geoptimaliseerd voor opslag.

  • Gratis is een gedeelde multitenant-service die deel uitmaakt van uw Azure-abonnement.

  • Basic biedt toegewezen rekenresources voor productieworkloads op kleinere schaal, maar deelt een netwerkinfrastructuur met andere tenants.

  • Standard wordt uitgevoerd op toegewezen machines met meer opslag- en verwerkingscapaciteit op elk niveau. Standard heeft vier niveaus: S1, S2, S3 en S3 HD. S3 High Density (S3 HD) is ontworpen voor multitenancy en grote hoeveelheden kleine indexen (drieduizend indexen per service). S3 HD biedt de functie voor de indexeerfunctie niet en gegevensopname moet GEBRUIKMAKEN van API's die gegevens van bron naar index pushen.

  • Geoptimaliseerde opslag wordt uitgevoerd op toegewezen machines met meer totale opslag, opslagbandbreedte en geheugen dan Standard. Deze laag is gericht op grote, langzaam veranderende indexen. Geoptimaliseerde opslag heeft twee niveaus: L1 en L2.

Abonnementslimieten

U kunt meerdere factureerbare zoekservices (Basic en hoger) maken tot het maximum aantal services dat voor elke laag is toegestaan. U kunt bijvoorbeeld maximaal 16 services maken op de Basic-laag en nog eens 16 services op de S1-laag binnen hetzelfde abonnement. Zie Een laag (of SKU) kiezen voor Azure AI Search voor meer informatie over lagen.

De limieten voor het maximumaantal services kunnen op aanvraag worden verhoogd. Als u meer services binnen hetzelfde abonnement nodig hebt, dient u een ondersteuningsaanvraag in.

Bron Gratis 1 Basis S1 S2 S3 S3 HD L1 L2
Maximumaantal services 1 16 16 8 6 6 6 6
Maximum aantal zoekeenheden (SU)2 N.v.t. 3 SU 36 SU 36 SU 36 SU 36 SU 36 SU 36 SU

1 U kunt één gratis zoekservice per Azure-abonnement hebben. De gratis laag is gebaseerd op infrastructuur die wordt gedeeld met andere klanten. Omdat de hardware niet is toegewezen, wordt omhoog schalen niet ondersteund en is opslag beperkt tot 50 MB.

2 Zoekeenheden (SU) zijn factureringseenheden, toegewezen als een replica of een partitie. U hebt beide nodig. Zie De capaciteit van een zoekservice schatten en beheren voor meer informatie over SU-combinaties.

Servicelimieten

Een zoekservice is onderworpen aan een maximale opslaglimiet (partitiegrootte vermenigvuldigd met het aantal partities) of met een vaste limiet voor het maximum aantal indexen of indexeerfuncties, afhankelijk van wat het eerst voorkomt.

Bron Gratis 1 Basic 1 S1 S2 S3 S3 HD L1 L2
Service Level Agreement (SLA)2 Nr. Ja Ja Ja Ja Ja Ja Ja
Opslag (partitiegrootte) 50 MB 3 2 GB 25 GB 100 GB 200 GB 200 GB 1 TB 2 TB
Partities N.v.t. 1 12 12 12 3 12 12
Replica's N.v.t. 3 12 12 12 12 12 12

1 Basic heeft één vaste partitie. U kunt maximaal drie zoekeenheden opgeven om replica's toe te voegen voor grotere queryvolumes en hoge beschikbaarheid.

2 Service level agreements zijn van toepassing op factureerbare services met toegewezen resources. Gratis services en preview-functies hebben geen SLA. Voor factureerbare services worden SLA's van kracht wanneer u voldoende redundantie voor uw service inricht. SLA's voor query's (lezen) vereisen twee of meer replica's. SLA's voor query's en indexering (lezen-schrijven) vereisen drie of meer replica's. Het aantal partities is geen SLA-overweging. Zie Betrouwbaarheid in Azure AI Search voor meer informatie over replica's en hoge beschikbaarheid.

3 Gratis services hebben geen toegewezen partitie. De opslaglimiet van 50 MB verwijst naar de maximale ruimte die is toegewezen aan een gratis zoekservice op infrastructuur die wordt gedeeld met andere klanten.

Indexlimieten

Bron Gratis Basic 1 S1 S2 S3 S3 HD L1 L2
Maximale aantal indexen 3 5 of 15 50 200 200 1000 per partitie of 3000 per service 10 10
Maximum aantal eenvoudige velden per index 2 1000 100 1000 1000 1000 1000 1000 1000
Maximumdimensies per vectorveld 3072 3072 3072 3072 3072 3072 3072 3072
Maximum aantal complexe verzamelingen per index 40 40 40 40 40 40 40 40
Maximum aantal elementen voor alle complexe verzamelingen per document 3 3000 3000 3000 3000 3000 3000 3000 3000
Maximale diepte van complexe velden 10 10 10 10 10 10 10 10
Maximum aantal suggesties per index 1 1 1 1 1 1 1 1
Maximale scoreprofielen per index 100 100 100 100 100 100 100 100
Maximum aantal functies per profiel 8 8 8 8 8 8 8 8

1 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexen. De Basic-laag is de enige SKU met een lagere limiet van 100 velden per index.

2 De bovengrens voor velden omvat zowel velden op het eerste niveau als geneste subvelden in een complexe verzameling. Als een index bijvoorbeeld 15 velden bevat en twee complexe verzamelingen met elk vijf subvelden heeft, is het aantal velden van uw index 25. Indexen met een zeer grote verzameling velden kunnen traag zijn. Beperk velden en kenmerken tot alleen de velden en kenmerken die u nodig hebt, en voer indexering en querytest uit om ervoor te zorgen dat de prestaties acceptabel zijn.

3 Er bestaat een bovengrens voor elementen omdat met een groot aantal elementen de benodigde opslagruimte voor uw index aanzienlijk wordt verhoogd. Een element van een complexe verzameling wordt gedefinieerd als lid van die verzameling. Stel bijvoorbeeld dat een hoteldocument met een complexe verzameling ruimten wordt beschouwd als een element in elke kamer in de verzameling Ruimten. Tijdens het indexeren kan de indexeringsengine maximaal 3000 elementen in het hele document veilig verwerken. Deze limiet is alleen geïntroduceerd in api-version=2019-05-06 complexe verzamelingen en is niet van toepassing op tekenreeksverzamelingen of complexe velden.

Mogelijk vindt u een aantal variaties in maximumlimieten als uw service wordt ingericht op een krachtiger cluster. De limieten hier vertegenwoordigen de gemeenschappelijke noemer. Indexen die zijn gebouwd aan de bovenstaande specificaties, zijn overdraagbaar over equivalente servicelagen in elke regio.

Documentlimieten

U kunt ongeveer 24 miljard documenten per index hebben voor de zoekservices Basic, S1, S2, S3, L1 en L2. Voor S3 HD is de limiet 2 miljard documenten per index. Elk exemplaar van een complexe verzameling telt als een afzonderlijk document in termen van deze limieten.

Limieten voor documentgrootten per API-aanroep

De maximale documentgrootte bij het aanroepen van een index-API is ongeveer 16 megabytes.

Documentgrootte is in feite een limiet voor de grootte van de hoofdtekst van de index-API-aanvraag. Omdat u een batch met meerdere documenten tegelijk aan de Index-API kunt doorgeven, is de groottelimiet realistisch afhankelijk van het aantal documenten in de batch. Voor een batch met één document is de maximale documentgrootte 16 MB JSON.

Houd bij het schatten van de documentgrootte rekening met alleen de velden die door een zoekservice kunnen worden gebruikt. Binaire of afbeeldingsgegevens in brondocumenten moeten worden weggelaten uit uw berekeningen.

Limieten voor de grootte van vectorindexen

Wanneer u documenten indexeert met vectorvelden, maakt Azure AI Search interne vectorindexen met behulp van de algoritmeparameters die u opgeeft. De grootte van deze vectorindexen wordt beperkt door het geheugen dat is gereserveerd voor vectorzoekopdrachten voor de servicelaag (of SKU).

De service dwingt een quotum voor vectorindexgrootte af voor elke partitie in uw zoekservice. Elke extra partitie verhoogt het quotum voor de beschikbare vectorindexgrootte. Dit quotum is een vaste limiet om ervoor te zorgen dat uw service in orde blijft, wat betekent dat verdere indexeringspogingen zodra de limiet is overschreden, mislukt. U kunt de indexering hervatten zodra u het beschikbare quotum vrijgeeft door enkele vectordocumenten te verwijderen of door omhoog te schalen in partities.

In de tabel wordt het quotum voor de vectorindexgrootte per partitie in de servicelagen (of SKU) beschreven. Voor context omvat deze het volgende:

  • Partitieopslaglimieten voor elke laag, die hier worden herhaald voor context.
  • De hoeveelheid van elke partitie (in GB) die beschikbaar is voor vectorindexen (gemaakt wanneer u vectorvelden aan een index toevoegt).
  • Geschat aantal insluitingen (drijvendekommawaarden) per partitie.

Gebruik de GET Service Statistics-API (GET /servicestats) om het quotum voor de vectorindexgrootte op te halen. Raadpleeg onze documentatie over vectorindexgrootte voor meer informatie.

Services gemaakt vóór 1 juli 2023

Laag Opslagquotum (GB) Vectorquotum per partitie (GB) Ca. floats per partitie (uitgaande van 15% overhead)
Basis 2 0,5 115 miljoen
S1 25 1 235 miljoen
S2 100 6 1400 miljoen
S3 200 12 2.800 miljoen
L1 1.000 12 2.800 miljoen
L2 2.000 36 8.400 miljoen

Services die zijn gemaakt na 1 juli 2023 in ondersteunde regio's

Azure AI Search rolt wereldwijd verhoogde limieten voor vectorindexen uit voor nieuwe zoekservices, maar het team bouwt infrastructuurcapaciteit in bepaalde regio's op. Helaas kunnen bestaande services niet worden gemigreerd naar de nieuwe limieten.

De volgende regio's bieden geen ondersteuning voor verhoogde limieten:

  • Duitsland - west-centraal
  • India - west
  • Qatar - centraal
Laag Opslagquotum (GB) Vectorquotum per partitie (GB) Ca. floats per partitie (uitgaande van 15% overhead)
Basis 2 1 235 miljoen
S1 25 3 700 miljoen
S2 100 12 2.800 miljoen
S3 200 36 8.400 miljoen
L1 1.000 12 2.800 miljoen
L2 2.000 36 8.400 miljoen

Limieten voor indexeerfuncties

Er bestaan maximale uitvoeringstijden om de service in zijn geheel evenwicht en stabiliteit te bieden, maar grotere gegevenssets hebben mogelijk meer indexeringstijd nodig dan het maximum toestaat. Als een indexeringstaak niet kan worden voltooid binnen de toegestane maximale tijd, voert u deze uit volgens een schema. De scheduler houdt de indexeringsstatus bij. Als een geplande indexeringstaak om welke reden dan ook wordt onderbroken, kan de indexeerfunctie ophalen waar deze voor het laatst is gebleven bij de volgende geplande uitvoering.

Bron Gratis 1 Basic 2 S1 S2 S3 S3 HD 3 L1 L2
Maximale aantal indexeerfuncties 3 5 of 15 50 200 200 N.v.t. 10 10
Maximale aantal gegevensbronnen 3 5 of 15 50 200 200 N.v.t. 10 10
Maximum aantal vaardighedensets 4 3 5 of 15 50 200 200 N.v.t. 10 10
Maximale indexeringsbelasting per aanroep 10.000 documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten Alleen beperkt door maximale documenten N.v.t. Geen limiet Geen limiet
Minimale planning 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten 5 minuten
Maximale uitvoeringstijd 5 1-3 minuten 2 of 24 uur 2 of 24 uur 2 of 24 uur 2 of 24 uur N.v.t. 2 of 24 uur 2 of 24 uur
Maximale uitvoeringstijd voor indexeerfuncties met een vaardighedenset 6 3-10 minuten 2 uur 2 uur 2 uur 2 uur N.v.t. 2 uur 2 uur
Blob-indexeerfunctie: maximale blobgrootte, MB 16 16 128 256 256 N.v.t. 256 256
Blob-indexeerfunctie: maximum aantal tekens van inhoud dat is geëxtraheerd uit een blob 32,000 64,000 4 miljoen 8 miljoen 16 miljoen N.v.t. 4 miljoen 4 miljoen

1 Gratis services hebben de maximale uitvoeringstijd van 3 minuten voor blobbronnen en 1 minuut voor alle andere gegevensbronnen. De aanroep van de indexeerfunctie is eenmaal per 180 seconden. Voor AI-indexering die aanroept in Azure AI-services, zijn gratis services beperkt tot 20 gratis transacties per indexeerfunctie per dag, waarbij een transactie wordt gedefinieerd als een document dat de verrijkingspijplijn heeft doorlopen (tip: u kunt een indexeerfunctie opnieuw instellen om het aantal opnieuw in te stellen).

2 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexeerfuncties, gegevensbronnen en vaardighedensets.

3 S3 HD-services bevatten geen ondersteuning voor indexeerfuncties.

4 Maximaal 30 vaardigheden per vaardighedenset.

5 Met betrekking tot de maximale duur van 2 of 24 uur voor indexeerfuncties: een maximum van 2 uur is het meest gebruikelijk en het is waarvoor u moet plannen. De limiet van 24 uur is afkomstig van een oudere indexeerfunctie-implementatie. Als u ongeplande indexeerfuncties hebt die gedurende 24 uur continu worden uitgevoerd, komt dit doordat deze indexeerfuncties niet naar de nieuwere infrastructuur kunnen worden gemigreerd. Voor het indexeren van taken die niet binnen twee uur kunnen worden voltooid, plaatst u de indexeerfunctie in een schema van 2 uur. Wanneer het eerste interval van 2 uur is voltooid, wordt de indexeerfunctie opgehaald waar het was gebleven bij het starten van het volgende interval van 2 uur.

6 Vaardighedensetuitvoering en afbeeldingsanalyse zijn met name rekenintensief en verbruiken onevenredige hoeveelheden beschikbare verwerkingskracht. De uitvoeringstijd voor deze workloads is verkort om andere taken in de wachtrij meer mogelijkheden te geven om uit te voeren.

Notitie

Zoals vermeld in de indexlimieten, dwingen indexeerfuncties ook de bovengrens van 3000 elementen af voor alle complexe verzamelingen per document, te beginnen met de nieuwste GA API-versie die complexe typen (2019-05-06) ondersteunt. Dit betekent dat als u uw indexeerfunctie hebt gemaakt met een eerdere API-versie, u niet onderhevig bent aan deze limiet. Als u de maximale compatibiliteit wilt behouden, wordt een indexeerfunctie die is gemaakt met een eerdere API-versie en vervolgens bijgewerkt met een API-versie 2019-05-06 of hoger, nog steeds uitgesloten van de limieten. Klanten moeten zich bewust zijn van de nadelige gevolgen van het hebben van zeer grote complexe verzamelingen (zoals eerder vermeld) en we raden u ten zeerste aan nieuwe indexeerfuncties te maken met de nieuwste GA API-versie.

Indexeerfuncties hebben toegang tot andere Azure-resources via privé-eindpunten die worden beheerd via de gedeelde private link-resource-API. In deze sectie worden de limieten beschreven die aan deze mogelijkheid zijn gekoppeld.

Bron Gratis Basis S1 S2 S3 S3 HD L1 L2
Ondersteuning voor indexeerfunctie voor privé-eindpunten Nr. Ja Ja Ja Ja No Ja Ja
Ondersteuning voor privé-eindpunten voor indexeerfuncties met een vaardighedenset1 Nee No No Ja Ja No Ja Ja
Maximum aantal privé-eindpunten N.v.t. 10 of 30 100 400 400 N.v.t. 20 20
Maximum aantal afzonderlijke resourcetypen2 N.v.t. 4 7 15 15 N.v.t. 4 4

1 AI-verrijking en afbeeldingsanalyse zijn rekenintensief en verbruiken onevenredige hoeveelheden beschikbare verwerkingskracht. Daarom worden privéverbindingen uitgeschakeld op lagere lagen om de prestaties en stabiliteit van de zoekservice zelf te garanderen.

2 Het aantal afzonderlijke resourcetypen wordt berekend als het aantal unieke groupId waarden dat wordt gebruikt voor alle gedeelde private link-resources voor een bepaalde zoekservice, ongeacht de status van de resource.

Limieten voor synoniemen

Het maximum aantal synoniemenkaarten verschilt per laag. Elke regel kan maximaal 20 uitbreidingen hebben, waarbij een uitbreiding een equivalente term is. Bijvoorbeeld, gegeven "kat", associatie met "kitty", "feline" en "felis" (het geslacht voor katten) telt als 3 uitbreidingen.

Bron Gratis Basis S1 S2 S3 S3-HD L1 L2
Maximum aantal synoniemenkaarten 3 3 5 10 20 20 10 10
Maximum aantal regels per kaart 5000 20000 20000 20000 20000 20000 20000 20000

Limieten voor indexalias

Het maximum aantal indexaliassen varieert per laag. In alle lagen is het maximum aantal aliassen het maximum aantal toegestane indexen verdubbeld.

Bron Gratis Basis S1 S2 S3 S3-HD L1 L2
Maximum aantal aliassen 6 10 of 30 100 400 400 2000 per partitie of 6000 per service 20 20

Gegevenslimieten (AI-verrijking)

Een AI-verrijkingspijplijn die aanroept naar een Azure AI-taalresource voor entiteitsherkenning, entiteitskoppeling, sleuteltermextractie, sentimentanalyse, taaldetectie en detectie van persoonlijke gegevens, is onderhevig aan gegevenslimieten. De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length. Als u uw gegevens wilt opsplitsen voordat u deze naar de sentimentanalyse verzendt, gebruikt u de vaardigheid Tekst splitsen.

Beperkingslimieten

API-aanvragen worden beperkt naarmate het systeem piekcapaciteit nadert. Beperking gedraagt zich anders voor verschillende API's. Query-API's (Search/Suggest/AutoComplete) en indexerings-API's beperken dynamisch op basis van de belasting van de service. Index-API's en servicebewerkingen-API's hebben statische limieten voor aanvraagsnelheid.

Limieten voor statische frequentieaanvragen voor bewerkingen met betrekking tot een index:

  • Lijstindexen (GET/indexen): 3 per seconde per zoekeenheid
  • Index ophalen (GET /indexen/myindex): 10 per seconde per zoekeenheid
  • Index maken (POST/indexen): 12 per minuut per zoekeenheid
  • Index maken of bijwerken (PUT /indexes/myindex): 6 per seconde per zoekeenheid
  • Index verwijderen (DELETE /indexen/myindex): 12 per minuut per zoekeenheid

Limieten voor statische frequentieaanvragen voor bewerkingen met betrekking tot een service:

  • Servicestatistieken (GET/servicestats): 4 per seconde per zoekeenheid

API-aanvraaglimieten

  • Maximum van 16 MB per aanvraag 1
  • Maximale URL-lengte van 8 kB
  • Maximaal 1000 documenten per batch indexuploads, samenvoegingen of verwijderingen
  • Maximaal 32 velden in $orderby component
  • Maximaal 100.000 tekens in een zoekcomponent
  • Het maximum aantal componenten in search (expressies gescheiden door AND of OR) is 1024
  • Maximale zoektermgrootte is 32.766 bytes (32 kB min 2 bytes) van UTF-8 gecodeerde tekst
  • De maximale zoektermgrootte is 1000 tekens voor zoeken in voorvoegsels en regex-zoekopdrachten
  • Zoekopdrachten met jokertekens en reguliere expressies zijn beperkt tot maximaal 1000 statussen wanneer ze worden verwerkt door Lucene.

1 In Azure AI Search is de hoofdtekst van een aanvraag onderworpen aan een bovengrens van 16 MB, waarbij een praktische limiet wordt opgelegd voor de inhoud van afzonderlijke velden of verzamelingen die niet anders worden beperkt door theoretische limieten (zie Ondersteunde gegevenstypen voor meer informatie over veldsamenstelling en beperkingen).

Limieten voor de querygrootte en -samenstelling bestaan omdat niet-gebonden query's uw zoekservice kunnen stabiliseren. Dergelijke query's worden doorgaans programmatisch gemaakt. Als uw toepassing programmatisch zoekquery's genereert, raden we u aan deze zo te ontwerpen dat er geen query's met een niet-gebonden grootte worden gegenereerd.

API-antwoordlimieten

  • Maximaal 1000 documenten geretourneerd per pagina met zoekresultaten
  • Maximaal 100 suggesties geretourneerd per API-aanvraag voorstellen

API-sleutellimieten

API-sleutels worden gebruikt voor serviceverificatie. Er zijn twee typen. Beheer sleutels worden opgegeven in de aanvraagheader en volledige lees-/schrijftoegang verlenen tot de service. Querysleutels zijn alleen-lezen, opgegeven in de URL en worden doorgaans gedistribueerd naar clienttoepassingen.

  • Maximaal 2 beheerderssleutels per service
  • Maximaal 50 querysleutels per service