Servicelimieten in Azure Cognitive Search
Maximale limieten voor opslag, workloads en hoeveelheden indexen en andere objecten zijn afhankelijk van het feit of u Azure Cognitive Search inricht in de prijscategorieën Gratis, Basic, Standard of Geoptimaliseerd voor opslag.
Gratis is een gedeelde service met meerdere tenants die deel uitmaakt van uw Azure-abonnement.
Basic biedt toegewezen computingresources voor productieworkloads op kleinere schaal, maar deelt een bepaalde netwerkinfrastructuur met andere tenants.
Standard wordt uitgevoerd op toegewezen machines met meer opslag- en verwerkingscapaciteit op elk niveau. Standard is beschikbaar in vier niveaus: S1, S2, S3 en S3 HD. S3 High Density (S3 HD) is ontworpen voor multitenancy en grote hoeveelheden kleine indexen (drieduizend indexen per service). S3 HD biedt geen indexeerfunctie en gegevensopname moet gebruikmaken van API's die gegevens van bron naar index pushen.
Geoptimaliseerd voor opslag wordt uitgevoerd op toegewezen machines met meer totale opslag, opslagbandbreedte en geheugen dan Standard. Deze laag is gericht op grote, langzaam veranderende indexen. Geoptimaliseerd voor opslag is beschikbaar in twee niveaus: L1 en L2.
Abonnementslimieten
U kunt meerdere services maken, die alleen worden beperkt door het aantal services dat in elke laag is toegestaan. U kunt bijvoorbeeld maximaal 16 services maken in de Basic-laag en nog eens 16 services in de S1-laag binnen hetzelfde abonnement. Zie Een SKU of laag kiezen voor Azure Cognitive Search voor meer informatie over lagen.
De limieten voor het maximumaantal services kunnen op aanvraag worden verhoogd. Als u meer services binnen hetzelfde abonnement nodig hebt, dient u een ondersteuningsaanvraag in.
Resource | Gratis1 | Basic | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximumaantal services | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maximale schaal in zoekeenheden (SU's)2 | N.v.t. | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Gratis is gebaseerd op infrastructuur die wordt gedeeld met andere klanten. Omdat de hardware niet is toegewezen, wordt omhoog schalen niet ondersteund in de gratis laag.
2 Zoekeenheden zijn factureringseenheden, toegewezen als een replica of als een partitie. U hebt beide resources nodig voor opslag, indexering en querybewerkingen. Zie Resourceniveaus schalen voor query- en indexwerkbelastingen voor meer informatie over SU-berekeningen.
Storage-limieten
Een zoekservice wordt beperkt door de schijfruimte of door de vaste limiet voor het maximumaantal indexen of indexeerfuncties (wat zich als eerste voordoet). De volgende tabel bevat opslaglimieten. Zie Limieten per resource voor maximale objectlimieten.
Resource | Gratis | Basic1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Service Level Agreement (SLA)2 | Nee | Ja | Ja | Ja | Ja | Ja | Ja | Ja |
Opslag per partitie | 50 MB | 2 GB | 25 GB | 100 GB | 200 GB | 200 GB | 1 TB | 2 TB |
Partities per service | N.v.t. | 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Partitiegrootte | N.v.t. | 2 GB | 25 GB | 100 GB | 200 GB | 200 GB | 1 TB | 2 TB |
Replica's | N.v.t. | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Basic heeft één vaste partitie. Er kunnen aanvullende zoekeenheden worden gebruikt om replica's toe te voegen voor grotere queryvolumes.
2 Service Level Agreements zijn van kracht voor factureerbare services op toegewezen resources. Gratis services en preview-functies hebben geen SLA. Voor factureerbare services worden SLA's van kracht wanneer u voldoende redundantie voor uw service inricht. SLA's voor query's (lezen) vereisen twee of meer replica's. SLA's voor query's en indexering (lezen-schrijven) vereisen drie of meer replica's. Het aantal partities is geen SLA-overweging.
Indexlimieten
Resource | Gratis | Basis 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximale aantal indexen | 3 | 5 of 15 | 50 | 200 | 200 | 1000 per partitie of 3000 per service | 10 | 10 |
Maximum aantal eenvoudige velden per index 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Maximum aantal complexe verzamelingen per index | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maximum aantal elementen voor alle complexe verzamelingen per document 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maximale diepte van complexe velden | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maximum aantal suggesties per index | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maximale scoreprofielen per index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maximum aantal functies per profiel | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
1 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexen. De Basic-laag is de enige SKU met een ondergrens van 100 velden per index.
2 De bovengrens voor velden omvat zowel velden op het eerste niveau als geneste subvelden in een complexe verzameling. Als een index bijvoorbeeld 15 velden bevat en twee complexe verzamelingen met elk vijf subvelden heeft, is het aantal velden van uw index 25. Indexen met een zeer grote verzameling velden kunnen traag zijn. Beperk velden en kenmerken tot alleen de gewenste velden en voer een indexerings- en querytest uit om te controleren of de prestaties acceptabel zijn.
3 Er bestaat een bovengrens voor elementen omdat een groot aantal elementen de benodigde opslagruimte voor uw index aanzienlijk vergroot. Een element van een complexe verzameling wordt gedefinieerd als een lid van die verzameling. Stel dat een hoteldocument met een complexe verzameling kamers is, dan wordt elke ruimte in de verzameling Ruimten beschouwd als een element. Tijdens het indexeren kan de indexeringsengine veilig maximaal 3000 elementen verwerken in het document als geheel. Deze limiet is geïntroduceerd in api-version=2019-05-06
en is alleen van toepassing op complexe verzamelingen en niet op tekenreeksverzamelingen of op complexe velden.
Mogelijk vindt u een variatie in de maximumlimieten als uw service is ingericht in een krachtiger cluster. De limieten hier vertegenwoordigen de gemene noemer. Indexen die zijn gebouwd volgens de bovenstaande specificaties, zijn overdraagbaar in equivalente servicelagen in elke regio.
Documentlimieten
Er zijn geen documentlimieten meer per service in Azure Cognitive Search, maar er is een limiet van ongeveer 24 miljard documenten per index voor de zoekservices Basic, S1, S2, S3, L1 en L2. Voor S3 HD is de limiet 2 miljard documenten per index. Elk element van een complexe verzameling telt als een afzonderlijk document in termen van deze limieten.
Limieten voor documentgrootte per API-aanroep
De maximale documentgrootte bij het aanroepen van een Index-API is ongeveer 16 megabytes.
Documentgrootte is in feite een limiet voor de grootte van de hoofdtekst van de index-API-aanvraag. Omdat u een batch van meerdere documenten tegelijk aan de Index-API kunt doorgeven, is de limiet voor de grootte realistisch afhankelijk van het aantal documenten in de batch. Voor een batch met één document is de maximale documentgrootte 16 MB aan JSON.
Houd bij het schatten van de documentgrootte rekening met alleen de velden die door een zoekservice kunnen worden gebruikt. Binaire of afbeeldingsgegevens in brondocumenten moeten worden weggelaten uit uw berekeningen.
Limieten voor indexeerfuncties
Er bestaan maximale uitvoeringstijden om de service in zijn geheel evenwicht en stabiliteit te bieden, maar grotere gegevenssets hebben mogelijk meer indexeringstijd nodig dan het maximum toestaat. Als een indexeringstaak niet binnen de maximaal toegestane tijd kan worden voltooid, voert u deze uit volgens een schema. De planner houdt de indexeringsstatus bij. Als een geplande indexeringstaak om welke reden dan ook wordt onderbroken, kan de indexeerfunctie verdergaan waar deze voor het laatst is gebleven bij de volgende geplande uitvoering.
Resource | Gratis 1 | Basic 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximale aantal indexeerfuncties | 3 | 5 of 15 | 50 | 200 | 200 | N.v.t. | 10 | 10 |
Maximale aantal gegevensbronnen | 3 | 5 of 15 | 50 | 200 | 200 | N.v.t. | 10 | 10 |
Maximale vaardighedensets 4 | 3 | 5 of 15 | 50 | 200 | 200 | N.v.t. | 10 | 10 |
Maximale indexeringsbelasting per aanroep | 10.000 documenten | Alleen beperkt door het maximum aantal documenten | Alleen beperkt door het maximum aantal documenten | Alleen beperkt door het maximum aantal documenten | Alleen beperkt door het maximum aantal documenten | N.v.t. | Geen limiet | Geen limiet |
Minimumplanning | 5 minuten | 5 minuten | 5 minuten | 5 minuten | 5 minuten | 5 minuten | 5 minuten | 5 minuten |
Maximale uitvoeringstijd 6 | 1-3 minuten | 2 of 24 uur | 2 of 24 uur | 2 of 24 uur | 2 of 24 uur | N.v.t. | 2 of 24 uur | 2 of 24 uur |
Maximale uitvoeringstijd voor indexeerfuncties met een vaardighedenset 5 | 3-10 minuten | 2 uur | 2 uur | 2 uur | 2 uur | N.v.t. | 2 uur | 2 uur |
Blob-indexeerfunctie: maximale blobgrootte, MB | 16 | 16 | 128 | 256 | 256 | N.v.t. | 256 | 256 |
Blob-indexeerfunctie: maximum aantal tekens voor inhoud die is geëxtraheerd uit een blob | 32,000 | 64,000 | 4 miljoen | 8 miljoen | 16 miljoen | N.v.t. | 4 miljoen | 4 miljoen |
1 Gratis services hebben een maximale uitvoeringstijd van de indexeerfunctie van 3 minuten voor blobbronnen en 1 minuut voor alle andere gegevensbronnen. De aanroep van de indexeerfunctie vindt eenmaal per 180 seconden plaats. Voor AI-indexering die Cognitive Services aanroept, zijn gratis services beperkt tot 20 gratis transacties per indexeerfunctie per dag, waarbij een transactie wordt gedefinieerd als een document dat de verrijkingspijplijn doorloopt (tip: u kunt een indexeerfunctie opnieuw instellen om het aantal opnieuw in te stellen).
2 Basisservices die vóór december 2017 zijn gemaakt, hebben lagere limieten (5 in plaats van 15) voor indexeerfuncties, gegevensbronnen en vaardighedensets.
3 S3 HD-services bieden geen ondersteuning voor indexeerfuncties.
4 Maximaal 30 vaardigheden per vaardighedenset.
5 AI-verrijking en afbeeldingsanalyse zijn rekenintensief en verbruiken onevenredig veel beschikbare verwerkingskracht. De uitvoeringstijd voor deze workloads is verkort, zodat andere taken in de wachtrij meer kans krijgen om uit te voeren.
6 De gecombineerde uitvoering van de indexeerfunctie en de indexeervaardighedenset is onderworpen aan een maximale duur van 2 uur. Op dit moment hebben sommige indexeerfuncties een langer maximum uitvoeringsvenster van 24 uur, maar dat gedrag is niet de norm. Het langere venster is alleen van toepassing als een service of de indexeerfuncties niet intern kunnen worden gemigreerd naar het nieuwere runtimegedrag. Als u meer dan 2 uur nodig hebt om een indexeerfunctie of een indexeerfunctie-vaardighedensetproces te voltooien, plant u dat de indexeerfunctie met intervallen van 2 uur wordt uitgevoerd.
Notitie
Zoals vermeld in de Indexlimieten, dwingen indexeerfuncties ook de bovengrens van 3000 elementen af voor alle complexe verzamelingen per document, te beginnen met de nieuwste GA API-versie die ondersteuning biedt voor complexe typen (2019-05-06
) en verder. Dit betekent dat als u uw indexeerfunctie hebt gemaakt met een eerdere API-versie, u niet onderhevig bent aan deze limiet. Om maximale compatibiliteit te behouden, wordt een indexeerfunctie die is gemaakt met een eerdere API-versie en vervolgens is bijgewerkt met een API-versie 2019-05-06
of hoger, nog steeds uitgesloten van de limieten. Klanten moeten zich bewust zijn van de nadelige gevolgen van het hebben van zeer grote complexe verzamelingen (zoals eerder vermeld) en we raden u ten zeerste aan om nieuwe indexeerfuncties te maken met de nieuwste GA API-versie.
Resourcelimieten voor gedeelde privékoppelingen
Indexeerfuncties hebben toegang tot andere Azure-resources via privé-eindpunten die worden beheerd via de resource-API voor gedeelde privékoppelingen. In deze sectie worden de limieten beschreven die aan deze mogelijkheid zijn gekoppeld.
Resource | Gratis | Basic | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Ondersteuning voor indexeerfunctie voor privé-eindpunten | Nee | Ja | Ja | Ja | Ja | Nee | Ja | Ja |
Ondersteuning voor privé-eindpunten voor indexeerfuncties met een vaardighedenset1 | Nee | Nee | Nee | Ja | Ja | Nee | Ja | Ja |
Maximum aantal privé-eindpunten | N.v.t. | 10 of 30 | 100 | 400 | 400 | N.v.t. | 20 | 20 |
Maximum aantal afzonderlijke resourcetypen2 | N.v.t. | 4 | 7 | 15 | 15 | N.v.t. | 4 | 4 |
1 AI-verrijking en afbeeldingsanalyse zijn rekenintensief en verbruiken onevenredig veel beschikbare verwerkingskracht. Om deze reden worden privéverbindingen uitgeschakeld in lagere lagen om te voorkomen dat de prestaties en stabiliteit van de zoekservice zelf nadelig worden beïnvloed.
2 Het aantal afzonderlijke resourcetypen wordt berekend als het aantal unieke groupId
waarden dat wordt gebruikt voor alle gedeelde privékoppelingsresources voor een bepaalde zoekservice, ongeacht de status van de resource.
Synoniemlimieten
Het maximum aantal synoniemenkaarten verschilt per laag. Elke regel kan maximaal 20 uitbreidingen hebben, waarbij een uitbreiding een equivalente term is. Bijvoorbeeld, gegeven "kat", zou associatie met "kitty", "kat" en "felis" (het geslacht voor katten) als 3 uitbreidingen tellen.
Resource | Gratis | Basic | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximumaantal synoniemenkaarten | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maximum aantal regels per kaart | 5000 | 20.000 | 20.000 | 20.000 | 20.000 | 20.000 | 20.000 | 20.000 |
Limieten voor indexaliassen
Het maximum aantal indexaliassen verschilt per laag. In alle lagen is het maximum aantal aliassen het dubbele van het maximum aantal toegestane indexen.
Resource | Gratis | Basic | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximum aantal aliassen | 6 | 10 of 30 | 100 | 400 | 400 | 2000 per partitie of 6000 per service | 20 | 20 |
Gegevenslimieten (AI-verrijking)
Een AI-verrijkingspijplijn die aanroept naar Azure Cognitive Services voor taalresources voor entiteitsherkenning, entiteitskoppeling, sleuteltermextractie, sentimentanalyse, taaldetectie en detectie van persoonlijke gegevens , is onderhevig aan gegevenslimieten. De maximale grootte van een record moet 50.000 tekens zijn, zoals gemeten door String.Length
. Als u uw gegevens moet opsplitsen voordat u deze naar de sentimentanalyse verzendt, gebruikt u de vaardigheid Tekst splitsen.
Beperkingslimieten
API-aanvragen worden beperkt naarmate het systeem de piekcapaciteit nadert. Beperking gedraagt zich anders voor verschillende API's. Query-API's (Zoeken/Voorstellen/Automatisch aanvullen) en indexerings-API's worden dynamisch beperkt op basis van de belasting van de service. Index-API's en api voor servicebewerkingen hebben statische limieten voor aanvraagsnelheid.
Limieten voor statische frequentieaanvragen voor bewerkingen die betrekking hebben op een index:
- Lijstindexen (GET/indexen): 3 per seconde per zoekeenheid
- Get Index (GET /indexes/myindex): 10 per seconde per zoekeenheid
- Index maken (POST/indexen): 12 per minuut per zoekeenheid
- Index maken of bijwerken (PUT /indexen/myindex): 6 per seconde per zoekeenheid
- Delete Index (DELETE /indexes/myindex): 12 per minuut per zoekeenheid
Limieten voor statische frequentieaanvragen voor bewerkingen die betrekking hebben op een service:
- Servicestatistieken (GET /servicestats): 4 per seconde per zoekeenheid
Limieten voor API-aanvragen
- Maximaal 16 MB per aanvraag 1
- Maximale URL-lengte van 8 kB
- Maximaal 1000 documenten per batch van indexuploads, samenvoegingen of verwijderingen
- Maximaal 32 velden in $orderby component
- Maximaal 100.000 tekens in een zoekcomponent
- Het maximum aantal componenten in
search
(expressies gescheiden door AND of OR) is 1024 - Maximale zoektermgrootte is 32.766 bytes (32 kB minus 2 bytes) UTF-8 gecodeerde tekst
- Maximale zoektermgrootte is 1000 tekens voor zoeken naar voorvoegsels en regex-zoekopdrachten
- Zoeken met jokertekens en reguliere expressies zijn beperkt tot maximaal 1000 statussen wanneer ze worden verwerkt door Lucene.
1 In Azure Cognitive Search is de hoofdtekst van een aanvraag onderworpen aan een bovengrens van 16 MB, waardoor een praktische limiet wordt ingesteld voor de inhoud van afzonderlijke velden of verzamelingen die niet anderszins worden beperkt door theoretische limieten (zie Ondersteunde gegevenstypen voor meer informatie over veldsamenstelling en beperkingen).
Er bestaan limieten voor querygrootte en -samenstelling omdat niet-afhankelijke query's uw zoekservice kunnen stabiliseren. Normaal gesproken worden dergelijke query's programmatisch gemaakt. Als uw toepassing programmatisch zoekquery's genereert, raden we u aan deze zo te ontwerpen dat er geen query's van niet-afhankelijke grootte worden gegenereerd.
API-antwoordlimieten
- Er worden maximaal 1000 documenten geretourneerd per pagina met zoekresultaten
- Maximaal 100 suggesties geretourneerd per Api-aanvraag voor suggesties
API-sleutellimieten
API-sleutels worden gebruikt voor serviceverificatie. Er zijn twee typen. Beheer sleutels worden opgegeven in de aanvraagheader en verlenen volledige lees-schrijftoegang tot de service. Querysleutels zijn alleen-lezen, worden opgegeven in de URL en worden doorgaans gedistribueerd naar clienttoepassingen.
- Maximaal 2 beheersleutels per service
- Maximaal 50 querysleutels per service