Tjänstbegränsningar i Azure Cognitive Search
De maximala gränserna för lagring, arbetsbelastningar och kvantiteter av index och andra objekt beror på om du etablerar Azure Cognitive Search på prisnivåerna Kostnadsfri, Basic, Standard eller Lagringsoptimerad.
Kostnadsfri är en delad tjänst för flera klientorganisationer som medföljer din Azure-prenumeration.
Basic tillhandahåller dedikerade beräkningsresurser för produktionsarbetsbelastningar i mindre skala, men delar en del nätverksinfrastruktur med andra klienter.
Standard körs på dedikerade datorer med mer lagrings- och bearbetningskapacitet på alla nivåer. Standard finns i fyra nivåer: S1, S2, S3 och S3 HD. S3 High Density (S3 HD) är utformad för flera innehavare och stora mängder små index (tre tusen index per tjänst). S3 HD tillhandahåller inte indexeringsfunktionen och datainmatningen måste utnyttja API:er som skickar data från källa till index.
Lagringsoptimerad körs på dedikerade datorer med mer total lagring, lagringsbandbredd och minne än Standard. Den här nivån är avsedd för stora, långsamt föränderliga index. Lagringsoptimerad finns i två nivåer: L1 och L2.
Prenumerationsgränser
Du kan skapa flera tjänster, som endast begränsas av antalet tjänster som tillåts på varje nivå. Du kan till exempel skapa upp till 16 tjänster på Basic-nivån och ytterligare 16 tjänster på S1-nivån inom samma prenumeration. Mer information om nivåer finns i Välj en SKU eller nivå för Azure Cognitive Search.
Maximala tjänstbegränsningar kan höjas vid begäran. Om du behöver fler tjänster i samma prenumeration kan du skicka en supportbegäran.
Resurs | Gratis1 | Basic | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal tjänster | 1 | 16 | 16 | 8 | 6 | 6 | 6 | 6 |
Maximal skala i sökenheter (SU)2 | Ej tillämpligt | 3 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU | 36 SU |
1 Kostnadsfri baseras på infrastruktur som delas med andra kunder. Eftersom maskinvaran inte är dedikerad stöds inte uppskalning på den kostnadsfria nivån.
2 Sökenheter är faktureringsenheter som allokeras som antingen en replik eller en partition. Du behöver både resurser för lagring, indexering och frågeåtgärder. Mer information om SU-beräkningar finns i Skala resursnivåer för fråge- och indexarbetsbelastningar.
Lagringsgränser
En söktjänst begränsas av diskutrymme eller av en hård gräns för det maximala antalet index eller indexerare, beroende på vilket som kommer först. I följande tabell dokumenteras lagringsgränser. Maximala objektgränser finns i Begränsningar efter resurs.
Resurs | Kostnadsfri | Grundläggande1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Serviceavtal (SLA)2 | Inga | Ja | Ja | Ja | Ja | Ja | Ja | Ja |
Lagringsutrymme per partition | 50 MB | 2 GB | 25 GB | 100 GB | 200 GB | 200 GB | 1 TB | 2 TB |
Partitioner per tjänst | Ej tillämpligt | 1 | 12 | 12 | 12 | 3 | 12 | 12 |
Partitionsstorlek | Ej tillämpligt | 2 GB | 25 GB | 100 GB | 200 GB | 200 GB | 1 TB | 2 TB |
Repliker | Ej tillämpligt | 3 | 12 | 12 | 12 | 12 | 12 | 12 |
1 Basic har en fast partition. Ytterligare sökenheter kan användas för att lägga till repliker för större frågevolymer.
2 Serviceavtal gäller för fakturerbara tjänster på dedikerade resurser. Kostnadsfria tjänster och förhandsgranskningsfunktioner har inget serviceavtal. För fakturerbara tjänster träder serviceavtal i kraft när du etablerar tillräcklig redundans för din tjänst. Två eller flera repliker krävs för fråge-SLA:er (läsa). Tre eller fler repliker krävs för serviceavtal för frågor och indexering (läs-och-skrivbehörighet). Antalet partitioner är inte ett SLA-övervägande.
Indexgränser
Resurs | Kostnadsfri | Grundläggande 1 | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal index | 3 | 5 eller 15 | 50 | 200 | 200 | 1 000 per partition eller 3 000 per tjänst | 10 | 10 |
Maximalt antal enkla fält per index 2 | 1000 | 100 | 1000 | 1000 | 1000 | 1000 | 1000 | 1000 |
Maximalt antal komplexa samlingar per index | 40 | 40 | 40 | 40 | 40 | 40 | 40 | 40 |
Maximalt antal element i alla komplexa samlingar per dokument 3 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 | 3000 |
Maximalt djup för komplexa fält | 10 | 10 | 10 | 10 | 10 | 10 | 10 | 10 |
Maximalt antal förslag per index | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Maximalt antal bedömningsprofiler per index | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 |
Maximalt antal funktioner per profil | 8 | 8 | 8 | 8 | 8 | 8 | 8 | 8 |
1 Grundläggande tjänster som skapats före december 2017 har lägre gränser (5 i stället för 15) för index. Basic-nivån är den enda SKU:n med en lägre gräns på 100 fält per index.
2 Den övre gränsen för fält innehåller både fält på första nivån och kapslade underfält i en komplex samling. Om ett index till exempel innehåller 15 fält och har två komplexa samlingar med fem underfält vardera är fältantalet för ditt index 25. Index med en mycket stor fältsamling kan vara långsamma. Begränsa fält och attribut till bara de du behöver och kör indexerings- och frågetest för att säkerställa att prestandan är acceptabel.
3 Det finns en övre gräns för element eftersom ett stort antal av dem avsevärt ökar det lagringsutrymme som krävs för ditt index. Ett element i en komplex samling definieras som medlem i samlingen. Anta till exempel att ett hotelldokument med en rumskomplex samling, varje rum i samlingen Rum betraktas som ett element. Under indexeringen kan indexeringsmotorn på ett säkert sätt bearbeta högst 3 000 element i hela dokumentet. Den här gränsen infördes i api-version=2019-05-06
och gäller endast komplexa samlingar, inte strängsamlingar eller komplexa fält.
Du kan hitta en viss variation i maxgränser om tjänsten råkar etableras i ett mer kraftfullt kluster. Gränserna här representerar den gemensamma nämnaren. Index som skapats enligt specifikationerna ovan är portabla på motsvarande tjänstnivåer i alla regioner.
Dokumentgränser
Det finns inte längre några dokumentgränser per tjänst i Azure Cognitive Search, men det finns en gräns på cirka 24 miljarder dokument per index för söktjänsterna Basic, S1, S2, S3, L1 och L2. För S3 HD är gränsen 2 miljarder dokument per index. Varje element i en komplex samling räknas som ett separat dokument när det gäller dessa gränser.
Begränsningar för dokumentstorlek per API-anrop
Den maximala dokumentstorleken när du anropar ett Index-API är cirka 16 megabyte.
Dokumentstorleken är faktiskt en gräns för storleken på index-API-begärandetexten. Eftersom du kan skicka en batch med flera dokument till index-API:et samtidigt beror storleksgränsen realistiskt på hur många dokument som finns i batchen. För en batch med ett enda dokument är den maximala dokumentstorleken 16 MB JSON.
När du beräknar dokumentstorleken bör du bara tänka på de fält som kan användas av en söktjänst. Binära data eller bilddata i källdokument bör utelämnas från dina beräkningar.
Indexerares gränser
Det finns maximala körningstider för att ge balans och stabilitet till tjänsten som helhet, men större datamängder kan behöva mer indexeringstid än vad maxgränsen tillåter. Om ett indexeringsjobb inte kan slutföras inom den maximala tillåtna tiden kan du prova att köra det enligt ett schema. Schemaläggaren håller reda på indexeringsstatus. Om ett schemalagt indexeringsjobb avbryts av någon anledning kan indexeraren fortsätta där det senast slutade vid nästa schemalagda körning.
Resurs | Gratis 1 | Grundläggande 2 | S1 | S2 | S3 | S3 HD 3 | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal indexerare | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Maximalt antal datakällor | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Högsta antal kompetensuppsättningar 4 | 3 | 5 eller 15 | 50 | 200 | 200 | Ej tillämpligt | 10 | 10 |
Maximal indexeringsbelastning per anrop | 10 000 dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Begränsas endast av maximalt antal dokument | Ej tillämpligt | Obegränsad | Obegränsad |
Lägsta schema | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter | 5 minuter |
Maximal körtid 6 | 1–3 minuter | 2 eller 24 timmar | 2 eller 24 timmar | 2 eller 24 timmar | 2 eller 24 timmar | Ej tillämpligt | 2 eller 24 timmar | 2 eller 24 timmar |
Maximal körtid för indexerare med en kompetensuppsättning 5 | 3–10 minuter | 2 timmar | 2 timmar | 2 timmar | 2 timmar | Ej tillämpligt | 2 timmar | 2 timmar |
Blobindexerare: maximal blobstorlek, MB | 16 | 16 | 128 | 256 | 256 | Ej tillämpligt | 256 | 256 |
Blobindexerare: maximalt antal tecken på innehåll som extraherats från en blob | 32,000 | 64,000 | 4 miljoner | 8 miljoner | 16 miljoner | Ej tillämpligt | 4 miljoner | 4 miljoner |
1 Kostnadsfria tjänster har den maximala körningstiden för indexeraren på 3 minuter för blobkällor och 1 minut för alla andra datakällor. Indexerarens anrop är en gång var 180:e sekund. För AI-indexering som anropar till Cognitive Services är kostnadsfria tjänster begränsade till 20 kostnadsfria transaktioner per indexerare per dag, där en transaktion definieras som ett dokument som passerar via berikandepipelinen (tips: du kan återställa en indexerare för att återställa antalet).
2 Grundläggande tjänster som skapades före december 2017 har lägre gränser (5 i stället för 15) för indexerare, datakällor och kompetensuppsättningar.
3 S3 HD-tjänster innehåller inte stöd för indexerare.
4 Maximalt 30 färdigheter per kompetensuppsättning.
5 AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Körningstiden för dessa arbetsbelastningar har förkortats för att ge andra jobb i kön större möjlighet att köras.
6 Indexer-körning och kombinerad körning av indexerare-skillset är föremål för en maximal varaktighet på 2 timmar. För närvarande har vissa indexerare ett längre maximalt körningsfönster på 24 timmar, men det beteendet är inte normen. Det längre fönstret gäller endast om en tjänst eller dess indexerare inte kan migreras internt till det nyare körningsbeteendet. Om mer än 2 timmar krävs för att slutföra en indexerare eller indexerare-kompetensprocess , schemalägger du indexeraren så att den körs med 2-timmarsintervall.
Anteckning
Som anges i indexgränserna tillämpar indexerare också den övre gränsen på 3 000 element i alla komplexa samlingar per dokument från och med den senaste GA API-versionen som stöder komplexa typer (2019-05-06
) och senare. Det innebär att om du har skapat indexeraren med en tidigare API-version kommer du inte att omfattas av den här gränsen. För att bevara maximal kompatibilitet undantas fortfarande en indexerare som skapades med en tidigare API-version och sedan uppdaterades med en API-version 2019-05-06
eller senare från gränserna. Kunderna bör vara medvetna om de negativa effekterna av att ha mycket stora komplexa samlingar (som tidigare nämnts) och vi rekommenderar starkt att du skapar nya indexerare med den senaste GA API-versionen.
Resursgränser för delad privat länk
Indexerare kan komma åt andra Azure-resurser via privata slutpunkter som hanteras via resurs-API:et för delad privat länk. I det här avsnittet beskrivs de gränser som är associerade med den här funktionen.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3 HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Stöd för privat slutpunktsindexerare | Inga | Ja | Ja | Ja | Ja | Inga | Ja | Ja |
Stöd för privata slutpunkter för indexerare med kompetensuppsättning1 | Inga | Inga | Inga | Ja | Ja | Inga | Ja | Ja |
Maximalt antal privata slutpunkter | Ej tillämpligt | 10 eller 30 | 100 | 400 | 400 | Ej tillämpligt | 20 | 20 |
Maximalt antal distinkta resurstyper2 | Saknas | 4 | 7 | 15 | 15 | Saknas | 4 | 4 |
1 AI-berikning och bildanalys är beräkningsintensiva och förbrukar oproportionerliga mängder tillgänglig bearbetningskraft. Därför inaktiveras privata anslutningar på lägre nivåer för att undvika en negativ inverkan på själva söktjänstens prestanda och stabilitet.
2 Antalet distinkta resurstyper beräknas som antalet unika groupId
värden som används för alla delade privata länkresurser för en viss söktjänst, oavsett resursens status.
Synonymgränser
Det maximala antalet synonymkartor varierar beroende på nivå. Varje regel kan ha upp till 20 expansioner, där en expansion är en motsvarande term. Till exempel, med tanke på "katt", association med "kitty", "kattdjur" och "felis" (släktet för katter) skulle räknas som 3 expansioner.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal synonymkartor | 3 | 3 | 5 | 10 | 20 | 20 | 10 | 10 |
Maximalt antal regler per karta | 5000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 | 20000 |
Indexaliasgränser
Det maximala antalet indexalias varierar beroende på nivå. På alla nivåer är det maximala antalet alias dubbelt så många index som tillåts.
Resurs | Kostnadsfri | Grundläggande | S1 | S2 | S3 | S3-HD | L1 | L2 |
---|---|---|---|---|---|---|---|---|
Maximalt antal alias | 6 | 10 eller 30 | 100 | 400 | 400 | 2 000 per partition eller 6 000 per tjänst | 20 | 20 |
Datagränser (AI-berikning)
En PIPELINE för AI-berikande som gör anrop till Azure Cognitive Services for Language-resursen för entitetsigenkänning, entitetslänkning, extrahering av nyckelfraser, attitydanalys, språkidentifiering och identifiering av personlig information omfattas av datagränser. Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length
. Om du behöver dela upp dina data innan du skickar dem till attitydanalysatorn använder du färdigheten Textdelning.
Begränsningsgränser
API-begäranden begränsas när systemet närmar sig högsta kapacitet. Begränsning fungerar annorlunda för olika API:er. Fråge-API:er (Search/Suggest/Autocomplete) och indexering av API:er begränsas dynamiskt baserat på belastningen på tjänsten. API:er för index-API:er och tjänståtgärder har statiska hastighetsbegränsningar för begäranden.
Begärandens gränser för statisk hastighet för åtgärder som är relaterade till ett index:
- Lista index (GET /index): 3 per sekund per sökenhet
- Hämta index (GET /index/myindex): 10 per sekund per sökenhet
- Skapa index (POST /index): 12 per minut per sökenhet
- Skapa eller uppdatera index (PUT /index/myindex): 6 per sekund per sökenhet
- Ta bort index (DELETE /index/myindex): 12 per minut per sökenhet
Begärandens gränser för statisk hastighet för åtgärder som är relaterade till en tjänst:
- Tjänststatistik (GET /servicestats): 4 per sekund per sökenhet
API-begärandens gränser
- Maximalt 16 MB per begäran 1
- Maximalt 8 kB URL-längd
- Maximalt 1 000 dokument per batch med indexuppladdningar, sammanslagningar eller borttagningar
- Maximalt 32 fält i $orderby-sats
- Maximalt 100 000 tecken i en söksats
- Det maximala antalet satser i
search
(uttryck avgränsade med AND eller OR) är 1024 - Maximal söktermstorlek är 32 766 byte (32 kB minus 2 byte) UTF-8-kodad text
- Maximal söktermsstorlek är 1 000 tecken för prefixsökning och regex-sökning
- Sökning med jokertecken och reguljära uttryck är begränsade till högst 1 000 tillstånd när de bearbetas av Lucene.
1 I Azure Cognitive Search omfattas en begärans brödtext av en övre gräns på 16 MB, vilket medför en praktisk gräns för innehållet i enskilda fält eller samlingar som annars inte begränsas av teoretiska gränser (se Datatyper som stöds för mer information om fältsammansättning och begränsningar).
Det finns gränser för frågestorlek och sammansättning eftersom obundna frågor kan destabilisera söktjänsten. Normalt skapas sådana frågor programmatiskt. Om ditt program genererar sökfrågor programmatiskt rekommenderar vi att du utformar det på ett sådant sätt att det inte genererar frågor av obundna storlekar.
API-svarsgränser
- Maximalt 1 000 dokument som returneras per sida med sökresultat
- Maximalt 100 förslag som returneras per förslags-API-begäran
API-nyckelgränser
API-nycklar används för tjänstautentisering. Det finns två typer. Admin nycklar anges i begärandehuvudet och ger fullständig läs- och skrivbehörighet till tjänsten. Frågenycklar är skrivskyddade, anges på URL:en och distribueras vanligtvis till klientprogram.
- Högst 2 administratörsnycklar per tjänst
- Maximalt 50 frågenycklar per tjänst