Kvoter och begränsningar för tjänsten
Det här innehållet gäller för:v2.1 | Senaste version:
v4.0 (förhandsversion)
Den här artikeln innehåller både en snabbreferens och en detaljerad beskrivning av kvoter och gränser för Azure AI Document Intelligence-tjänsten för alla prisnivåer. Den innehåller också några metodtips för att undvika begränsning av begäranden.
Modellanvändning
Dokumenttyper som stöds | Lästa | Layout | Inbyggda modeller | Anpassade modeller | Tilläggsfunktioner |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = stöds ✖️ = stöds inte
Dokumenttyper som stöds | Lästa | Layout | Inbyggda modeller | Anpassade modeller |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Bilder: JPEG/JPG , PNG , BMP , , TIFF HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = stöds ✖️ = stöds inte
Säljbudget | Gratis (F0)1 | Standard (S0) |
---|---|---|
Gränsen för transaktioner per sekund | 1 | 15 (standardvärde) |
Justerbar | Nej | Ja 2 |
Maximal dokumentstorlek | 4 MB | 500 MB |
Justerbar | Nej | Nej |
Maximalt antal sidor (analys) | 2 | 2000 |
Justerbar | Nej | Nej |
Maximal storlek på etikettfilen | 10 MB | 10 MB |
Justerbar | Nej | Nej |
Maximal storlek på OCR json-svar | 500 MB | 500 MB |
Justerbar | Nej | Nej |
Maximalt antal mallmodeller | 500 | 5000 |
Justerbar | Nej | Nej |
Maximalt antal neurala modeller | 100 | 500 |
Justerbar | Nej | Nej |
Användning av anpassad modell
Säljbudget | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 200 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Neural | 1 GB 3 | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Mall | 50 MB 4 | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * mall | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) * Neuralt | 50,000 | 50 000 (standardvärde) |
Justerbar | Nej | Nej |
Träna anpassad neural modell | 10 per månad | 20 per månad |
Justerbar | Nej | Ja 3 |
Maximalt antal sidor (träning) * Klassificerare | 10,000 | 10 000 (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal dokumenttyper (klasser) * Klassificerare | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning * Klassificerare | 1 GB | 1 GB (standardvärde) |
Justerbar | Nej | Nej |
Minsta antal exempel per klass * Klassificerare | 5 | 5 (standardvärde) |
Justerbar | Nej | Nej |
Anpassade modellgränser
Säljbudget | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Skriv modellgräns | 5 | 200 (standardvärde) |
Justerbar | Nej | Nej |
Storlek på träningsdatauppsättning | 50 MB | 50 MB (standardvärde) |
Justerbar | Nej | Nej |
Maximalt antal sidor (träning) | 500 | 500 (standardvärde) |
Justerbar | Nej | Nej |
1 Prisnivån Kostnadsfri (F0) finns även månadsbidrag på prissidan.
2 Se metodtips och [justeringsinstruktioner(#create-and-submit-support-request).
3 Träningsantalet neurala modeller återställs varje kalendermånad. Öppna en supportbegäran för att öka den månatliga träningsgränsen.
4 Den här gränsen gäller för alla dokument som finns i mappen för träningsdatauppsättningen före eventuella etiketteringsrelaterade uppdateringar.
Detaljerad beskrivning, kvotjustering och metodtips
Innan du begär en kvotökning (om tillämpligt) kontrollerar du att det är nödvändigt. Document Intelligence-tjänsten använder automatisk skalning för att ta med de nödvändiga beräkningsresurserna on-demand
, hålla kundkostnaderna låga och avetablera oanvända resurser genom att inte upprätthålla en alltför stor mängd maskinvarukapacitet.
Om ditt program returnerar svarskod 429 (för många begäranden) och din arbetsbelastning ligger inom de definierade gränserna: troligtvis skalas tjänsten upp till din efterfrågan, men har ännu inte nått den skala som krävs. Därför har tjänsten inte omedelbart tillräckligt med resurser för att hantera begäran. Det här tillståndet är övergående och bör inte vara långvarigt.
Allmänna metodtips för att minska begränsningen vid automatisk skalning
För att minimera problem som rör begränsning (svarskod 429) rekommenderar vi att du använder följande tekniker:
- Implementera logik för återförsök i ditt program
- Undvik stora plötsliga ändringar i arbetsbelastningen. Öka arbetsbelastningen gradvis
Exempel. Ditt program använder Dokumentinformation och din aktuella arbetsbelastning är 10 TPS (transaktioner per sekund). Nästa sekund ökar du belastningen till 40 TPS (det är fyra gånger mer). Tjänsten börjar omedelbart skala upp för att uppfylla den nya belastningen, men sannolikt kan den inte göra det inom en sekund, så vissa begäranden får svarskod 429.
I nästa avsnitt beskrivs specifika fall av justering av kvoter. Hoppa till Dokumentinformation: öka gränsen för samtidiga begäranden
Öka gränsen för begäranden per sekund
Som standard är antalet transaktioner per sekund begränsat till 15 transaktioner per sekund för en dokumentinformationsresurs. För prisnivån Standard kan antalet ökas. Innan du skickar begäran ska du se till att du är bekant med materialet i det här avsnittet och känner till dessa metodtips.
Att öka gränsen för samtidig begäran påverkar inte dina kostnader direkt. Document Intelligence Service använder modellen "Betala endast för det du använder". Gränsen definierar hur högt tjänsten kan skalas innan den börjar begränsa dina begäranden.
Det befintliga värdet för parametern Gräns för samtidig begäran visas inte via Azure-portalen, kommandoradsverktyg eller API-begäranden. Om du vill verifiera det befintliga värdet skapar du en Azure-supportbegäran.
Om du vill öka dina transaktioner per sekund kan du aktivera automatisk skalning på resursen. Följ det här dokumentet om du vill aktivera automatisk skalning på resursen * aktivera automatisk skalning. Du kan också skicka en begäran om ökad TPS-support.
Ha den information som krävs klar
Resurs-ID för dokumentinformation
Region
Så här hämtar du information (basmodell):
- Logga in på Azure-portalen
- Välj den dokumentinformationsresurs som du vill öka transaktionsgränsen för
- Välj Egenskaper (resurshanteringsgrupp )
- Kopiera och spara värdena för följande fält:
- Resurs-ID
- Plats (din slutpunktsregion)
Skapa och skicka supportbegäran
Initiera ökningen av transaktioner per sekund (TPS) för din resurs genom att skicka supportbegäran:
- Kontrollera att du har den information som krävs
- Logga in på Azure-portalen
- Välj den dokumentinformationsresurs som du vill öka TPS-gränsen för
- Välj Ny supportbegäran (support + felsökningsgrupp )
- Ett nytt fönster visas med information som fylls i automatiskt om din Azure-prenumeration och Azure-resurs
- Ange sammanfattning (som "Öka TPS-gränsen för dokumentinformation")
- I Problemtyp* väljer du "Kvot- eller användningsverifiering"
- Välj Nästa: Lösningar
- Fortsätt med att skapa begäran
- Under fliken Information anger du följande information i fältet Beskrivning :
- en anteckning om att begäran handlar om kvot för dokumentinformation .
- Ange en TPS-förväntan som du vill skala för att uppfylla.
- Azure-resursinformation som du har samlat in.
- Slutför inmatningen av nödvändig information och välj knappen Skapa på fliken Granska + skapa
- Anteckna numret för supportbegäran i Azure Portal-meddelanden. Du kontaktas snart för vidare bearbetning
Exempel på metodtips för arbetsbelastningsmönster
I det här exemplet visas den metod som vi rekommenderar för att minimera eventuell begränsning av begäranden på grund av att automatisk skalning pågår. Det är inte ett exakt recept, utan bara en mall som vi bjuder in att följa och justera efter behov.
Låt oss anta att en dokumentinformationsresurs har standardgränsen inställd. Starta arbetsbelastningen för att skicka dina analysbegäranden. Om du upptäcker att du ser frekventa begränsningar med svarskod 429 börjar du med att implementera en exponentiell backoff på get-analyssvarsbegäran. Genom att använda en progressivt längre väntetid mellan återförsök för efterföljande felsvar, till exempel ett 2-5-13-34 mönster av fördröjningar mellan begäranden. I allmänhet rekommenderar vi att du inte anropar svaret get analyze mer än en gång var 2:e sekund för en motsvarande POST-begäran.
Om du upptäcker att du begränsas av antalet POST-begäranden för dokument som skickas kan du överväga att lägga till en fördröjning mellan begäranden. Om din arbetsbelastning kräver en högre grad av samtidig bearbetning måste du skapa en supportbegäran för att öka tjänstgränserna för transaktioner per sekund.
I allmänhet rekommenderar vi att du testar arbetsbelastningen och arbetsbelastningsmönstren innan du går till produktion.
Nästa steg
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för