Servicequota en -limieten
Deze inhoud is van toepassing op:v2.1 | Nieuwste versie:v4.0 (preview)
Dit artikel bevat zowel een beknopt overzicht als een gedetailleerde beschrijving van de Quota's en limieten van de Azure AI Document Intelligence-service voor alle prijscategorieën. Het bevat ook enkele aanbevolen procedures om aanvraagbeperking te voorkomen.
Modelgebruik
Ondersteunde documenttypen | Read | Indeling | Vooraf samengestelde modellen | Aangepaste modellen |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Afbeeldingen (JPEG/JPG), PNG, BMP, TIFF, HEIF | ✔️ | ✔️ | ✔️ | ✔️ |
Office-bestandstypen DOCX, PPTX, XLS | ✔️ | ✖️ | ✖️ | ✖️ |
Ondersteunde documenttypen | Read | Indeling | Vooraf samengestelde modellen | Aangepaste modellen |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Afbeeldingen (JPEG/JPG), PNG, BMP, TIFF, HEIF | ✔️ | ✔️ | ✔️ | ✔️ |
Office-bestandstypen DOCX, PPTX, XLS | ✔️ | ✔️ | ✖️ | ✖️ |
Target | Gratis (F0)1 | Standard (S0) |
---|---|---|
Limiet voor transacties per seconde | 1 | 15 (standaardwaarde) |
Verstelbaar | Nee | Ja 2 |
Maximale documentgrootte | 4 MB | 500 MB |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (analyse) | 2 | 2000 |
Verstelbaar | Nee | Nr. |
Maximale grootte van labelsbestand | 10 MB | 10 MB |
Verstelbaar | Nee | Nr. |
Maximale grootte van OCR json-antwoord | 500 MB | 500 MB |
Verstelbaar | Nee | Nr. |
Maximum aantal sjabloonmodellen | 500 | 5000 |
Verstelbaar | Nee | Nr. |
Maximum aantal neurale modellen | 100 | 500 |
Verstelbaar | Nee | Nr. |
Aangepast modelgebruik
Target | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 200 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Neuraal | 1 GB 3 | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Sjabloon | 50 MB 4 | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * sjabloon | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) * Neurale | 50,000 | 50.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Aangepaste neurale model trainen | 10 per maand | 20 per maand |
Verstelbaar | Nee | Ja 3 |
Maximum aantal pagina's (training) * Classificatie | 10,000 | 10.000 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal documenttypen (klassen) * Classificatie | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset * Classificatie | 1 GB | 1 GB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Minimum aantal steekproeven per klasse * Classificatie | 5 | 5 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Limieten voor aangepaste modellen
Target | Gratis (F0) 1 | Standard (S0) |
---|---|---|
Limiet voor opstellen model | 5 | 200 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Grootte van trainingsgegevensset | 50 MB | 50 MB (standaardwaarde) |
Verstelbaar | Nee | Nr. |
Maximum aantal pagina's (training) | 500 | 500 (standaardwaarde) |
Verstelbaar | Nee | Nr. |
1 Prijscategorie Gratis (F0) zie ook maandelijkse vergoedingen op de pagina met prijzen.
2 Zie best practices en [aanpassingsinstructies (#create-en-submit-support-request).
3 Trainingsaantal neurale modellen wordt elke kalendermaand opnieuw ingesteld. Open een ondersteuningsaanvraag om de maandelijkse trainingslimiet te verhogen.
4 Deze limiet geldt voor alle documenten in uw map met trainingsgegevenssets voordat er updates met betrekking tot labels worden bijgewerkt.
Gedetailleerde beschrijving, quotaaanpassing en best practices
Voordat u een quotumverhoging aanvraagt (indien van toepassing), moet u controleren of het noodzakelijk is. De Document Intelligence-service maakt gebruik van automatisch schalen om de vereiste rekenbronnen in 'on-demand' te brengen en tegelijkertijd om de kosten van de klant laag te houden, ongebruikte resources ongedaan te maken door een overmatige hoeveelheid hardwarecapaciteit niet te behouden.
Als uw toepassing antwoordcode 429 (te veel aanvragen) retourneert en uw workload binnen de gedefinieerde limieten valt: waarschijnlijk wordt de service omhoog geschaald naar uw vraag, maar moet de vereiste schaal nog worden bereikt. De service beschikt dus niet onmiddellijk over voldoende resources om de aanvraag te verwerken. Deze status is doorgaans tijdelijk en duurt niet lang.
Algemene aanbevolen procedures om beperking tijdens automatisch schalen te beperken
Als u problemen met betrekking tot beperking wilt minimaliseren (antwoordcode 429), raden we u aan de volgende technieken te gebruiken:
- Logica voor opnieuw proberen implementeren in uw toepassing
- Vermijd grote wijzigingen in de workload. De workload geleidelijk verhogen
Voorbeeld. Uw toepassing gebruikt Document Intelligence en uw huidige workload is 10 TPS (transacties per seconde). De volgende seconde verhoogt u de belasting tot 40 TPS (dat is vier keer meer). De service wordt onmiddellijk opgeschaald om aan de nieuwe belasting te voldoen, maar dit kan waarschijnlijk niet binnen een seconde, dus sommige aanvragen krijgen antwoordcode 429.
In de volgende secties worden specifieke gevallen beschreven van het aanpassen van quota. Ga naar Document Intelligence: limiet voor gelijktijdige aanvragen verhogen
Limiet voor transacties per seconde aanvragen verhogen
Standaard is het aantal transacties per seconde beperkt tot 15 transacties per seconde voor een Document Intelligence-resource. Voor de prijscategorie Standard kan dit aantal worden verhoogd. Voordat u de aanvraag indient, moet u ervoor zorgen dat u bekend bent met het materiaal in deze sectie en op de hoogte bent van deze aanbevolen procedures.
Het verhogen van de limiet voor gelijktijdige aanvragen heeft geen directe invloed op uw kosten. Document Intelligence-service maakt gebruik van het model 'Alleen betalen voor wat u gebruikt'. De limiet bepaalt hoe hoog de service kan worden geschaald voordat uw aanvragen worden beperkt.
De bestaande waarde van de parameter Voor gelijktijdige aanvraaglimiet is niet zichtbaar via Azure Portal, opdrachtregelprogramma's of API-aanvragen. Als u de bestaande waarde wilt controleren, dient u een Azure-ondersteuningsaanvraag in.
Als u uw transacties per seconde wilt verhogen, kunt u automatisch schalen inschakelen voor uw resource. Volg dit document om automatisch schalen in te schakelen voor uw resource * automatisch schalen in te schakelen. U kunt ook een verhoogde TPS-ondersteuningsaanvraag indienen.
De vereiste informatie gereed hebben
Resource-id voor documentinformatie
Regio
Informatie ophalen (basismodel):
- Meld u aan bij Azure Portal
- Selecteer de Document Intelligence-resource waarvoor u de transactielimiet wilt verhogen
- Eigenschappen selecteren (resourcebeheergroep)
- Kopieer en sla de waarden van de volgende velden op:
- Resource-id
- Locatie (uw eindpuntregio)
Ondersteuningsaanvraag maken en indienen
Initieer de verhoging van de limiet voor transacties per seconde (TPS) voor uw resource door de ondersteuningsaanvraag in te dienen:
- Zorg ervoor dat u over de vereiste informatie beschikt
- Meld u aan bij Azure Portal
- Selecteer de Document Intelligence-resource waarvoor u de TPS-limiet wilt verhogen
- Selecteer nieuwe ondersteuningsaanvraag (ondersteuning en probleemoplossingsgroep )
- Er wordt een nieuw venster weergegeven met automatisch ingevulde informatie over uw Azure-abonnement en Azure-resource
- Voer samenvatting in (zoals 'TPS-limiet voor documentinformatie verhogen')
- Selecteer 'Quotum- of gebruiksvalidatie' in probleemtype*.
- Volgende selecteren: Oplossingen
- Ga verder met het maken van de aanvraag
- Voer op het tabblad Details de volgende informatie in het veld Beschrijving in:
- een opmerking: de aanvraag gaat over het quotum voor documentinformatie .
- Geef een TPS-verwachting die u wilt schalen om te voldoen.
- Azure-resourcegegevens die u hebt verzameld.
- Voltooi het invoeren van de vereiste gegevens en selecteer de knop Maken op het tabblad Controleren en maken
- Noteer het nummer van de ondersteuningsaanvraag in Azure Portal-meldingen. U wordt binnenkort gecontacteerd voor verdere verwerking
Voorbeeld van een best practice voor een workloadpatroon
In dit voorbeeld wordt de aanbevolen aanpak te volgen om mogelijke aanvraagbeperking te beperken omdat automatische schaalaanpassing wordt uitgevoerd. Het is geen exact recept, maar slechts een sjabloon die we nodig hebben om te volgen en aan te passen.
Stel dat voor een Document Intelligence-resource de standaardlimiet is ingesteld. Start de workload om uw analyseaanvragen in te dienen. Als u merkt dat u regelmatig beperkingen ondervindt met antwoordcode 429, begint u met het implementeren van een exponentiële back-off op de GET-aanvraag voor het analyseren van reacties. Door een geleidelijk langere wachttijd te gebruiken tussen nieuwe pogingen voor opeenvolgende foutreacties, bijvoorbeeld een 2-5-13-34-patroon van vertragingen tussen aanvragen. Over het algemeen raden we aan om het antwoord voor een analyse meer dan één keer per 2 seconden aan te roepen voor een bijbehorende POST-aanvraag.
Als u merkt dat u wordt beperkt tot het aantal POST-aanvragen voor documenten dat wordt ingediend, kunt u overwegen om een vertraging tussen de aanvragen toe te voegen. Als uw workload een hogere mate van gelijktijdige verwerking vereist, moet u vervolgens een ondersteuningsaanvraag maken om uw servicelimieten voor transacties per seconde te verhogen.
Over het algemeen raden we u aan om de workload en de workloadpatronen te testen voordat u naar productie gaat.