Kvóty a omezení služeb

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)

Tento obsah se vztahuje na:Zaškrtnutív2.1 | Nejnovější verze:modrá značka zaškrtnutív4.0 (Preview)

Tento článek obsahuje stručný přehled i podrobný popis kvót a limitů služby Azure AI Document Intelligence pro všechny cenové úrovně. Obsahuje také některé osvědčené postupy, které brání omezování požadavků.

Využití modelu

Podporované typy dokumentů Čteno Rozložení Předem vytvořené modely Vlastní modely Možnosti doplňků
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Obrázky: JPEG/JPG, PNG, BMP, TIFFHEIF ✔️ ✔️ ✔️ ✔️ ✔️
systém Microsoft Office: DOCX, PPTX,XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = podporováno ✖️ = nepodporováno

Podporované typy dokumentů Čteno Rozložení Předem vytvořené modely Vlastní modely
PDF ✔️ ✔️ ✔️ ✔️
Obrázky: JPEG/JPG, PNG, BMP, TIFFHEIF ✔️ ✔️ ✔️ ✔️
systém Microsoft Office: DOCX, PPTX,XLS ✔️ ✖️ ✖️ ✖️

✔️ = podporováno ✖️ = nepodporováno

Kvóta Free (F0)1 Standard (S0)
Limit transakcí za sekundu 0 15 (výchozí hodnota)
Nastavitelný No Ano 2
Maximální velikost dokumentu 4 MB 500 MB
Nastavitelný No Ne
Maximální počet stránek (analýza) 2 2000
Nastavitelný No Ne
Maximální velikost souboru popisků 10 MB 10 MB
Nastavitelný No Ne
Maximální velikost odpovědi JSON OCR 500 MB 500 MB
Nastavitelný No Ne
Maximální počet modelů šablon 500 5000
Nastavitelný No Ne
Maximální počet neurálních modelů 100 500
Nastavitelný No Ne

Vlastní využití modelu

Kvóta Free (F0) 1 Standard (S0)
Limit pro vytvoření modelu 5 200 (výchozí hodnota)
Nastavitelný No Ne
Velikost trénovací datové sady * Neurální 1 GB 3 1 GB (výchozí hodnota)
Nastavitelný No Ne
Velikost trénovací datové sady * Šablona 50 MB 4 50 MB (výchozí hodnota)
Nastavitelný No Ne
Maximální počet stránek (trénování) * Šablona 500 500 (výchozí hodnota)
Nastavitelný No Ne
Maximální počet stránek (trénování) * Neurální 50 000 50 000 (výchozí hodnota)
Nastavitelný No Ne
Trénování vlastního neurálního modelu 10 za měsíc 20 za měsíc
Nastavitelný No Ano 3
Maximální počet stránek (trénování) * Klasifikátor 10,000 10 000 (výchozí hodnota)
Nastavitelný No Ne
Maximální počet typů dokumentů (tříd) * Klasifikátor 500 500 (výchozí hodnota)
Nastavitelný No Ne
Trénovací velikost datové sady * Klasifikátor 1GB 1 GB (výchozí hodnota)
Nastavitelný No Ne
Minimální počet vzorků na třídu * Klasifikátor 5 5 (výchozí hodnota)
Nastavitelný No Ne

Omezení vlastních modelů

Kvóta Free (F0) 1 Standard (S0)
Limit pro vytvoření modelu 5 200 (výchozí hodnota)
Nastavitelný No Ne
Velikost trénovací datové sady 50 MB 50 MB (výchozí hodnota)
Nastavitelný No Ne
Maximální počet stránek (školení) 500 500 (výchozí hodnota)
Nastavitelný No Ne

1 Cenová úroveň Free (F0) viz také měsíční povolenky na stránce s cenami.
2 Viz osvědčené postupy a [pokyny k úpravám (#create-a-submit-support-request).
3 Počet trénování neurálních modelů se resetuje každý kalendářní měsíc. Otevřete žádost o podporu pro zvýšení měsíčního limitu trénování.

4 Toto omezení platí pro všechny dokumenty nalezené ve složce trénovací datové sady před všemi aktualizacemi souvisejícími s popisky.

Podrobný popis, úprava kvóty a osvědčené postupy

Než požádáte o navýšení kvóty (pokud je to možné), ujistěte se, že je to nezbytné. Služba Document Intelligence používá automatické škálování k zajištění požadovaných výpočetních prostředků on-demand, nízké náklady zákazníků a zrušení zřízení nepoužívaných prostředků tím, že neudrží nadměrnou kapacitu hardwaru.

Pokud vaše aplikace vrátí kód odpovědi 429 (Příliš mnoho požadavků) a vaše úloha je v definovaných mezích: s největší pravděpodobností se služba vertikálně navyšuje na vaši poptávku, ale ještě musí dosáhnout požadovaného škálování. Služba tedy nemá okamžitě dostatek prostředků pro obsluhu požadavku. Tento stav je přechodný a neměl by trvat dlouho.

Obecné osvědčené postupy pro zmírnění omezování během automatického škálování

Pokud chcete minimalizovat problémy související s omezováním (kód odpovědi 429), doporučujeme použít následující techniky:

  • Implementace logiky opakování ve vaší aplikaci
  • Pokuste se předcházet prudkým výkyvům zatížení. Postupné zvýšení zatížení
    Příklad: Vaše aplikace používá funkci Document Intelligence a vaše aktuální úloha je 10 TPS (transakce za sekundu). Další sekundu zvýšíte zatížení na 40 TPS (to je čtyřikrát více). Služba okamžitě začne vertikálně navýšit kapacitu tak, aby splnila nové zatížení, ale pravděpodobně ji nemůže provést během sekundy, takže některé požadavky získají kód odpovědi 429.

Další části popisují konkrétní případy úprav kvót. Přejít na funkci Document Intelligence: Zvýšení limitu souběžných požadavků

Zvýšení limitu požadavků za sekundu

Ve výchozím nastavení je počet transakcí za sekundu omezen na 15 transakcí za sekundu pro prostředek Document Intelligence. U cenové úrovně Standard je možné tento počet zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály v této části a seznamte se s těmito osvědčenými postupy.

Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Document Intelligence používá model Zaplatit jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.

Stávající hodnota parametru limitu souběžných požadavků není viditelná prostřednictvím webu Azure Portal, nástrojů příkazového řádku ani požadavků rozhraní API. Pokud chcete ověřit stávající hodnotu, vytvořte žádost o podporu Azure.

Pokud chcete zvýšit počet transakcí za sekundu, můžete u prostředku povolit automatické škálování. Podle tohoto dokumentu povolte automatické škálování vašeho prostředku * povolte automatické škálování. Můžete také odeslat žádost o zvýšení podpory TPS.

Připravte požadované informace.

  • ID prostředku Document Intelligence

  • Oblast

  • Jak získat informace (základní model):

    • Přihlaste se k portálu Azure Portal.
    • Vyberte prostředek document intelligence, pro který chcete zvýšit limit transakce.
    • Vybrat vlastnosti (skupina Správa prostředků)
    • Zkopírujte a uložte hodnoty následujících polí:
      • ID prostředku
      • Umístění (oblast koncového bodu)

Vytvoření a odeslání žádosti o podporu

Odesláním žádosti o podporu zahajte zvýšení limitu transakcí za sekundu (TPS) pro váš prostředek:

  • Ujistěte se, že máte požadované informace.
  • Přihlaste se k portálu Azure Portal.
  • Vyberte prostředek document intelligence, pro který chcete zvýšit limit TPS.
  • Vyberte Možnost Nová žádost o podporu (podpora a skupina řešení potíží )
  • Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
  • Zadejte souhrn (například "Zvýšení limitu tps funkce Document Intelligence")
  • V části Typ problému* vyberte Ověření kvóty nebo využití.
  • Vybrat další: Řešení
  • Pokračujte vytvořením žádosti dál.
  • Na kartě Podrobnosti zadejte do pole Popis následující informace:
    • poznámka: žádost se týká kvóty funkce Document Intelligence .
    • Zadejte očekávání TPS, které byste chtěli škálovat tak, aby vyhovovaly.
    • Shromažďované informace o prostředcích Azure
    • Dokončení zadávání požadovaných informací a výběr tlačítka Vytvořit na kartě Revize a vytvoření
    • Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali pro další zpracování.

Příklad osvědčeného postupu vzorů úloh

Tento příklad představuje postup, který doporučujeme zmírnit možné omezování požadavků kvůli probíhajícímu automatickému škálování. Nejedná se o přesný recept, ale jen šablonu, která nás zve k tomu, aby postup řídila a upravila podle potřeby.

Předpokládejme, že prostředek Document Intelligence má nastavený výchozí limit. Spusťte úlohu a odešlete své žádosti o analýzu. Pokud zjistíte, že dochází k častému omezování s kódem odpovědi 429, začněte implementací exponenciálního zpochybnění žádosti o odpověď na analýzu GET. Použitím postupně delší doby čekání mezi opakovanými pokusy pro po sobě jdoucí chybové odpovědi, například 2-5-13-34 zpoždění mezi požadavky. Obecně doporučujeme nevolat odpověď get analyze více než jednou za 2 sekundy pro odpovídající požadavek POST.

Pokud zjistíte, že u odesílaných dokumentů dochází k omezování počtu žádostí POST, zvažte přidání zpoždění mezi požadavky. Pokud vaše úloha vyžaduje vyšší stupeň souběžného zpracování, musíte vytvořit žádost o podporu, která zvýší limity služeb u transakcí za sekundu.

Obecně doporučujeme před přechodem do produkčního prostředí otestovat úlohy a vzory úloh.

Další kroky