Kvóty a omezení služeb

Článek
01/20/2024

Tento obsah se vztahuje na:v4.0 (Preview) | Předchozí verze:v3.1 (GA)v3.0 (GA)

Tento obsah se vztahuje na:v2.1 | Nejnovější verze:v4.0 (Preview)

Tento článek obsahuje stručný přehled i podrobný popis kvót a limitů služby Azure AI Document Intelligence pro všechny cenové úrovně. Obsahuje také některé osvědčené postupy, které brání omezování požadavků.

Využití modelu

Podporované typy dokumentů	Čteno	Rozložení	Předem vytvořené modely	Vlastní modely	Možnosti doplňků
PDF	✔️	✔️	✔️	✔️	✔️
Obrázky: `JPEG/JPG`, `PNG`, `BMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️	✔️
systém Microsoft Office: `DOCX`, `PPTX`,`XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = podporováno ✖️ = nepodporováno

Podporované typy dokumentů	Čteno	Rozložení	Předem vytvořené modely	Vlastní modely
PDF	✔️	✔️	✔️	✔️
Obrázky: `JPEG/JPG`, `PNG`, `BMP`, `TIFFHEIF`	✔️	✔️	✔️	✔️
systém Microsoft Office: `DOCX`, `PPTX`,`XLS`	✔️	✖️	✖️	✖️

✔️ = podporováno ✖️ = nepodporováno

Kvóta	Free (F0)¹	Standard (S0)
Limit transakcí za sekundu	0	15 (výchozí hodnota)
Nastavitelný	No	Ano ²
Maximální velikost dokumentu	4 MB	500 MB
Nastavitelný	No	Ne
Maximální počet stránek (analýza)	2	2000
Nastavitelný	No	Ne
Maximální velikost souboru popisků	10 MB	10 MB
Nastavitelný	No	Ne
Maximální velikost odpovědi JSON OCR	500 MB	500 MB
Nastavitelný	No	Ne
Maximální počet modelů šablon	500	5000
Nastavitelný	No	Ne
Maximální počet neurálních modelů	100	500
Nastavitelný	No	Ne

Vlastní využití modelu

Kvóta	Free (F0) ¹	Standard (S0)
Limit pro vytvoření modelu	5	200 (výchozí hodnota)
Nastavitelný	No	Ne
*Velikost trénovací datové sady Neurální**	1 GB ³	1 GB (výchozí hodnota)
Nastavitelný	No	Ne
*Velikost trénovací datové sady Šablona**	50 MB ⁴	50 MB (výchozí hodnota)
Nastavitelný	No	Ne
*Maximální počet stránek (trénování) Šablona**	500	500 (výchozí hodnota)
Nastavitelný	No	Ne
*Maximální počet stránek (trénování) Neurální**	50 000	50 000 (výchozí hodnota)
Nastavitelný	No	Ne
Trénování vlastního neurálního modelu	10 za měsíc	20 za měsíc
Nastavitelný	No	Ano ³
*Maximální počet stránek (trénování) Klasifikátor**	10,000	10 000 (výchozí hodnota)
Nastavitelný	No	Ne
*Maximální počet typů dokumentů (tříd) Klasifikátor**	500	500 (výchozí hodnota)
Nastavitelný	No	Ne
*Trénovací velikost datové sady Klasifikátor**	1GB	1 GB (výchozí hodnota)
Nastavitelný	No	Ne
*Minimální počet vzorků na třídu Klasifikátor**	5	5 (výchozí hodnota)
Nastavitelný	No	Ne

Omezení vlastních modelů

Kvóta	Free (F0) ¹	Standard (S0)
Limit pro vytvoření modelu	5	200 (výchozí hodnota)
Nastavitelný	No	Ne
Velikost trénovací datové sady	50 MB	50 MB (výchozí hodnota)
Nastavitelný	No	Ne
Maximální počet stránek (školení)	500	500 (výchozí hodnota)
Nastavitelný	No	Ne

¹ Cenová úroveň Free (F0) viz také měsíční povolenky na stránce s cenami.
² Viz osvědčené postupy a [pokyny k úpravám (#create-a-submit-support-request).
3 Počet trénování neurálních modelů se resetuje každý kalendářní měsíc. Otevřete žádost o podporu pro zvýšení měsíčního limitu trénování.

⁴ Toto omezení platí pro všechny dokumenty nalezené ve složce trénovací datové sady před všemi aktualizacemi souvisejícími s popisky.

Podrobný popis, úprava kvóty a osvědčené postupy

Než požádáte o navýšení kvóty (pokud je to možné), ujistěte se, že je to nezbytné. Služba Document Intelligence používá automatické škálování k zajištění požadovaných výpočetních prostředků on-demand, nízké náklady zákazníků a zrušení zřízení nepoužívaných prostředků tím, že neudrží nadměrnou kapacitu hardwaru.

Pokud vaše aplikace vrátí kód odpovědi 429 (Příliš mnoho požadavků) a vaše úloha je v definovaných mezích: s největší pravděpodobností se služba vertikálně navyšuje na vaši poptávku, ale ještě musí dosáhnout požadovaného škálování. Služba tedy nemá okamžitě dostatek prostředků pro obsluhu požadavku. Tento stav je přechodný a neměl by trvat dlouho.

Obecné osvědčené postupy pro zmírnění omezování během automatického škálování

Pokud chcete minimalizovat problémy související s omezováním (kód odpovědi 429), doporučujeme použít následující techniky:

Implementace logiky opakování ve vaší aplikaci
Pokuste se předcházet prudkým výkyvům zatížení. Postupné zvýšení zatížení
Příklad: Vaše aplikace používá funkci Document Intelligence a vaše aktuální úloha je 10 TPS (transakce za sekundu). Další sekundu zvýšíte zatížení na 40 TPS (to je čtyřikrát více). Služba okamžitě začne vertikálně navýšit kapacitu tak, aby splnila nové zatížení, ale pravděpodobně ji nemůže provést během sekundy, takže některé požadavky získají kód odpovědi 429.

Další části popisují konkrétní případy úprav kvót. Přejít na funkci Document Intelligence: Zvýšení limitu souběžných požadavků

Zvýšení limitu požadavků za sekundu

Ve výchozím nastavení je počet transakcí za sekundu omezen na 15 transakcí za sekundu pro prostředek Document Intelligence. U cenové úrovně Standard je možné tento počet zvýšit. Před odesláním žádosti se ujistěte, že znáte materiály v této části a seznamte se s těmito osvědčenými postupy.

Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Document Intelligence používá model Zaplatit jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.

Stávající hodnota parametru limitu souběžných požadavků není viditelná prostřednictvím webu Azure Portal, nástrojů příkazového řádku ani požadavků rozhraní API. Pokud chcete ověřit stávající hodnotu, vytvořte žádost o podporu Azure.

Pokud chcete zvýšit počet transakcí za sekundu, můžete u prostředku povolit automatické škálování. Podle tohoto dokumentu povolte automatické škálování vašeho prostředku * povolte automatické škálování. Můžete také odeslat žádost o zvýšení podpory TPS.

Připravte požadované informace.

ID prostředku Document Intelligence
Oblast
Jak získat informace (základní model):
- Přihlaste se k portálu Azure Portal.
- Vyberte prostředek document intelligence, pro který chcete zvýšit limit transakce.
- Vybrat vlastnosti (skupina Správa prostředků)
- Zkopírujte a uložte hodnoty následujících polí:
  - ID prostředku
  - Umístění (oblast koncového bodu)

Vytvoření a odeslání žádosti o podporu

Odesláním žádosti o podporu zahajte zvýšení limitu transakcí za sekundu (TPS) pro váš prostředek:

Ujistěte se, že máte požadované informace.
Přihlaste se k portálu Azure Portal.
Vyberte prostředek document intelligence, pro který chcete zvýšit limit TPS.
Vyberte Možnost Nová žádost o podporu (podpora a skupina řešení potíží )
Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
Zadejte souhrn (například "Zvýšení limitu tps funkce Document Intelligence")
V části Typ problému* vyberte Ověření kvóty nebo využití.
Vybrat další: Řešení
Pokračujte vytvořením žádosti dál.
Na kartě Podrobnosti zadejte do pole Popis následující informace:
- poznámka: žádost se týká kvóty funkce Document Intelligence .
- Zadejte očekávání TPS, které byste chtěli škálovat tak, aby vyhovovaly.
- Shromažďované informace o prostředcích Azure
- Dokončení zadávání požadovaných informací a výběr tlačítka Vytvořit na kartě Revize a vytvoření
- Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy jste kontaktovali pro další zpracování.

Příklad osvědčeného postupu vzorů úloh

Tento příklad představuje postup, který doporučujeme zmírnit možné omezování požadavků kvůli probíhajícímu automatickému škálování. Nejedná se o přesný recept, ale jen šablonu, která nás zve k tomu, aby postup řídila a upravila podle potřeby.

Předpokládejme, že prostředek Document Intelligence má nastavený výchozí limit. Spusťte úlohu a odešlete své žádosti o analýzu. Pokud zjistíte, že dochází k častému omezování s kódem odpovědi 429, začněte implementací exponenciálního zpochybnění žádosti o odpověď na analýzu GET. Použitím postupně delší doby čekání mezi opakovanými pokusy pro po sobě jdoucí chybové odpovědi, například 2-5-13-34 zpoždění mezi požadavky. Obecně doporučujeme nevolat odpověď get analyze více než jednou za 2 sekundy pro odpovídající požadavek POST.

Pokud zjistíte, že u odesílaných dokumentů dochází k omezování počtu žádostí POST, zvažte přidání zpoždění mezi požadavky. Pokud vaše úloha vyžaduje vyšší stupeň souběžného zpracování, musíte vytvořit žádost o podporu, která zvýší limity služeb u transakcí za sekundu.

Obecně doporučujeme před přechodem do produkčního prostředí otestovat úlohy a vzory úloh.

Další kroky

Informace o kódech chyb a řešení potíží

Share via