Funkce automatického škálování služeb Cognitive Services

Tento článek obsahuje pokyny, jak zákazníci můžou přistupovat k vyšším limitům rychlosti u svých prostředků služeb Cognitive Service.

Přehled

Každý prostředek služeb Cognitive Services má předem nakonfigurovanou statickou rychlost volání (transakce za sekundu), která omezuje počet souběžných volání, která můžou zákazníci provádět do back-endové služby v daném časovém rámci. Funkce automatického škálování automaticky zvýší nebo sníží limity rychlosti prostředků zákazníka na základě metrik využití prostředků téměř v reálném čase a metriky kapacity back-endové služby.

Začínáme s funkcí automatického škálování

Tato funkce je ve výchozím nastavení zakázaná pro každý nový prostředek. Podle těchto pokynů ho povolte.

Přejděte na stránku vašeho prostředku v Azure Portal a vyberte kartu Přehled v levém podokně. V části Základy najděte řádek automatického škálování a vyberte odkaz pro zobrazení podokna Nastavení automatického škálování a povolení funkce.

Snímek obrazovky Azure Portal s podoknem automatického škálování vpravo

Nejčastější dotazy

Znamená to, že povolení funkce automatického škálování znamená, že se můj prostředek už nikdy nebude omezovat?

Ne, u překročení limitu rychlosti se můžou stále zobrazovat 429 chyby. Pokud vaše aplikace aktivuje špičku a váš prostředek hlásí 429 odpověď, automatické škálování zkontroluje část s dostupnou projekcí kapacity a zjistí, jestli aktuální kapacita dokáže přizpůsobit navýšení limitu rychlosti a reagovat během pěti minut.

Pokud je dostupná kapacita dostatečná pro zvýšení, automatické škálování postupně zvýší limit rychlosti vašeho prostředku. Pokud budete i nadále volat prostředek s vysokou mírou, která vede k většímu 429 omezování, míra TPS se bude v průběhu času i nadále zvětšovat. Pokud to bude pokračovat po dobu jedné nebo více hodin, měli byste pro tento prostředek dosáhnout maximální míry (až 1000 TPS).

Pokud dostupná kapacita nestačí na zvýšení, funkce automatického škálování počká pět minut a znovu zkontroluje.

Co když potřebuji vyšší výchozí limit rychlosti?

Ve výchozím nastavení mají prostředky služeb Cognitive Service výchozí limit rychlosti 10 TPS. Pokud potřebujete vyšší výchozí čip TPS, odešlete lístek podle odkazu Nová žádost o podporu na stránce vašeho prostředku v Azure Portal. Nezapomeňte do žádosti zahrnout obchodní odůvodnění.

Zvýší se tato funkce výdaje za Azure?

Ceny služeb Cognitive Services se nezměnily a můžete k nim získat přístup. Fakturujeme jenom za úspěšná volání rozhraní API služeb Cognitive Services. Vyšší limity četnosti volání ale znamenají, že se dokončí více transakcí a můžete obdržet vyšší fakturu.

Uvědomte si potenciální chyby a jejich důsledky. Pokud by chyba ve vaší klientské aplikaci způsobovala volání služby stovkykrát za sekundu, což by pravděpodobně vedlo k mnohem vyššímu vyúčtování, zatímco náklady by byly mnohem omezeny v rámci pevného limitu rychlosti. Chyby tohoto typu jsou vaší odpovědností, proto důrazně doporučujeme provádět testy vývoje a aktualizací klienta u prostředku s pevným limitem rychlosti před použitím funkce automatického škálování.

Můžu tuto funkci zakázat, pokud raději omezím rychlost, než mám nepředvídatelné útraty?

Ano, funkci automatického škálování můžete zakázat prostřednictvím Azure Portal nebo rozhraní příkazového řádku a vrátit se do výchozího nastavení limitu rychlosti volání. Pokud byl váš prostředek dříve schválen pro vyšší výchozí čip TPS, vrátí se k této sazbě. Může trvat až pět minut, než se změny projeví.

Které služby podporují funkci automatického škálování?

Funkce automatického škálování je dostupná pro následující služby:

Můžu tuto funkci otestovat pomocí bezplatného předplatného?

Ne, funkce automatického škálování není dostupná pro předplatná úrovně Free.

Další kroky