Kvóty a omezení služby Speech

Tento článek obsahuje stručný přehled a podrobný popis kvót a omezení služby Speech ve službě Azure Cognitive Services. Informace platí pro všechny cenové úrovně služby. Obsahuje také některé osvědčené postupy, které brání omezování požadavků.

Informace o cenové úrovni Free (F0) najdete také v měsíčních příspěvcích na stránce s cenami.

Referenční informace o kvótách a limitech

V následujících částech najdete stručného průvodce kvótami a omezeními, které se vztahují na službu Speech.

Informace o upravitelných kvótách pro prostředky služby Speech úrovně Standard (S0) najdete v dalších vysvětleních, osvědčených postupech a pokynech k úpravám. Kvóty a limity pro prostředky Free (F0) Speech se nedají upravit.

Kvóty a omezení převodu řeči na text na prostředek

Tato část popisuje kvóty a omezení převodu řeči na text na prostředek služby Speech. Pokud není uvedeno jinak, omezení se nedají upravit.

Online přepis a překlad řeči

Pro krátký zvuk můžete použít online přepis se sadou Speech SDK nebo rozhraním REST API pro převod řeči na text.

Důležité

Tato omezení platí pro souběžné online žádosti o přepis řeči na text a kombinované žádosti o překlad řeči. Pokud máte například 60 souběžných žádostí převodu řeči na text a 40 souběžných žádostí o překlad řeči, dosáhnete limitu 100 souběžných požadavků.

Kvóta Volný (F0) Standard (S0)
Limit souběžných požadavků – koncový bod základního modelu 1

Tento limit není možné upravit.
100 (výchozí hodnota)

Rychlost je nastavitelná pro prostředky Standard (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.
Limit souběžných požadavků – vlastní koncový bod 1

Tento limit není možné upravit.
100 (výchozí hodnota)

Rychlost je nastavitelná pro prostředky Standard (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.

Dávkový přepis

Kvóta Volný (F0) Standard (S0)
Limit rozhraní REST API pro převod řeči na text Není k dispozici pro F0 300 požadavků za minutu
Maximální velikost souboru zvukového vstupu 1 GB
Maximální velikost vstupního objektu blob (například může obsahovat více než jeden soubor v archivu ZIP). Všimněte si limitu velikosti souboru z předchozího řádku. 2,5 GB
Maximální velikost kontejneru objektů blob 5 GB
Maximální počet objektů blob na kontejner 10000
Maximální počet souborů na žádost o přepis (pokud jako vstup používáte více adres URL obsahu) 1000

Přizpůsobení modelu

Omezení v této tabulce platí pro každý prostředek služby Speech při vytváření modelu Custom Speech.

Kvóta Volný (F0) Standard (S0)
Limit rozhraní REST API 300 požadavků za minutu 300 požadavků za minutu
Maximální počet datových sad řeči 2 500
Maximální velikost souboru akustické datové sady pro import dat 2 GB 2 GB
Maximální velikost souboru jazykové datové sady pro import dat 200 MB 1,5 GB
Maximální velikost souboru datové sady výslovnosti pro import dat 1 kB 1 MB
Maximální velikost textu při použití parametru text v požadavku rozhraní MODELS_CREATE API 200 kB 500 kB

Kvóty a omezení převodu textu na řeč na prostředek

Tato část popisuje kvóty a omezení převodu textu na řeč na prostředek služby Speech. Pokud není uvedeno jinak, omezení se nedají upravit.

Běžné kvóty a omezení převodu textu na řeč

Kvóta Volný (F0) Standard (S0)
Maximální počet transakcí za časové období pro předem vytvořené neurální hlasy a vlastní neurální hlasy. 20 transakcí za 60 sekund

Tento limit není možné upravit.
200 transakcí za sekundu (TPS) (výchozí hodnota)

Rychlost je nastavitelná až na 1 000 TPS pro prostředky Standard (S0). Projděte si další vysvětlení, osvědčené postupy a pokyny k úpravám.
Maximální délka produkovaného zvuku na požadavek 10 min. 10 min.
Maximální celkový počet jedinečných značek <voice> a <audio> značek v SSML 50 50
Maximální velikost zpráv SSML na otočení pro websocket 64 kB 64 kB

Vlastní neurální hlas

Kvóta Volný (F0) Standard (S0)
Maximální počet transakcí za sekundu (TPS) Není k dispozici pro F0 200 transakcí za sekundu (TPS) (výchozí hodnota)
Maximální počet datových sad 500
Maximální počet souběžných nahrávání datových sad Není k dispozici 5
Maximální velikost datového souboru pro import dat na datovou sadu 2 GB
Nahrávání dlouhých zvuků nebo zvuků bez skriptu Není k dispozici Ano
Maximální počet souběžných trénování modelu 3
Maximální počet vlastních koncových bodů 50

Nástroj pro vytváření zvukového obsahu

Kvóta Volný (F0) Standard (S0)
Velikost souboru 3 000 znaků na soubor 20 000 znaků na soubor
Exportovat do zvukové knihovny 1 souběžný úkol

Kvóty a omezení rozpoznávání mluvčího na prostředek

Rozpoznávání mluvčího je omezeno na 20 transakcí za sekundu (TPS).

Podrobný popis, úprava kvóty a osvědčené postupy

Některé kvóty služby Speech se dají upravit. Tato část obsahuje další vysvětlení, osvědčené postupy a pokyny k úpravám.

Pro prostředky standardu (S0) se dají upravit následující kvóty. Limity požadavků Free (F0) se nedají upravit.

Než požádáte o navýšení kvóty (pokud je to možné), ujistěte se, že je to nezbytné. Služba Speech používá technologie automatického škálování k uvedení požadovaných výpočetních prostředků do režimu na vyžádání. Služba Speech se zároveň snaží udržet nízké náklady tím, že neudržuje nadměrnou hardwarovou kapacitu.

Podívejme se na příklad. Předpokládejme, že vaše aplikace obdrží kód odpovědi 429, který značí, že existuje příliš mnoho požadavků. Aplikace obdrží tuto odpověď, i když vaše úloha spadá do limitů definovaných odkazem Na kvóty a limity. Nejpravděpodobnějším vysvětlením je, že služba Speech se vertikálně navyšuje na vaši poptávku a ještě nedosáhla požadovaného škálování. Služba proto nemá okamžitě dostatek prostředků, aby žádost obsloužila. Ve většině případů je tento omezený stav přechodný.

Obecné osvědčené postupy pro zmírnění omezování během automatického škálování

Pokud chcete minimalizovat problémy související s omezováním, je vhodné použít následující techniky:

  • Implementujte do své aplikace logiku opakování pokusů.
  • Pokuste se předcházet prudkým výkyvům zatížení. Zvyšujte zatížení postupně. Řekněme například, že vaše aplikace používá převod textu na řeč a vaše aktuální úloha je 5 TPS. V další sekundě zvýšíte zatížení na 20 TPS (tedy čtyřikrát více). Služba Speech okamžitě zahájí vertikální navýšení kapacity, aby splnila nové zatížení, ale během jedné sekundy nemůže škálovat podle potřeby. Některé požadavky dostanou kód odpovědi 429 (příliš mnoho požadavků).
  • Otestujte různé vzorce zvýšení zatížení. Další informace najdete v příkladu vzoru úloh.
  • Vytvořte další prostředky služby Speech v různých oblastech a rozdělte mezi ně úlohy. (Vytvoření více prostředků služby Speech ve stejné oblasti neovlivní výkon, protože všechny prostředky budou obsluhovány stejným back-endovým clusterem).

Další části popisují konkrétní případy úpravy kvót.

Převod řeči na text: Zvýšení limitu souběžných požadavků online přepisu

Ve výchozím nastavení je počet souběžných online žádostí o přepis převodu řeči na text a žádostí o překlad řeči omezený na 100 na prostředek v základním modelu a 100 na vlastní koncový bod ve vlastním modelu. Pro cenovou úroveň Standard můžete tuto částku navýšit. Před odesláním žádosti se ujistěte, že jste obeznámeni s materiálem probíraným dříve v tomto článku, například s osvědčenými postupy pro zmírnění omezování.

Poznámka

Limity souběžných požadavků pro základní a vlastní modely je potřeba upravit samostatně. Můžete mít prostředek služby Speech, který je přidružený k mnoha vlastním koncovým bodům, které hostují mnoho nasazení vlastních modelů. V případě potřeby je potřeba vyžádat úpravy limitu pro každý vlastní koncový bod samostatně.

Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Speech používá platební model, který vyžaduje, abyste platili jenom za to, co používáte. Limit definuje, jak vysoká může služba škálovat, než začne omezovat vaše požadavky.

V Azure Portal, nástrojích příkazového řádku nebo požadavcích rozhraní API se nezobrazuje existující hodnota parametru limitu souběžných požadavků. Pokud chcete ověřit existující hodnotu, vytvořte požadavek podpora Azure.

Poznámka

Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na který jsou hostované. Kontejnery služby Speech ale mají svá vlastní omezení kapacity, která je potřeba vzít v úvahu. Další informace najdete v nejčastějších dotazech ke kontejnerům speech.

Připravte si požadované informace.

  • Základní model:
    • ID prostředku služby Speech
    • Oblast
  • Pro vlastní model:
    • Oblast
    • ID vlastního koncového bodu

Jak získat informace pro základní model:

  1. Přejděte na Azure Portal.
  2. Vyberte prostředek služby Speech, pro který chcete zvýšit limit požadavků na souběžnost.
  3. Ve skupině Správa prostředků vyberte Vlastnosti.
  4. Zkopírujte a uložte hodnoty následujících polí:
    • ID prostředku
    • Umístění (oblast vašeho koncového bodu)

Jak získat informace o vlastním modelu:

  1. Přejděte na portál Speech Studio .
  2. V případě potřeby se přihlaste a přejděte na Custom Speech.
  3. Vyberte projekt a přejděte na Nasazení.
  4. Vyberte požadovaný koncový bod.
  5. Zkopírujte a uložte hodnoty následujících polí:
    • Oblast služby (oblast vašeho koncového bodu)
    • ID koncového bodu

Vytvoření a odeslání žádosti o podporu

Zahajte zvýšení limitu souběžných požadavků na váš prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Jak na to:

  1. Ujistěte se, že máte požadované informace uvedené v předchozí části.
  2. Přejděte na Azure Portal.
  3. Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit požadavků souběžnosti.
  4. Ve skupině Podpora a řešení potíží vyberte Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
  5. V části Souhrn popište, co chcete (například "Zvýšení limitu souběžnosti převodu řeči na text").
  6. V části Typ problému vyberte Problémy s kvótou nebo předplatným.
  7. V podtypu problému vyberte jednu z těchto možností:
    • Navýšení kvóty nebo souběžných požadavků pro žádost o navýšení
    • Ověření kvóty nebo využití ke kontrole existujícího limitu
  8. Vyberte Další: Řešení. Pokračujte ve vytváření žádosti.
  9. Na kartě Podrobnosti zadejte do pole Popis následující:
    • Všimněte si, že požadavek se týká kvóty převodu řeči na text.
    • Zvolte základní nebo vlastní model.
    • Informace o prostředcích Azure, které jste shromáždili dříve.
    • Všechny další požadované informace.
  10. Na kartě Zkontrolovat a vytvořit vyberte Vytvořit.
  11. Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy vás budeme kontaktovat ohledně vaší žádosti.

Příklad osvědčeného postupu vzorů úloh

Tady je obecný příklad vhodného přístupu. Je míněna pouze jako šablona, kterou můžete upravit podle potřeby pro vlastní použití.

Předpokládejme, že prostředek služby Speech má limit souběžných požadavků nastavený na 300. Spusťte úlohu z 20 souběžných připojení a každých 90 až 120 sekund zvyšte zatížení o 20 souběžných připojení. Řiďte odpovědi služby a implementujte logiku, která se vrátí zpět (sníží zatížení), pokud dostanete příliš mnoho požadavků (kód odpovědi 429). Pak zkuste zvýšení zatížení zopakovat za jednu minutu, a pokud to stále nefunguje, zkuste to znovu za dvě minuty. Pro intervaly použijte vzor 1-2-4-4-4 minuty.

Obecně je velmi dobré otestovat úlohu a vzory úloh před přechodem do produkčního prostředí.

Převod textu na řeč: Zvýšení limitu souběžných požadavků

Pro cenovou úroveň Standard můžete tuto částku zvýšit. Před odesláním žádosti se ujistěte, že jste obeznámeni s materiály probíranými dříve v tomto článku, například s osvědčenými postupy pro zmírnění omezování.

Zvýšení limitu souběžných požadavků nemá přímý vliv na vaše náklady. Služba Speech používá platební model, který vyžaduje, abyste platili jenom za to, co používáte. Tento limit definuje, do jaké míry se služba může škálovat, než začne omezovat vaše požadavky.

V Azure Portal, v nástrojích příkazového řádku ani v požadavcích rozhraní API se nezobrazuje existující hodnota parametru limitu souběžných požadavků. Pokud chcete ověřit existující hodnotu, vytvořte požadavek na podpora Azure.

Poznámka

Kontejnery služby Speech nevyžadují zvýšení limitu souběžných požadavků, protože kontejnery jsou omezené pouze procesory hardwaru, na jakém jsou hostované.

Příprava požadovaných informací

Pokud chcete vytvořit žádost o navýšení, musíte zadat své údaje.

  • Pro předem připravený hlas:
    • ID prostředku služby Speech
    • Oblast
  • Vlastní hlas:
    • Oblast nasazení
    • ID vlastního koncového bodu

Jak získat informace o předem připraveném hlasu:

  1. Přejděte na Azure Portal.
  2. Vyberte prostředek služby Speech, pro který chcete zvýšit limit žádostí o souběžnost.
  3. Ve skupině Správa prostředků vyberte Vlastnosti.
  4. Zkopírujte a uložte hodnoty následujících polí:
    • ID prostředku
    • Umístění (oblast vašeho koncového bodu)

Jak získat informace pro vlastní hlas:

  1. Přejděte na portál Speech Studio .
  2. V případě potřeby se přihlaste a přejděte do části Vlastní hlas.
  3. Vyberte projekt a přejděte na Nasadit model.
  4. Vyberte požadovaný koncový bod.
  5. Zkopírujte a uložte hodnoty následujících polí:
    • Oblast služby (oblast vašeho koncového bodu)
    • ID koncového bodu

Vytvoření a odeslání žádosti o podporu

Zahajte zvýšení limitu souběžných požadavků na váš prostředek nebo v případě potřeby zkontrolujte aktuální limit odesláním žádosti o podporu. Jak na to:

  1. Ujistěte se, že máte požadované informace uvedené v předchozí části.
  2. Přejděte na Azure Portal.
  3. Vyberte prostředek služby Speech, pro který chcete zvýšit (nebo zkontrolovat) limit požadavků souběžnosti.
  4. Ve skupině Podpora a řešení potíží vyberte Nová žádost o podporu. Zobrazí se nové okno s automaticky vyplněnými informacemi o vašem předplatném Azure a prostředku Azure.
  5. V části Souhrn popište, co chcete (například Zvýšit limit souběžnosti požadavků na převod textu na řeč).
  6. V části Typ problému vyberte Problémy s kvótou nebo předplatným.
  7. V podtypu problému vyberte jednu z těchto možností:
    • Navýšení kvóty nebo souběžných požadavků pro žádost o navýšení
    • Ověření kvóty nebo využití ke kontrole existujícího limitu
  8. Na kartě Doporučené řešení vyberte Další.
  9. Na kartě Další podrobnosti vyplňte všechny požadované položky. A do pole Podrobnosti zadejte následující:
    • Všimněte si, že požadavek se týká kvóty pro převod textu na řeč.
    • Zvolte buď předem vytvořený hlas, nebo vlastní hlas.
    • Informace o prostředcích Azure, které jste shromáždili dříve.
    • Všechny další požadované informace.
  10. Na kartě Zkontrolovat a vytvořit vyberte Vytvořit.
  11. Poznamenejte si číslo žádosti o podporu uvedené v oznámeních na webu Azure Portal. Brzy vás budeme kontaktovat ohledně vaší žádosti.