Beszédszolgáltatás kvótái és korlátai

Cikk
09/27/2024

Ez a cikk rövid áttekintést és részletes leírást tartalmaz az Azure AI-szolgáltatások Speech szolgáltatásának kvótáiról és korlátairól. Az információk a szolgáltatás összes tarifacsomagjára vonatkoznak . Emellett ajánlott eljárásokat is tartalmaz a kérések szabályozásának elkerüléséhez.

Az ingyenes (F0) tarifacsomagért tekintse meg a havi kibocsátási egységeket is a díjszabási oldalon.

Kvóták és korlátok referenciája

Az alábbi szakaszokban rövid útmutatót találhat a Speech szolgáltatásra vonatkozó kvótákról és korlátokról.

A Standard (S0) Speech-erőforrások állítható kvótáiról további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. Az ingyenes (F0) speech-erőforrások kvótái és korlátai nem állíthatók be.

Fontos

Ha a Speech-erőforrást ingyenes (F0) tarifacsomagról Standard (S0) tarifacsomagra váltja, a megfelelő kvóták módosítása akár több órát is igénybe vehet.

Beszédszöveg kvótái és erőforrásonkénti korlátok

Ez a szakasz a beszéd-szöveg kvótákat és a Beszéd erőforrásonkénti korlátokat ismerteti. Ha másként nincs megadva, a korlátok nem állíthatók be.

Valós idejű szöveg- és beszédfordítás

A speech SDK-val és a Speech to text REST API-val valós idejű beszédet is használhat a rövid hangoláshoz.

Fontos

Ezek a korlátozások a szöveges kérelmek és a beszédfordítási kérelmek egyidejű, valós idejű beszédére vonatkoznak. Ha például 60 egyidejű beszédszöveg-kéréssel és 40 egyidejű beszédfordítási kéréssel rendelkezik, akkor eléri a 100 egyidejű kérés korlátját.

Kvóta	Ingyenes (F0)	Standard (S0)
Egyidejű kérelemkorlát – alapmodell végpontja	1 Ez a korlát nem állítható be.	100 (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.
Egyidejű kérelemkorlát – egyéni végpont	1 Ez a korlát nem állítható be.	100 (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.
Maximális hanghossz valós idejű diarizáláshoz.	n/a	Fájlonként 240 perc

Gyors átírás

Kvóta	Ingyenes (F0)	Standard (S0)
Hangbemeneti fájl maximális mérete	n/a	200 MB
Maximális hanghossz	n/a	Fájlonként 120 perc
Kérések maximális száma percenként	n/a	300

Kötegelt átírás

Kvóta	Ingyenes (F0)	Standard (S0)
Beszédfelolvasás – REST API-korlát	Nem érhető el az F0	100 kérés 10 másodpercenként (percenként 600 kérés)
Hangbemeneti fájl maximális mérete	n/a	1 GB
Tárolónkénti blobok maximális száma	n/a	10000
Fájlok maximális száma átírási kérelemenként (ha több tartalom URL-címét használja bemenetként).	n/a	1000
Az átiratok maximális hanghossza engedélyezett diarizálással.	n/a	Fájlonként 240 perc

Modell testreszabása

Az egyéni beszédmodellek létrehozásakor a táblázat korlátai beszéderőforrásonként érvényesek.

Kvóta	Ingyenes (F0)	Standard (S0)
REST API-korlát	100 kérés 10 másodpercenként (percenként 600 kérés)	100 kérés 10 másodpercenként (percenként 600 kérés)
Beszédadatkészletek maximális száma	2	500
Az akusztikai adatkészlet fájlméretének maximális mérete adatimportáláshoz	2 GB	2 GB
A nyelvi adatkészlet fájlméretének maximális mérete adatimportáláshoz	200 MB	1,5 GB
A kiejtési adatkészlet fájlméretének maximális mérete adatimportáláshoz	1 KB	1 MB
Maximális szövegméret a `text` paraméter Models_Create API-kérelemben való használatakor	200 KB	500 kB

Szövegfelolvasási kvóták és erőforrásonkénti korlátok

Ez a szakasz a beszédkvótákat és a Beszéd erőforrásonkénti korlátokat ismerteti.

Valós idejű szövegfelolvasás

A Speech SDK-val vagy a Text to speech REST API-val valós idejű szöveget is használhat beszédre. Ha másként nincs megadva, a korlátok nem állíthatók be.

Kvóta	Ingyenes (F0)	Standard (S0)
Az előre összeállított neurális hangok és egyéni neurális hangok tranzakcióinak maximális száma időszakonként.	20 tranzakció 60 másodpercenként Ez a korlát nem állítható be.	200 tranzakció másodpercenként (TPS) (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén legfeljebb 1000 TPS-ig állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.
Kérelemenként előállított hanghossz maximális száma	10 perc	10 perc
A különböző elemek `<voice>` és `<audio>` címkék maximális száma az SSML-ben	50	50
SSML-üzenetek maximális mérete per turn for websocket esetén	64 KB	64 KB

Batch-szintézis

Ezek a korlátok nem állíthatók be. A kötegszintézis késésével kapcsolatos további információkért tekintse meg a kötegszintézis késését és az ajánlott eljárásokat.

Kvóta	Ingyenes (F0)	Standard (S0)
REST API-korlát	Nem érhető el az F0	100 kérelem 10 másodpercenként
A JSON hasznos adatmennyiségének maximális mérete szintézisi feladat létrehozásához	n/a	2 megabájt
Egyidejű aktív szintézisi feladatok	n/a	Korlátlan
Szövegbevitelek maximális száma szintézisi feladatonként	n/a	10000
A szintézisfeladatok élettartamának maximális időtartama, mivel a végső állapotban van	n/a	Legfeljebb 31 nap (tulajdonságok használatával megadva)

Egyéni neurális hang – professzionális

A táblázat korlátai beszéderőforrásonként érvényesek egy professzionális egyéni neurális hangmodell létrehozásakor.

Kvóta	Ingyenes (F0)	Standard (S0)
Tranzakciók maximális száma másodpercenként (TPS)	Nem érhető el az F0	200 tranzakció másodpercenként (TPS) (alapértelmezett érték)
Adathalmazok maximális száma	n/a	500
Egyidejű adathalmaz-feltöltések maximális száma	n/a	5
Adatfájl maximális mérete adathalmazonkénti adatimportáláshoz	n/a	2 GB
Hosszú hang vagy hang feltöltése szkript nélkül	N.A.	Igen
Egyidejű modellbetanítások maximális száma	n/a	4
Egyéni végpontok maximális száma	n/a	50

Egyéni neurális hang – személyes hang

A táblázat korlátai beszéderőforrásonként érvényesek a személyes hang létrehozásakor.

Kvóta	Ingyenes (F0)	Standard (S0)
REST API-korlát (a beszédszintézist nem beleértve)	Nem érhető el az F0	50 kérelem 10 másodpercenként
Másodpercenkénti tranzakciók maximális száma (TPS) a beszédszintézishez	Nem érhető el az F0	200 tranzakció másodpercenként (TPS) (alapértelmezett érték)

Batch text to speech avatar

Kvóta	Ingyenes (F0)	Standard (S0)
REST API-korlát	Nem érhető el az F0	2 kérés 1 percenként

Valós idejű szöveg–beszéd avatár

Kvóta	Ingyenes (F0)	Standard (S0)
Új kapcsolatok percenként	Nem érhető el az F0	2 új kapcsolat percenként
A kapcsolat maximális időtartama beszéddel	Nem érhető el az F0	10 perc¹
Maximális kapcsolati időtartam tétlen állapottal	Nem érhető el az F0	5 perc

¹ A valós idejű avatar több mint 10 perces folyamatos működésének biztosításához engedélyezheti az automatikus újracsatlakozásokat. Az automatikus újracsatlakozás beállításával kapcsolatos információkért tekintse meg ezt a mintakódot (az "automatikus újracsatlakozás" kifejezésben).

Hangtartalom-létrehozási eszköz

Kvóta	Ingyenes (F0)	Standard (S0)
Fájlméret (egyszerű szöveg az SSML-ben)¹	Fájlonként 3000 karakter	Fájlonként 20 000 karakter
Fájlméret (lexikonfájl)²	Fájlonként 30 KB	Fájlonként 100 KB
Számlázható karakterek az SSML-ben	Fájlonként 15 000 karakter	Fájlonként 100 000 karakter
Exportálás hangtárba	1 egyidejű tevékenység	n/a

¹ A korlát csak az SSML egyszerű szövegére vonatkozik, és nem tartalmaz címkéket.

² A lexikonfájl karaktereit a rendszer nem számítja fel. Az SSML-ben csak a lexikonelemek számítanak számlázható karakternek. További információért tekintse meg a számlázható karaktereket .

Hangszóró-felismerési kvóták és erőforrásonkénti korlátok

A beszélőfelismerés másodpercenként 20 tranzakcióra (TPS) korlátozódik.

Részletes leírás, kvótamódosítás és ajánlott eljárások

A Speech szolgáltatás egyes kvótái módosíthatók. Ez a szakasz további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat tartalmaz.

A standard (S0) erőforrásokhoz az alábbi kvóták állíthatók be. Az ingyenes (F0) kérelemkorlátok nem állíthatók be.

Beszéd–szöveg egyidejű kérelemkorlát az alapmodell végpontja és az egyéni végpont esetében
Szövegről beszédre az előre összeállított neurális hangok és egyéni neurális hangok tranzakcióinak maximális száma időszakonként
Beszédfordítás egyidejű kéréskorlátja

Kvótanövelés kérése előtt (ahol van) ellenőrizze az aktuális TPS-t (másodpercenkénti tranzakciókat), és győződjön meg arról, hogy szükséges a kvóta növelése. A Speech Service automatikus skálázási technológiákat használ a szükséges számítási erőforrások igény szerinti módban való eléréséhez. A Speech service ugyanakkor úgy próbálja alacsonyan tartani a költségeket, hogy nem tart fenn túlzott mennyiségű hardverkapacitást.

Lássunk egy példát. Tegyük fel, hogy az alkalmazás a 429-ben kapott válaszkódot kapja, ami azt jelzi, hogy túl sok kérés van. Az alkalmazás akkor is megkapja ezt a választ, ha a számítási feladat a Kvóták és korlátok hivatkozás által meghatározott korlátokon belül van. A legvalószínűbb magyarázat az, hogy a Speech szolgáltatás az igényeinek megfelelően skálázódik, és még nem érte el a szükséges méretet. Ezért a szolgáltatás nem rendelkezik azonnal elegendő erőforrással a kérés kiszolgálásához. Ilyen esetekben a kvóta növelése nem segít. A legtöbb esetben a Speech szolgáltatás hamarosan felskálázható, és a 429-et okozó válaszkódot okozó probléma megoldódott.

Általános ajánlott eljárások az automatikus skálázás során történő szabályozás csökkentéséhez

A szabályozással kapcsolatos problémák minimalizálása érdekében érdemes az alábbi technikákat használni:

Implementáljon újrapróbálkozási logikát az alkalmazásba.
Kerülje a hirtelen terhelésváltásokat. Fokozatosan növelje a munkaterhelést. Tegyük fel például, hogy az alkalmazás szövegfelolvasást használ, az aktuális számítási feladat pedig 5 TPS. A következő másodpercben 20 TPS-re növeli a terhelést (vagyis négyszer többet). A Speech Service azonnal megkezdi a vertikális felskálázást az új terhelés teljesítéséhez, de egy másodpercen belül nem tud szükség szerint méretezni. Egyes kérések 429-ben kapják meg a válaszkódot (túl sok kérés).
Teszteljen különböző terhelésnövelési mintákat. További információkért lásd a számítási feladat mintáját.
Hozzon létre több Speech service-erőforrást a különböző régiókban, és ossza el közöttük a számítási feladatot. (Ha több Speech service-erőforrást hoz létre ugyanabban a régióban, az nem befolyásolja a teljesítményt, mert minden erőforrást ugyanaz a háttérfürt szolgál ki).

A következő szakaszok a kvóták kiigazításának konkrét eseteit ismertetik.

Beszéd szöveggé: a szöveg egyidejű kérési korlátjának növelése valós idejű beszédre

Alapértelmezés szerint az egyidejű, valós idejű szöveg- és beszédfordítási kérelmek száma az alapmodellben erőforrásonként legfeljebb 100, az egyéni modellben pedig egyéni végpontonként 100 lehet. A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikkben korábban tárgyalt anyagokat, például a szabályozás csökkentésére szolgáló ajánlott eljárásokat.

Feljegyzés

Az alap- és egyéni modellek egyidejű kéréskorlátait külön kell módosítani. Rendelkezhet olyan Speech service-erőforrással, amely számos egyéni végponthoz van társítva, amelyek számos egyéni modell üzembe helyezését üzemeltetik. Szükség esetén az egyéni végpontonkénti korlátmódosításokat külön kell kérni.

Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech szolgáltatás olyan fizetési modellt használ, amely megköveteli, hogy csak azért kell fizetnie, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magas skálázható, mielőtt elkezdené szabályozni a kéréseket.

Az egyidejű kérelemkorlát paraméter meglévő értékét nem láthatja az Azure Portalon, a parancssori eszközökben vagy az API-kérelmekben. A meglévő érték ellenőrzéséhez hozzon létre egy Azure-támogatás kérést.

Feljegyzés

A beszédtárolók esetében nincs szükség az egyidejű kérelemkorlát növelésére, mert a tárolókat csak az általuk üzemeltetett hardver processzorai korlátozzák. A beszédtárolók azonban rendelkeznek saját kapacitáskorlátozásokkal, amelyeket figyelembe kell venni. További információkért tekintse meg a Speech-tárolókkal kapcsolatos gyakori kérdéseket.

Készítse elő a szükséges információkat

Az alapmodell esetében:
- Beszéderőforrás azonosítója
- Régió
Az egyéni modell esetében:
- Régió
- Egyéni végpontazonosító

Az alapmodell adatainak lekérése:

Nyissa meg az Azure Portalt.
Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
Másolja és mentse az alábbi mezők értékeit:
- Erőforrás-azonosító
- Hely (a végpont régiója)

Az egyéni modell adatainak lekérése:

Lépjen a Speech Studio portálra.
Ha szükséges, jelentkezzen be, és lépjen a Custom speech (Egyéni beszéd) elemre.
Válassza ki a projektet, és lépjen az Üzembe helyezés elemre.
Válassza ki a szükséges végpontot.
Másolja és mentse az alábbi mezők értékeit:
- Szolgáltatásrégió (a végpont régiója)
- Végpont azonosítója

Támogatási kérelem létrehozása és elküldése

Támogatási kérés elküldésével kezdeményezheti az erőforrás egyidejű kéréseinek korlátjának növelését, vagy szükség esetén ellenőrizze az aktuális korlátot. Ennek módja az alábbi:

Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
Nyissa meg az Azure Portalt.
Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni) az egyidejűségi kérelmek korlátját.
A Támogatási és hibaelhárítási csoportban válassza az Új támogatási kérés lehetőséget. Megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
Összefoglalva írja le a kívánt elemet (például :"A szöveg egyidejűségének igénylési korlátjának növelése").
A Probléma típusa területen válassza a Kvóta vagy az Előfizetés problémái lehetőséget.
A Probléma altípusban válassza a következő lehetőségeket:
- A kvóta vagy az egyidejű kérések száma nő a növekvő kérések esetében.
- Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
Válassza a Tovább: Megoldások lehetőséget. Folytassa a kérés létrehozását.
A Részletek lap Leírás mezőjében adja meg a következőket:
- Megjegyzés, hogy a kérés a beszéd szövegkvótájáról szól.
- Válassza ki az alap- vagy egyéni modellt.
- A korábban gyűjtött Azure-erőforrásadatok.
- Minden egyéb szükséges információ.
A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.

Példa számítási feladatok mintájára – ajánlott eljárás

Íme egy általános példa a helyes megközelítésre. Ez csak olyan sablonként készült, amelyet szükség szerint módosíthatja a saját használatához.

Tegyük fel, hogy egy Speech-szolgáltatás erőforrásának egyidejű kéréskorlátja 300. Indítsa el a számítási feladatot 20 egyidejű kapcsolatból, és 90–120 másodpercenként 20 egyidejű kapcsolattal növelje a terhelést. Szabályozhatja a szolgáltatás válaszait, és implementálhatja a visszaeső logikát (csökkenti a terhelést), ha túl sok kérést kap (válaszkód: 429). Ezután próbálja meg újra növelni a terhelést egy perc alatt, és ha még mindig nem működik, próbálkozzon újra két perc múlva. Az intervallumokhoz 1-2-4-4 perces mintát használjon.

Általában érdemes tesztelni a számítási feladatokat és a számítási feladat mintáit, mielőtt éles környezetben jár.

Szövegfelolvasás: egyidejű kérelemkorlát növelése

A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikkben korábban tárgyalt anyagokat, például a szabályozás csökkentésére szolgáló ajánlott eljárásokat.

Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech Service olyan fizetési modellt használ, amely megköveteli, hogy csak azért kell fizetnie, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magas skálázható, mielőtt elkezdené szabályozni a kéréseket.

Feljegyzés

A beszédtárolók esetében nincs szükség az egyidejű kérelemkorlát növelésére, mert a tárolókat csak az általuk üzemeltetett hardver processzorai korlátozzák.

A szükséges információk előkészítése

Ha növelni szeretné a kérelmet, meg kell adnia az adatait.

Az előre összeállított hang esetében:
- Beszéderőforrás azonosítója
- Régió
Az egyéni hang esetében:
- Üzembehelyezési régió
- Egyéni végpontazonosító

Az előre összeállított hang információinak lekérése:

Nyissa meg az Azure Portalt.
Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
Másolja és mentse az alábbi mezők értékeit:
- Erőforrás-azonosító
- Hely (a végpont régiója)

Az egyéni hang információinak lekérése:

Lépjen a Speech Studio portálra.
Ha szükséges, jelentkezzen be, és lépjen az Egyéni hangra.
Válassza ki a projektet, és lépjen az Üzembe helyezési modellre.
Válassza ki a szükséges végpontot.
Másolja és mentse az alábbi mezők értékeit:
- Szolgáltatásrégió (a végpont régiója)
- Végpont azonosítója

Támogatási kérelem létrehozása és elküldése

Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
Nyissa meg az Azure Portalt.
Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni) az egyidejűségi kérelmek korlátját.
A Támogatási és hibaelhárítási csoportban válassza az Új támogatási kérés lehetőséget. Megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
Összefoglalva írja le, hogy mit szeretne (például :"Szöveg növelése beszéd egyidejűségi kérelemkorlátra").
A Probléma típusa területen válassza a Kvóta vagy az Előfizetés problémái lehetőséget.
A Probléma altípusban válassza a következő lehetőségeket:
- A kvóta vagy az egyidejű kérések száma nő a növekvő kérések esetében.
- Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
Az Ajánlott megoldás lapon válassza a Tovább gombot.
A További részletek lapon töltse ki az összes szükséges elemet. A Részletek mezőbe írja be a következőket:
- Megjegyzés, hogy a kérés a beszédkvótához írt szövegről szól.
- Válassza ki az előre összeállított vagy az egyéni hangot.
- A korábban gyűjtött Azure-erőforrásadatok.
- Minden egyéb szükséges információ.
A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.

Szöveg–beszéd avatar: az új kapcsolatok korlátjának növelése

A szöveg és a beszéd avatarja közötti új kapcsolatok percenkénti korlátjának növeléséhez forduljon az értékesítési képviselőhöz, hogy hozzon létre egy jegyet az alábbi információkkal:

Beszéderőforrás URI-ja
Új korlátozást kért a
A növekedés indoklása
A növekedés kezdő dátuma
A növekedés befejezési dátuma
Előre összeállított avatar vagy egyéni avatar

Megosztás a következőn keresztül:

Beszédszolgáltatás kvótái és korlátai

Kvóták és korlátok referenciája

Beszédszöveg kvótái és erőforrásonkénti korlátok

Valós idejű szöveg- és beszédfordítás

Gyors átírás

Kötegelt átírás

Modell testreszabása

Szövegfelolvasási kvóták és erőforrásonkénti korlátok

Valós idejű szövegfelolvasás

Batch-szintézis

Egyéni neurális hang – professzionális

Egyéni neurális hang – személyes hang

Batch text to speech avatar

Valós idejű szöveg–beszéd avatár

Hangtartalom-létrehozási eszköz

Hangszóró-felismerési kvóták és erőforrásonkénti korlátok

Részletes leírás, kvótamódosítás és ajánlott eljárások

Általános ajánlott eljárások az automatikus skálázás során történő szabályozás csökkentéséhez

Beszéd szöveggé: a szöveg egyidejű kérési korlátjának növelése valós idejű beszédre

Készítse elő a szükséges információkat

Támogatási kérelem létrehozása és elküldése

Példa számítási feladatok mintájára – ajánlott eljárás

Szövegfelolvasás: egyidejű kérelemkorlát növelése

A szükséges információk előkészítése

Támogatási kérelem létrehozása és elküldése

Szöveg–beszéd avatar: az új kapcsolatok korlátjának növelése

Visszajelzés

További források