Beszédszolgáltatás kvótái és korlátai
Ez a cikk rövid áttekintést és részletes leírást tartalmaz az Azure AI-szolgáltatások Speech szolgáltatásának kvótáiról és korlátairól. Az információk a szolgáltatás összes tarifacsomagjára vonatkoznak . Emellett ajánlott eljárásokat is tartalmaz a kérések szabályozásának elkerüléséhez.
Az ingyenes (F0) tarifacsomagért tekintse meg a havi kibocsátási egységeket is a díjszabási oldalon.
Kvóták és korlátok referenciája
Az alábbi szakaszokban rövid útmutatót találhat a Speech szolgáltatásra vonatkozó kvótákról és korlátokról.
A Standard (S0) Speech-erőforrások állítható kvótáiról további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. Az ingyenes (F0) speech-erőforrások kvótái és korlátai nem állíthatók be.
Fontos
Ha a Speech-erőforrást ingyenes (F0) tarifacsomagról Standard (S0) tarifacsomagra váltja, a megfelelő kvóták módosítása akár több órát is igénybe vehet.
Beszédszöveg kvótái és erőforrásonkénti korlátok
Ez a szakasz a beszéd-szöveg kvótákat és a Beszéd erőforrásonkénti korlátokat ismerteti. Ha másként nincs megadva, a korlátok nem állíthatók be.
Valós idejű szöveg- és beszédfordítás
A speech SDK-val és a Speech to text REST API-val valós idejű beszédet is használhat a rövid hangoláshoz.
Fontos
Ezek a korlátozások a szöveges kérelmek és a beszédfordítási kérelmek egyidejű, valós idejű beszédére vonatkoznak. Ha például 60 egyidejű beszédszöveg-kéréssel és 40 egyidejű beszédfordítási kéréssel rendelkezik, akkor eléri a 100 egyidejű kérés korlátját.
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Egyidejű kérelemkorlát – alapmodell végpontja | 1 Ez a korlát nem állítható be. |
100 (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. |
Egyidejű kérelemkorlát – egyéni végpont | 1 Ez a korlát nem állítható be. |
100 (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. |
Maximális hanghossz valós idejű diarizáláshoz. | n/a | Fájlonként 240 perc |
Gyors átírás
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Hangbemeneti fájl maximális mérete | n/a | 200 MB |
Maximális hanghossz | n/a | Fájlonként 120 perc |
Kérések maximális száma percenként | n/a | 300 |
Kötegelt átírás
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Beszédfelolvasás – REST API-korlát | Nem érhető el az F0 | 100 kérés 10 másodpercenként (percenként 600 kérés) |
Hangbemeneti fájl maximális mérete | n/a | 1 GB |
Tárolónkénti blobok maximális száma | n/a | 10000 |
Fájlok maximális száma átírási kérelemenként (ha több tartalom URL-címét használja bemenetként). | n/a | 1000 |
Az átiratok maximális hanghossza engedélyezett diarizálással. | n/a | Fájlonként 240 perc |
Modell testreszabása
Az egyéni beszédmodellek létrehozásakor a táblázat korlátai beszéderőforrásonként érvényesek.
Szövegfelolvasási kvóták és erőforrásonkénti korlátok
Ez a szakasz a beszédkvótákat és a Beszéd erőforrásonkénti korlátokat ismerteti.
Valós idejű szövegfelolvasás
A Speech SDK-val vagy a Text to speech REST API-val valós idejű szöveget is használhat beszédre. Ha másként nincs megadva, a korlátok nem állíthatók be.
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Az előre összeállított neurális hangok és egyéni neurális hangok tranzakcióinak maximális száma időszakonként. | 20 tranzakció 60 másodpercenként Ez a korlát nem állítható be. |
200 tranzakció másodpercenként (TPS) (alapértelmezett érték) A sebesség standard (S0) erőforrások esetén legfeljebb 1000 TPS-ig állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. |
Kérelemenként előállított hanghossz maximális száma | 10 perc | 10 perc |
A különböző elemek <voice> és <audio> címkék maximális száma az SSML-ben |
50 | 50 |
SSML-üzenetek maximális mérete per turn for websocket esetén | 64 KB | 64 KB |
Batch-szintézis
Ezek a korlátok nem állíthatók be. A kötegszintézis késésével kapcsolatos további információkért tekintse meg a kötegszintézis késését és az ajánlott eljárásokat.
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
REST API-korlát | Nem érhető el az F0 | 100 kérelem 10 másodpercenként |
A JSON hasznos adatmennyiségének maximális mérete szintézisi feladat létrehozásához | n/a | 2 megabájt |
Egyidejű aktív szintézisi feladatok | n/a | Korlátlan |
Szövegbevitelek maximális száma szintézisi feladatonként | n/a | 10000 |
A szintézisfeladatok élettartamának maximális időtartama, mivel a végső állapotban van | n/a | Legfeljebb 31 nap (tulajdonságok használatával megadva) |
Egyéni neurális hang – professzionális
A táblázat korlátai beszéderőforrásonként érvényesek egy professzionális egyéni neurális hangmodell létrehozásakor.
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Tranzakciók maximális száma másodpercenként (TPS) | Nem érhető el az F0 | 200 tranzakció másodpercenként (TPS) (alapértelmezett érték) |
Adathalmazok maximális száma | n/a | 500 |
Egyidejű adathalmaz-feltöltések maximális száma | n/a | 5 |
Adatfájl maximális mérete adathalmazonkénti adatimportáláshoz | n/a | 2 GB |
Hosszú hang vagy hang feltöltése szkript nélkül | N.A. | Igen |
Egyidejű modellbetanítások maximális száma | n/a | 4 |
Egyéni végpontok maximális száma | n/a | 50 |
Egyéni neurális hang – személyes hang
A táblázat korlátai beszéderőforrásonként érvényesek a személyes hang létrehozásakor.
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
REST API-korlát (a beszédszintézist nem beleértve) | Nem érhető el az F0 | 50 kérelem 10 másodpercenként |
Másodpercenkénti tranzakciók maximális száma (TPS) a beszédszintézishez | Nem érhető el az F0 | 200 tranzakció másodpercenként (TPS) (alapértelmezett érték) |
Batch text to speech avatar
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
REST API-korlát | Nem érhető el az F0 | 2 kérés 1 percenként |
Valós idejű szöveg–beszéd avatár
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Új kapcsolatok percenként | Nem érhető el az F0 | 2 új kapcsolat percenként |
A kapcsolat maximális időtartama beszéddel | Nem érhető el az F0 | 10 perc1 |
Maximális kapcsolati időtartam tétlen állapottal | Nem érhető el az F0 | 5 perc |
1 A valós idejű avatar több mint 10 perces folyamatos működésének biztosításához engedélyezheti az automatikus újracsatlakozásokat. Az automatikus újracsatlakozás beállításával kapcsolatos információkért tekintse meg ezt a mintakódot (az "automatikus újracsatlakozás" kifejezésben).
Hangtartalom-létrehozási eszköz
Kvóta | Ingyenes (F0) | Standard (S0) |
---|---|---|
Fájlméret (egyszerű szöveg az SSML-ben)1 | Fájlonként 3000 karakter | Fájlonként 20 000 karakter |
Fájlméret (lexikonfájl)2 | Fájlonként 30 KB | Fájlonként 100 KB |
Számlázható karakterek az SSML-ben | Fájlonként 15 000 karakter | Fájlonként 100 000 karakter |
Exportálás hangtárba | 1 egyidejű tevékenység | n/a |
1 A korlát csak az SSML egyszerű szövegére vonatkozik, és nem tartalmaz címkéket.
2 A lexikonfájl karaktereit a rendszer nem számítja fel. Az SSML-ben csak a lexikonelemek számítanak számlázható karakternek. További információért tekintse meg a számlázható karaktereket .
Hangszóró-felismerési kvóták és erőforrásonkénti korlátok
A beszélőfelismerés másodpercenként 20 tranzakcióra (TPS) korlátozódik.
Részletes leírás, kvótamódosítás és ajánlott eljárások
A Speech szolgáltatás egyes kvótái módosíthatók. Ez a szakasz további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat tartalmaz.
A standard (S0) erőforrásokhoz az alábbi kvóták állíthatók be. Az ingyenes (F0) kérelemkorlátok nem állíthatók be.
- Beszéd–szöveg egyidejű kérelemkorlát az alapmodell végpontja és az egyéni végpont esetében
- Szövegről beszédre az előre összeállított neurális hangok és egyéni neurális hangok tranzakcióinak maximális száma időszakonként
- Beszédfordítás egyidejű kéréskorlátja
Kvótanövelés kérése előtt (ahol van) ellenőrizze az aktuális TPS-t (másodpercenkénti tranzakciókat), és győződjön meg arról, hogy szükséges a kvóta növelése. A Speech Service automatikus skálázási technológiákat használ a szükséges számítási erőforrások igény szerinti módban való eléréséhez. A Speech service ugyanakkor úgy próbálja alacsonyan tartani a költségeket, hogy nem tart fenn túlzott mennyiségű hardverkapacitást.
Lássunk egy példát. Tegyük fel, hogy az alkalmazás a 429-ben kapott válaszkódot kapja, ami azt jelzi, hogy túl sok kérés van. Az alkalmazás akkor is megkapja ezt a választ, ha a számítási feladat a Kvóták és korlátok hivatkozás által meghatározott korlátokon belül van. A legvalószínűbb magyarázat az, hogy a Speech szolgáltatás az igényeinek megfelelően skálázódik, és még nem érte el a szükséges méretet. Ezért a szolgáltatás nem rendelkezik azonnal elegendő erőforrással a kérés kiszolgálásához. Ilyen esetekben a kvóta növelése nem segít. A legtöbb esetben a Speech szolgáltatás hamarosan felskálázható, és a 429-et okozó válaszkódot okozó probléma megoldódott.
Általános ajánlott eljárások az automatikus skálázás során történő szabályozás csökkentéséhez
A szabályozással kapcsolatos problémák minimalizálása érdekében érdemes az alábbi technikákat használni:
- Implementáljon újrapróbálkozási logikát az alkalmazásba.
- Kerülje a hirtelen terhelésváltásokat. Fokozatosan növelje a munkaterhelést. Tegyük fel például, hogy az alkalmazás szövegfelolvasást használ, az aktuális számítási feladat pedig 5 TPS. A következő másodpercben 20 TPS-re növeli a terhelést (vagyis négyszer többet). A Speech Service azonnal megkezdi a vertikális felskálázást az új terhelés teljesítéséhez, de egy másodpercen belül nem tud szükség szerint méretezni. Egyes kérések 429-ben kapják meg a válaszkódot (túl sok kérés).
- Teszteljen különböző terhelésnövelési mintákat. További információkért lásd a számítási feladat mintáját.
- Hozzon létre több Speech service-erőforrást a különböző régiókban, és ossza el közöttük a számítási feladatot. (Ha több Speech service-erőforrást hoz létre ugyanabban a régióban, az nem befolyásolja a teljesítményt, mert minden erőforrást ugyanaz a háttérfürt szolgál ki).
A következő szakaszok a kvóták kiigazításának konkrét eseteit ismertetik.
Beszéd szöveggé: a szöveg egyidejű kérési korlátjának növelése valós idejű beszédre
Alapértelmezés szerint az egyidejű, valós idejű szöveg- és beszédfordítási kérelmek száma az alapmodellben erőforrásonként legfeljebb 100, az egyéni modellben pedig egyéni végpontonként 100 lehet. A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikkben korábban tárgyalt anyagokat, például a szabályozás csökkentésére szolgáló ajánlott eljárásokat.
Feljegyzés
Az alap- és egyéni modellek egyidejű kéréskorlátait külön kell módosítani. Rendelkezhet olyan Speech service-erőforrással, amely számos egyéni végponthoz van társítva, amelyek számos egyéni modell üzembe helyezését üzemeltetik. Szükség esetén az egyéni végpontonkénti korlátmódosításokat külön kell kérni.
Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech szolgáltatás olyan fizetési modellt használ, amely megköveteli, hogy csak azért kell fizetnie, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magas skálázható, mielőtt elkezdené szabályozni a kéréseket.
Az egyidejű kérelemkorlát paraméter meglévő értékét nem láthatja az Azure Portalon, a parancssori eszközökben vagy az API-kérelmekben. A meglévő érték ellenőrzéséhez hozzon létre egy Azure-támogatás kérést.
Feljegyzés
A beszédtárolók esetében nincs szükség az egyidejű kérelemkorlát növelésére, mert a tárolókat csak az általuk üzemeltetett hardver processzorai korlátozzák. A beszédtárolók azonban rendelkeznek saját kapacitáskorlátozásokkal, amelyeket figyelembe kell venni. További információkért tekintse meg a Speech-tárolókkal kapcsolatos gyakori kérdéseket.
Készítse elő a szükséges információkat
- Az alapmodell esetében:
- Beszéderőforrás azonosítója
- Régió
- Az egyéni modell esetében:
- Régió
- Egyéni végpontazonosító
Az alapmodell adatainak lekérése:
- Nyissa meg az Azure Portalt.
- Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
- Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
- Másolja és mentse az alábbi mezők értékeit:
- Erőforrás-azonosító
- Hely (a végpont régiója)
Az egyéni modell adatainak lekérése:
- Lépjen a Speech Studio portálra.
- Ha szükséges, jelentkezzen be, és lépjen a Custom speech (Egyéni beszéd) elemre.
- Válassza ki a projektet, és lépjen az Üzembe helyezés elemre.
- Válassza ki a szükséges végpontot.
- Másolja és mentse az alábbi mezők értékeit:
- Szolgáltatásrégió (a végpont régiója)
- Végpont azonosítója
Támogatási kérelem létrehozása és elküldése
Támogatási kérés elküldésével kezdeményezheti az erőforrás egyidejű kéréseinek korlátjának növelését, vagy szükség esetén ellenőrizze az aktuális korlátot. Ennek módja az alábbi:
- Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
- Nyissa meg az Azure Portalt.
- Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni) az egyidejűségi kérelmek korlátját.
- A Támogatási és hibaelhárítási csoportban válassza az Új támogatási kérés lehetőséget. Megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
- Összefoglalva írja le a kívánt elemet (például :"A szöveg egyidejűségének igénylési korlátjának növelése").
- A Probléma típusa területen válassza a Kvóta vagy az Előfizetés problémái lehetőséget.
- A Probléma altípusban válassza a következő lehetőségeket:
- A kvóta vagy az egyidejű kérések száma nő a növekvő kérések esetében.
- Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
- Válassza a Tovább: Megoldások lehetőséget. Folytassa a kérés létrehozását.
- A Részletek lap Leírás mezőjében adja meg a következőket:
- Megjegyzés, hogy a kérés a beszéd szövegkvótájáról szól.
- Válassza ki az alap- vagy egyéni modellt.
- A korábban gyűjtött Azure-erőforrásadatok.
- Minden egyéb szükséges információ.
- A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
- A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.
Példa számítási feladatok mintájára – ajánlott eljárás
Íme egy általános példa a helyes megközelítésre. Ez csak olyan sablonként készült, amelyet szükség szerint módosíthatja a saját használatához.
Tegyük fel, hogy egy Speech-szolgáltatás erőforrásának egyidejű kéréskorlátja 300. Indítsa el a számítási feladatot 20 egyidejű kapcsolatból, és 90–120 másodpercenként 20 egyidejű kapcsolattal növelje a terhelést. Szabályozhatja a szolgáltatás válaszait, és implementálhatja a visszaeső logikát (csökkenti a terhelést), ha túl sok kérést kap (válaszkód: 429). Ezután próbálja meg újra növelni a terhelést egy perc alatt, és ha még mindig nem működik, próbálkozzon újra két perc múlva. Az intervallumokhoz 1-2-4-4 perces mintát használjon.
Általában érdemes tesztelni a számítási feladatokat és a számítási feladat mintáit, mielőtt éles környezetben jár.
Szövegfelolvasás: egyidejű kérelemkorlát növelése
A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikkben korábban tárgyalt anyagokat, például a szabályozás csökkentésére szolgáló ajánlott eljárásokat.
Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech Service olyan fizetési modellt használ, amely megköveteli, hogy csak azért kell fizetnie, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magas skálázható, mielőtt elkezdené szabályozni a kéréseket.
Az egyidejű kérelemkorlát paraméter meglévő értékét nem láthatja az Azure Portalon, a parancssori eszközökben vagy az API-kérelmekben. A meglévő érték ellenőrzéséhez hozzon létre egy Azure-támogatás kérést.
Feljegyzés
A beszédtárolók esetében nincs szükség az egyidejű kérelemkorlát növelésére, mert a tárolókat csak az általuk üzemeltetett hardver processzorai korlátozzák.
A szükséges információk előkészítése
Ha növelni szeretné a kérelmet, meg kell adnia az adatait.
- Az előre összeállított hang esetében:
- Beszéderőforrás azonosítója
- Régió
- Az egyéni hang esetében:
- Üzembehelyezési régió
- Egyéni végpontazonosító
Az előre összeállított hang információinak lekérése:
- Nyissa meg az Azure Portalt.
- Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
- Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
- Másolja és mentse az alábbi mezők értékeit:
- Erőforrás-azonosító
- Hely (a végpont régiója)
Az egyéni hang információinak lekérése:
- Lépjen a Speech Studio portálra.
- Ha szükséges, jelentkezzen be, és lépjen az Egyéni hangra.
- Válassza ki a projektet, és lépjen az Üzembe helyezési modellre.
- Válassza ki a szükséges végpontot.
- Másolja és mentse az alábbi mezők értékeit:
- Szolgáltatásrégió (a végpont régiója)
- Végpont azonosítója
Támogatási kérelem létrehozása és elküldése
Támogatási kérés elküldésével kezdeményezheti az erőforrás egyidejű kéréseinek korlátjának növelését, vagy szükség esetén ellenőrizze az aktuális korlátot. Ennek módja az alábbi:
- Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
- Nyissa meg az Azure Portalt.
- Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni) az egyidejűségi kérelmek korlátját.
- A Támogatási és hibaelhárítási csoportban válassza az Új támogatási kérés lehetőséget. Megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
- Összefoglalva írja le, hogy mit szeretne (például :"Szöveg növelése beszéd egyidejűségi kérelemkorlátra").
- A Probléma típusa területen válassza a Kvóta vagy az Előfizetés problémái lehetőséget.
- A Probléma altípusban válassza a következő lehetőségeket:
- A kvóta vagy az egyidejű kérések száma nő a növekvő kérések esetében.
- Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
- Az Ajánlott megoldás lapon válassza a Tovább gombot.
- A További részletek lapon töltse ki az összes szükséges elemet. A Részletek mezőbe írja be a következőket:
- Megjegyzés, hogy a kérés a beszédkvótához írt szövegről szól.
- Válassza ki az előre összeállított vagy az egyéni hangot.
- A korábban gyűjtött Azure-erőforrásadatok.
- Minden egyéb szükséges információ.
- A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
- A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.
Szöveg–beszéd avatar: az új kapcsolatok korlátjának növelése
A szöveg és a beszéd avatarja közötti új kapcsolatok percenkénti korlátjának növeléséhez forduljon az értékesítési képviselőhöz, hogy hozzon létre egy jegyet az alábbi információkkal:
- Beszéderőforrás URI-ja
- Új korlátozást kért a
- A növekedés indoklása
- A növekedés kezdő dátuma
- A növekedés befejezési dátuma
- Előre összeállított avatar vagy egyéni avatar