Beszédszolgáltatás kvótái és korlátai

Ez a cikk rövid útmutatót és részletes leírást tartalmaz az Azure Cognitive Services Speech szolgáltatásának kvótáiról és korlátairól. Az információk a szolgáltatás összes tarifacsomagjára vonatkoznak . Emellett néhány ajánlott eljárást is tartalmaz a kérések szabályozásának elkerülése érdekében.

Az ingyenes (F0) tarifacsomagért lásd még a havi kibocsátási egységeket a díjszabási oldalon.

Kvóták és korlátozások referenciája

Az alábbi szakaszok gyors útmutatót nyújtanak a Speech szolgáltatásra vonatkozó kvótákról és korlátozásokról.

A Standard (S0) Speech-erőforrások állítható kvótáiról további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál. Az ingyenes (F0) Speech-erőforrások kvótái és korlátai nem módosíthatók.

Beszédfelismerési kvóták és erőforrásokra vonatkozó korlátok

Ez a szakasz a beszédfelismerési kvótákat és a beszédfelismerési erőforrásonkénti korlátokat ismerteti. Ha másként nincs megadva, a korlátok nem állíthatók be.

Online átírás és beszédfordítás

A rövid hanghoz használhatja az online átírást a Speech SDK-val vagy a speech-to-text REST API-val.

Fontos

Ezek a korlátozások az egyidejű beszéd-szöveg online átírási kérelmekre és a beszédfordítási kérelmekre együttesen vonatkoznak. Ha például 60 egyidejű beszéd-szöveg kéréssel és 40 egyidejű beszédfordítási kéréssel rendelkezik, eléri a 100 egyidejű kérés korlátját.

Kvóta Ingyenes (F0) Standard (S0)
Egyidejű kérelemkorlát – alapmodell végpontja 1

Ez a korlát nem állítható be.
100 (alapértelmezett érték)

A sebesség standard (S0) erőforrásokhoz állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.
Egyidejű kérelemkorlát – egyéni végpont 1

Ez a korlát nem állítható be.
100 (alapértelmezett érték)

A sebesség standard (S0) erőforrásokhoz állítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.

Kötegelt átírás

Kvóta Ingyenes (F0) Standard (S0)
Beszédfelismerési REST API-korlát Nem érhető el az F0-hez Percenként 300 kérés
Maximális hangbemeneti fájlméret N/A 1 GB
Bemeneti blob maximális mérete (például egy zip-archívumban több fájlt is tartalmazhat). Jegyezze fel az előző sor fájlméretkorlátját. N/A 2,5 GB
Blobtároló maximális mérete N/A 5 GB
Blobok maximális száma tárolónként N/A 10000
Fájlok maximális száma átírási kérelemenként (ha több tartalom URL-címét használja bemenetként). N/A 1000

Modell testreszabása

A táblázatban szereplő korlátozások beszéderőforrásonként érvényesek a Custom Speech-modell létrehozásakor.

Kvóta Ingyenes (F0) Standard (S0)
REST API-korlát Percenként 300 kérés Percenként 300 kérés
Beszédadatkészletek maximális száma 2 500
Az akusztikai adathalmaz fájlméretének maximális mérete adatimportáláshoz 2 GB 2 GB
A nyelvi adathalmaz fájlméretének maximális mérete adatimportáláshoz 200 MB 1,5 GB
A kiejtési adathalmaz fájlméretének maximális mérete adatimportáláshoz 1 KB 1 MB
Maximális szövegméret, ha a paramétert használja a textModels_Create API-kérelemben 200 KB 500 kB

Szövegfelolvasási kvóták és erőforrásokra vonatkozó korlátozások

Ez a szakasz a beszédfelismerési kvótákat és a beszédfelismerési erőforrásonkénti korlátokat ismerteti. Ha másként nincs megadva, a korlátok nem állíthatók be.

Gyakori szövegfelolvasási kvóták és korlátok

Kvóta Ingyenes (F0) Standard (S0)
Időszakonkénti tranzakciók maximális száma előre összeállított neurális hangok és egyéni neurális hangok esetében. 20 tranzakció 60 másodpercenként

Ez a korlát nem állítható be.
Másodpercenként 200 tranzakció (TPS) (alapértelmezett érték)

A sebesség standard (S0) erőforrások esetén akár 1000 TPS-ig is beállítható. További magyarázatokat, ajánlott eljárásokat és beállítási utasításokat talál.
Kérelemenként előállított maximális hanghossz 10 perc 10 perc
A különböző elemek <voice> és <audio> címkék maximális száma az SSML-ben 50 50
SSML-üzenetek maximális mérete per turn for websocket 64 KB 64 KB

Egyéni neurális hang

Kvóta Ingyenes (F0) Standard (S0)
Tranzakciók maximális száma másodpercenként (TPS) Nem érhető el az F0-hez 200 tranzakció másodpercenként (TPS) (alapértelmezett érték)
Adathalmazok maximális száma N/A 500
Egyidejű adathalmaz-feltöltések maximális száma N.A. 5
Adathalmazonkénti adatimportálás maximális adatfájlmérete N/A 2 GB
Hosszú hang- vagy hangfájlok feltöltése szkript nélkül N.A. Igen
Egyidejű modellbetanítások maximális száma N/A 3
Egyéni végpontok maximális száma N/A 50

Hangtartalom-létrehozási eszköz

Kvóta Ingyenes (F0) Standard (S0)
Fájlméret Fájlonként 3000 karakter Fájlonként 20 000 karakter
Exportálás hangtárba 1 egyidejű feladat N/A

Beszélőfelismerési kvóták és erőforrásokra vonatkozó korlátok

A beszélőfelismerés másodpercenként 20 tranzakcióra (TPS) korlátozódik.

Részletes leírás, kvótamódosítás és ajánlott eljárások

A Speech service-kvóták némelyike módosítható. Ez a szakasz további magyarázatokat, ajánlott eljárásokat és beállítási utasításokat tartalmaz.

A standard (S0) erőforrások esetében az alábbi kvóták állíthatók be. Az ingyenes (F0) kérelemkorlátok nem módosíthatók.

Mielőtt kvótanövelést kér (ha van ilyen), győződjön meg arról, hogy szükség van rá. A Speech Service automatikus skálázási technológiákat használ a szükséges számítási erőforrások igény szerinti módban való használatához. A Speech Service ugyanakkor úgy próbálja alacsonyan tartani a költségeket, hogy nem tart fenn túlzott hardverkapacitást.

Lássunk erre egy példát. Tegyük fel, hogy az alkalmazás a 429-ben kapott válaszkódot kapja, ami azt jelzi, hogy túl sok kérés van. Az alkalmazás akkor is megkapja ezt a választ, ha a számítási feladat a Kvóták és korlátok referenciában meghatározott korlátokon belül van. A legvalószínűbb magyarázat az, hogy a Speech szolgáltatás az igényeinek megfelelően skáláz, és még nem érte el a szükséges méretet. Ezért a szolgáltatás nem rendelkezik azonnal elegendő erőforrással a kérés kiszolgálásához. A legtöbb esetben ez a szabályozott állapot átmeneti.

Általános ajánlott eljárások a szabályozás csökkentéséhez az automatikus skálázás során

A szabályozással kapcsolatos problémák minimalizálása érdekében érdemes az alábbi technikákat használni:

  • Implementáljon újrapróbálkozási logikát az alkalmazásba.
  • Kerülje a hirtelen terhelésváltásokat. Fokozatosan növelje a munkaterhelést. Tegyük fel például, hogy az alkalmazás szövegfelolvasást használ, az aktuális számítási feladat pedig 5 TPS. A következő másodpercben 20 TPS-re növeli a terhelést (vagyis négyszer többre). A Speech Service azonnal megkezdi a vertikális felskálázást az új terhelés teljesítéséhez, de nem tud igény szerint skálázni egy másodpercen belül. Egyes kérések a 429-ben megadott válaszkódot kapják (túl sok kérés).
  • Teszteljen különböző terhelésnövelési mintákat. További információkért lásd a számítási feladat mintáját ismertető példát.
  • Hozzon létre további Speech service-erőforrásokat különböző régiókban, és ossza el közöttük a számítási feladatokat. (Ha több Speech service-erőforrást hoz létre ugyanabban a régióban, az nem befolyásolja a teljesítményt, mert minden erőforrást ugyanaz a háttérfürt fog kiszolgálni.

A következő szakaszok a kvóták módosításának konkrét eseteit ismertetik.

Beszédfelismerés: az online átírás egyidejű kéréskorlátjának növelése

Alapértelmezés szerint az egyidejű, szöveggé alakítási és beszédfordítási kérések száma az alapmodellben erőforrásonként legfeljebb 100, az egyéni modellben pedig egyéni végpontonként 100 lehet. A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikk korábbi részében tárgyalt anyagokat, például a szabályozás mérséklésére vonatkozó ajánlott eljárásokat.

Megjegyzés

Az alap- és egyéni modellek egyidejű kéréskorlátait külön kell módosítani. Rendelkezhet egy Speech service-erőforrással, amely számos egyéni modelltelepítést üzemeltető egyéni végponthoz van társítva. Szükség esetén az egyéni végpontonkénti korlátmódosításokat külön kell kérni.

Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech szolgáltatás olyan fizetési modellt használ, amely megköveteli, hogy csak azért kell fizetnie, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magasra méretezhető, mielőtt elkezdené szabályozni a kéréseket.

Nem látja az egyidejű kérelemkorlát paraméter meglévő értékét a Azure Portal, a parancssori eszközökben vagy az API-kérelmekben. A meglévő érték ellenőrzéséhez hozzon létre egy Azure-támogatás kérést.

Megjegyzés

A beszédtárolók nem igénylik az egyidejű kérelemkorlát növelését, mivel a tárolókat csak az általuk üzemeltetett hardver processzorai korlátozzák. A beszédtárolók azonban saját kapacitáskorlátozásokkal rendelkeznek, amelyeket figyelembe kell venni. További információkért lásd a Speech-tárolókkal kapcsolatos gyakori kérdéseket.

Készítse elő a szükséges információkat

  • Az alapmodell esetében:
    • Speech-erőforrás azonosítója
    • Régió
  • Az egyéni modell esetében:
    • Régió
    • Egyéni végpont azonosítója

Az alapmodell információinak lekérése:

  1. Nyissa meg az Azure Portal.
  2. Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
  3. Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
  4. Másolja ki és mentse az alábbi mezők értékeit:
    • Erőforrás-azonosító
    • Hely (a végpont régiója)

Az egyéni modell adatainak lekérése:

  1. Nyissa meg a Speech Studio portált.
  2. Ha szükséges, jelentkezzen be, és lépjen a Custom Speech (Egyéni beszéd) elemre.
  3. Válassza ki a projektet, és lépjen az Üzembe helyezés elemre.
  4. Válassza ki a szükséges végpontot.
  5. Másolja és mentse az alábbi mezők értékeit:
    • Szolgáltatásrégió (a végpont régiója)
    • Végpont azonosítója

Támogatási kérelem létrehozása és elküldése

Támogatási kérés elküldésével kezdeményezheti az erőforrásra vonatkozó egyidejű kérelmek korlátjának növelését, vagy szükség esetén ellenőrizze az aktuális korlátot. Ezt a következőképpen teheti meg:

  1. Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
  2. Nyissa meg az Azure Portal.
  3. Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni szeretné) az egyidejűségi kérelmek korlátját.
  4. A Támogatás + hibaelhárítás csoportban válassza az Új támogatási kérés lehetőséget. Ekkor megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
  5. Az Összefoglalás területen írja le, hogy mit szeretne (például "Szövegközi egyidejűségi kérelmek korlátjának növelése").
  6. A Probléma típusa területen válassza a Kvótával vagy előfizetéssel kapcsolatos problémák lehetőséget.
  7. A Probléma altípusban válassza a következő lehetőségeket:
    • A kvóta vagy az egyidejű kérések száma növekszik a növekvő kérések esetében.
    • Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
  8. Válassza a Tovább: Megoldások lehetőséget. Folytassa a kérés létrehozását.
  9. A Részletek lap Leírás mezőjébe írja be a következőket:
    • Megjegyzés, hogy a kérés a szövegfelolvasási kvótáról szól.
    • Válassza ki az alap- vagy egyéni modellt.
    • A korábban gyűjtött Azure-erőforrásadatok.
    • Minden más szükséges információ.
  10. A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
  11. A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.

Példa egy számítási feladatminta ajánlott gyakorlatára

Íme egy általános példa egy jó megközelítésre. Ez csak sablonként jelent, amelyet szükség szerint módosíthatja a saját használatához.

Tegyük fel, hogy egy Speech-szolgáltatás erőforrásának egyidejű kéréskorlátja 300- ra van állítva. Indítsa el a számítási feladatot 20 egyidejű kapcsolatból, és növelje a terhelést 20 egyidejű kapcsolattal 90–120 másodpercenként. Szabályozhatja a szolgáltatás válaszait, és implementálhatja a visszaeső logikát (csökkenti a terhelést), ha túl sok kérést kap (429-es válaszkód). Ezután próbálkozzon újra a terhelés növekedésével egy perc alatt, és ha még mindig nem működik, próbálkozzon újra két perc múlva. Az időközökhöz használjon 1-2-4-4 perces mintát.

Általában érdemes tesztelni a számítási feladatokat és a számítási feladat mintáit, mielőtt éles üzembe kezdenénk.

Szövegfelolvasás: egyidejű kérelemkorlát növelése

A standard tarifacsomag esetében növelheti ezt az összeget. A kérés elküldése előtt győződjön meg arról, hogy ismeri a cikkben korábban tárgyalt anyagokat, például a szabályozás csökkentésére vonatkozó ajánlott eljárásokat.

Az egyidejű kérések korlátjának növelése nem befolyásolja közvetlenül a költségeket. A Speech service olyan fizetési modellt használ, amely megköveteli, hogy csak azért fizessen, amit használ. A korlát határozza meg, hogy a szolgáltatás milyen magas skálázást végezhet, mielőtt elkezdené szabályozni a kéréseket.

Nem látja az egyidejű kérelemkorlát paraméter meglévő értékét a Azure Portal, a parancssori eszközökben vagy az API-kérésekben. A meglévő érték ellenőrzéséhez hozzon létre egy Azure-támogatás kérést.

Megjegyzés

A beszédtárolókhoz nincs szükség az egyidejű kérelemkorlát növelésére, mivel a tárolókat csak a hardver processzorai korlátozzák.

A szükséges információk előkészítése

Ha növelni szeretné a kérést, meg kell adnia az adatait.

  • Előre összeállított hang esetén:
    • Speech-erőforrás azonosítója
    • Régió
  • Egyéni hang esetén:
    • Üzembehelyezési régió
    • Egyéni végpont azonosítója

Az előre összeállított hang információinak lekérése:

  1. Nyissa meg az Azure Portal.
  2. Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné az egyidejűségi kérelmek korlátját.
  3. Az Erőforrás-kezelés csoportban válassza a Tulajdonságok lehetőséget.
  4. Másolja és mentse az alábbi mezők értékeit:
    • Erőforrás-azonosító
    • Hely (a végpont régiója)

Az egyéni hang információinak lekérése:

  1. Nyissa meg a Speech Studio portált.
  2. Ha szükséges, jelentkezzen be, és lépjen a Custom Voice (Egyéni hang) elemre.
  3. Válassza ki a projektet, és lépjen a Modell üzembe helyezése elemre.
  4. Válassza ki a szükséges végpontot.
  5. Másolja és mentse az alábbi mezők értékeit:
    • Szolgáltatásrégió (a végpont régiója)
    • Végpont azonosítója

Támogatási kérelem létrehozása és elküldése

Támogatási kérés elküldésével kezdeményezheti az erőforrásra vonatkozó egyidejű kérelmek korlátjának növelését, vagy szükség esetén ellenőrizze az aktuális korlátot. Ezt a következőképpen teheti meg:

  1. Győződjön meg arról, hogy rendelkezik az előző szakaszban felsorolt szükséges információkkal.
  2. Nyissa meg az Azure Portal.
  3. Válassza ki azt a Speech service-erőforrást, amelyhez növelni szeretné (vagy ellenőrizni szeretné) az egyidejűségi kérelmek korlátját.
  4. A Támogatás + hibaelhárítás csoportban válassza az Új támogatási kérés lehetőséget. Ekkor megjelenik egy új ablak, amely automatikusan kitölti az Azure-előfizetéssel és az Azure-erőforrással kapcsolatos információkat.
  5. Az Összefoglalás területen írja le, hogy mit szeretne (például "Szövegfelolvasási egyidejűségi kérelmek korlátjának növelése").
  6. A Probléma típusa területen válassza a Kvótával vagy előfizetéssel kapcsolatos problémák lehetőséget.
  7. A Probléma altípusban válassza a következő lehetőségeket:
    • A kvóta vagy az egyidejű kérések száma növekszik a növekvő kérések esetében.
    • Kvóta- vagy használatérvényesítés a meglévő korlát ellenőrzéséhez.
  8. Az Ajánlott megoldás lapon válassza a Tovább gombot.
  9. A További részletek lapon töltse ki az összes szükséges elemet. A Részletek mezőbe írja be a következőket:
    • Megjegyzés, hogy a kérés a szövegfelolvasási kvótáról szól.
    • Válassza ki az előre összeállított vagy az egyéni hangot.
    • A korábban gyűjtött Azure-erőforrásadatok.
    • Minden más szükséges információ.
  10. A Véleményezés + létrehozás lapon válassza a Létrehozás lehetőséget.
  11. A támogatási kérés számát az Azure Portal értesítései között találja meg. Hamarosan felvesszük Önnel a kapcsolatot a kéréssel kapcsolatban.