Speech-Dienst – Kontingente und Grenzwerte

Dieser Artikel enthält eine Kurzübersicht und eine ausführliche Beschreibung der Kontingente und Grenzwerte für den Speech-Dienst in Azure Cognitive Services. Die Informationen gelten für alle Tarife des Diensts. Außerdem finden Sie hier einige bewährte Methoden zur Vermeidung der Anforderungsdrosselung.

Referenz zu Kontingenten und Grenzwerten

Die folgenden Abschnitte bieten eine kurze Anleitung zu den Kontingenten und Grenzwerten, die für den Speech-Dienst gelten.

Kontingente und Grenzwerte für die Spracherkennung pro Ressource

In den folgenden Tabellen sind die Parameter ohne die Zeile Adjustable (Anpassbar) nicht für alle Tarife anpassbar.

Onlinetranskription

Sie können die Onlinetranskription mit dem Speech SDK oder der Spracherkennungs-REST-API für kurze Audioinhalte verwenden.

Kontingent Free (F0)1 Standard (S0)
Grenzwert für gleichzeitige Anforderungen – Basismodell-Endpunkt 1 100 (Standardwert)
Anpassbar Nein2 Ja2
Grenzwert für gleichzeitige Anforderungen – benutzerdefinierter Endpunkt 1 100 (Standardwert)
Anpassbar Nein2 Ja2

Batch-Transkription

Kontingent Free (F0)1 Standard (S0)
REST-API-Grenzwert für Sprach-zu-Text Für F0 nicht verfügbar 300 Anforderungen pro Minute
Maximale Größe der Audioeingabedatei Nicht zutreffend 1 GB
Maximale Größe des Eingabeblobs (kann z. B. mehr als eine Datei in einem ZIP-Archiv enthalten). Beachten Sie die Dateigrößenbeschränkung aus der vorherigen Zeile. 2,5 GB
Maximale Größe des Blob-Containers 5 GB
Maximale Anzahl von Blobs pro Container 10000
Maximale Anzahl von Dateien pro Transkriptionsanforderung (bei Verwendung mehrerer Inhalts-URLs als Eingabe). 1000

Modellanpassung

Kontingent Free (F0)1 Standard (S0)
REST-API-Grenzwert 300 Anforderungen pro Minute 300 Anforderungen pro Minute
Maximale Anzahl von Sprach-Datasets 2 500
Maximale Dateigröße für das Akustikdataset für den Datenimport 2 GB 2 GB
Maximale Dateigröße für das Sprachdataset für den Datenimport 200 MB 1,5 GB
Maximale Dateigröße für das Aussprachedataset für den Datenimport 1 KB 1 MB
Maximale Textgröße bei Verwendung des Parameters text in der API-Anforderung Create Model (Modell erstellen). 200 KB 500 KB

1 Sehen Sie sich im Zusammenhang mit dem kostenlosen Tarif „Free“ (F0) auch die monatlichen Freibeträge auf der Preisseite an.
2 Sehen Sie sich weitere Erläuterungen, bewährte Methoden und Anpassungsanweisungen an.

Kontingente und Grenzwerte für die Sprachsynthese pro Ressource

In den folgenden Tabellen sind die Parameter ohne die Zeile Adjustable (Anpassbar) nicht für alle Tarife anpassbar.

Allgemein

Kontingent Free (F0)3 Standard (S0)
Maximale Anzahl von Transaktionen pro bestimmtem Zeitraum pro Speech-Dienstressource
Echtzeit-API. Vordefinierte neuronale Stimmen und benutzerdefinierte neuronale Stimmen. 20 Transaktionen pro 60 Sekunden 200 Transaktionen pro Sekunde (TPS) (Standardwert)
Anpassbar Nein4 Ja5, bis zu 1000 TPS
HTTP-spezifische Kontingente
Maximal erzeugte Audiolänge pro Anforderung 10 Min. 10 Min.
Maximale Gesamtanzahl von unterschiedlichen <voice>- und <audio>-Tags in SSML 50 50
WebSocket-spezifische Kontingente
Maximal erzeugte Audiolänge pro Sprecherwechsel 10 Min. 10 Min.
Maximale Gesamtanzahl von unterschiedlichen <voice>- und <audio>-Tags in SSML 50 50
Maximale SSML-Nachrichtengröße pro Sprecherwechsel 64 KB 64 KB

API für lange Audioinhalte

Kontingent Free (F0)3 Standard (S0)
Minimale Textlänge 400 Zeichen für reinen Text, 400 abrechenbare Zeichen für SSML
Maximale Textlänge 10.000 Absätze
Startzeit 10 Aufgaben oder 10.000 Zeichen, akkumuliert

Benutzerdefinierte neuronale Stimme

Kontingent Free (F0)3 Standard (S0)
Maximale Anzahl von Transaktionen pro Sekunde (TPS) pro Speech-Dienstressource Für F0 nicht verfügbar Weitere Informationen finden Sie unter Allgemein.
Maximale Anzahl von Datasets pro Speech-Dienstressource 500
Maximale Anzahl simultaner Datasetuploads pro Speech-Dienstressource N/V 5
Maximale Datendateigröße für den Datenimport pro Dataset 2 GB
Upload langer Audiospuren oder Audiospuren ohne Skript Ja
Maximale Anzahl simultaner Modelltrainings pro Speech-Dienstressource 3
Maximale Anzahl benutzerdefinierter Endpunkte pro Speech-Dienstressource 50
Grenzwert für gleichzeitige Anforderungen für „Benutzerdefinierte neuronale Stimme“
Standardwert 10
Anpassbar Ja5

Tool für die Audioinhaltserstellung

Kontingent Free (F0) Standard (S0)
Dateigröße 3.000 Zeichen pro Datei 20.000 Zeichen pro Datei
In Audiobibliothek exportieren 1 gleichzeitige Aufgabe

3 Sehen Sie sich im Zusammenhang mit dem kostenlosen Tarif „Free“ (F0) auch die monatlichen Freibeträge auf der Preisseite an.
4 Sehen Sie sich weitere Erläuterungen und bewährte Methoden an.
5 Sehen Sie sich weitere Erläuterungen, bewährte Methoden und Anpassungsanweisungen an.

Ausführliche Beschreibung, Kontingentanpassung und bewährte Methoden

Überprüfen Sie vor dem Anfordern einer Kontingenterhöhung (sofern zutreffend), dass sie wirklich erforderlich ist. Der Speech-Dienst verwendet Technologien für die automatische Skalierung, um die erforderlichen Computeressourcen in den bedarfsorientierten Modus zu versetzen. Gleichzeitig versucht der Speech-Dienst, Ihre Kosten niedrig zu halten, indem er keine übermäßigen Hardwarekapazitäten bereithält.

Schauen wir uns ein Beispiel an. Angenommen, Ihre Anwendung empfängt den Antwortcode 429, der angibt, dass zu viele Anforderungen vorhanden sind. Ihre Anwendung empfängt diese Antwort, sogar obwohl Ihre Workload innerhalb der Grenzwerte liegt, die in der Referenz zu Kontingenten und Grenzwerten definiert sind. Die wahrscheinlichste Erklärung ist, dass der Speech-Dienst gerade entsprechend Ihres Bedarfs hochskaliert wird und die erforderliche Skalierung noch nicht erreicht hat. Daher verfügt der Dienst nicht sofort über genügend Ressourcen, um die Anforderung zu erfüllen. In den meisten Fällen ist dieser gedrosselte Zustand vorübergehend.

Allgemeine bewährte Methoden zur Behandlung der Drosselung während der automatischen Skalierung

Um Probleme im Zusammenhang mit der Drosselung zu minimieren, empfiehlt es sich, die folgenden Methoden zu verwenden:

  • Implementieren Sie eine Wiederholungslogik in der Anwendung.
  • Vermeiden Sie plötzliche Änderungen bei der Arbeitsauslastung. Erhöhen Sie die Workload nach und nach. Nehmen wir beispielsweise an, dass Ihre Anwendung Sprachsynthese verwendet und dass Ihre aktuelle Arbeitsauslastung bei 5 TPS (Transaktionen pro Sekunde) liegt. In der nächsten Sekunde erhöhen Sie die Last auf 20 TPS (also auf das Vierfache). Der Speech-Dienst beginnt sofort mit der Hochskalierung, um die neue Last zu bewältigen, kann aber nicht innerhalb einer Sekunde wie benötigt skaliert werden. Einige der Anforderungen erhalten den Antwortcode 429 (zu viele Anforderungen).
  • Testen Sie verschiedene Lasterhöhungsmuster. Weitere Informationen finden Sie im Beispiel zum Workloadmuster.
  • Erstellen Sie zusätzliche Speech-Dienstressourcen in anderen Regionen, und verteilen Sie die Workload auf diese. (Das Erstellen mehrerer Sprachdienstressourcen in derselben Region wirkt sich nicht auf die Leistung aus, da alle Ressourcen vom gleichen Back-End-Cluster bereitgestellt werden).

In den nächsten Abschnitten werden bestimmte Kontingentanpassungsfälle beschrieben.

Spracherkennung: Erhöhen des Grenzwerts für gleichzeitige Anforderungen bei der Onlinetranskription

Standardmäßig ist die Anzahl gleichzeitiger Anforderungen auf 100 pro Ressource im Basismodell und auf 100 pro benutzerdefiniertem Endpunkt im benutzerdefinierten Modell beschränkt. Für den Standard-Tarif können Sie diese Menge erhöhen. Stellen Sie vor dem Übermitteln der Anforderung sicher, dass Sie mit dem weiter oben in diesem Artikel besprochenen Material vertraut sind, z. B. mit den bewährten Methoden zum Abmildern der Drosselung.

Hinweis

Beachten Sie bei der Verwendung von benutzerdefinierten Modelle, dass eine Speech-Dienstressource vielen benutzerdefinierten Endpunkten zugeordnet sein kann, die viele benutzerdefinierte Modellimplementierungen hosten. Für jeden benutzerdefinierten Endpunkt wird bei der Erstellung der Standardgrenzwert für gleichzeitige Anforderungen (100) festgelegt. Wenn Sie diese anpassen möchten, müssen Sie die Anpassung für jeden benutzerdefinierten Endpunkt separat vornehmen. Beachten Sie auch, dass der Wert des Grenzwerts für gleichzeitige Anforderungen für das Basismodell einer Ressource keine Auswirkungen auf die benutzerdefinierten Endpunkte hat, die dieser Ressource zugeordnet sind.

Das Erhöhen des Grenzwerts für gleichzeitige Anforderungen wirkt sich nicht direkt auf Ihre Kosten aus. Der Speech-Dienst verwendet ein Bezahlmodell, das erfordert, dass Sie nur für das bezahlen, was Sie verwenden. Der Grenzwert gibt an, wie hoch der Dienst skaliert werden kann, bevor Ihre Anforderungen gedrosselt werden.

Grenzwerte für gleichzeitige Anforderung im Basismodell und im benutzerdefinierten Modell müssen getrennt angepasst werden.

Sie können den vorhandenen Wert des Grenzwertparameters für gleichzeitige Anforderungen weder im Azure-Portal noch in den Befehlszeilentools oder den API-Anforderungen sehen. Erstellen Sie eine Azure-Supportanfrage, um den vorhandenen Wert zu überprüfen.

Hinweis

Für Speech-Container muss der Grenzwert für gleichzeitige Anforderungen nicht erhöht werden, weil Container einzig durch die CPUs der Hardware eingeschränkt sind, auf der sie gehostet werden. Speech-Container haben jedoch ihre eigenen Kapazitätsgrenzen, die berücksichtigt werden sollten. Weitere Informationen finden Sie in den häufig gestellten Fragen zu Speech-Containern.

Halten Sie die erforderlichen Informationen bereit

  • Für das Basismodell:
    • ID der Speech-Ressource
    • Region
  • Für das benutzerdefinierte Modell:
    • Region
    • ID des benutzerdefinierten Endpunkts

Abrufen von Informationen für das Basismodell:

  1. Öffnen Sie das Azure-Portal.
  2. Wählen Sie die Speech-Dienstressource aus, für die Sie den Grenzwert für gleichzeitige Anforderungen erhöhen möchten.
  3. Wählen Sie in der Gruppe Ressourcenverwaltung die Option Eigenschaften aus.
  4. Kopieren und speichern Sie die Werte der folgenden Felder:
    • Ressourcen-ID
    • Standort (Ihre Endpunktregion)

Abrufen von Informationen für das benutzerdefinierte Modell:

  1. Wechseln Sie zum Speech Studio-Portal.
  2. Melden Sie sich, falls erforderlich, an, und wechseln Sie zu Custom Speech.
  3. Wählen Sie Ihr Projekt, und wechseln Sie zu Bereitstellung.
  4. Wählen Sie den erforderlichen Endpunkt aus.
  5. Kopieren und speichern Sie die Werte der folgenden Felder:
    • Dienstregion (Ihre Endpunktregion)
    • Endpunkt-ID

Erstellen und Übermitteln einer Supportanfrage

Übermitteln Sie die Supportanfrage, um für Ihre Ressource die Erhöhung des Grenzwerts für gleichzeitige Anforderungen zu initiieren oder um ggf. den aktuellen Grenzwert zu überprüfen. Gehen Sie dazu wie folgt vor:

  1. Stellen Sie sicher, dass Sie über die im vorherigen Abschnitt aufgeführten erforderlichen Informationen verfügen.
  2. Öffnen Sie das Azure-Portal.
  3. Wählen Sie die Speech-Dienstressource aus, für die Sie den Grenzwert für gleichzeitige Anforderungen erhöhen (oder überprüfen) möchten.
  4. Wählen Sie in der Gruppe Support + Problembehandlung die Option Neue Supportanfrage aus. Daraufhin wird ein neues Fenster mit automatisch ausgefüllten Informationen zum Azure-Abonnement und zur Azure-Ressource angezeigt.
  5. Beschreiben Sie unter Zusammenfassung, was Sie möchten (z. B. „Erhöhen des Grenzwerts für gleichzeitige Anforderungen der Spracherkennung“).
  6. Wählen Sie unter Problemtyp die Option Kontingent- oder Abonnementprobleme aus.
  7. Wählen Sie unter Problemuntertyp eine der beiden Optionen aus:
    • Quota or concurrent requests increase (Erhöhung eines Kontingents oder der gleichzeitigen Anforderungen) für eine Erhöhungsanforderung.
    • Quota or usage validation (Kontingent- oder Nutzungsüberprüfung) zur Überprüfung des vorhandenen Grenzwerts.
  8. Klicken Sie auf Weiter: Lösungen. Fahren Sie mit der Anforderungserstellung fort.
  9. Geben Sie Folgendes auf der Registerkarte Details im Feld Beschreibung ein:
    • Einen Hinweis darauf, dass es bei der Anforderung um ein Kontingent für die Spracherkennung geht.
    • Wählen Sie entweder das Basismodell oder das benutzerdefinierte Modell aus.
    • Die zuvor gesammelten Azure-Ressourceninformationen.
    • Alle anderen erforderlichen Informationen.
  10. Wählen Sie auf der Registerkarte Überprüfen + erstellen die Option Erstellen aus.
  11. Notieren Sie sich die Nummer der Supportanfrage aus den Benachrichtigungen im Azure-Portal. Sie werden in Kürze wegen Ihrer Anforderung kontaktiert.

Beispiel für eine bewährte Methode für Workloadmuster

Im Folgenden finden Sie ein allgemeines Beispiel für einen guten Ansatz. Es dient nur als Vorlage, die Sie bei Bedarf für Ihre eigenen Zwecke anpassen können.

Angenommen, der Grenzwert für gleichzeitige Anforderungen einer Speech-Dienstressource ist auf „300“ festgelegt. Beginnen Sie die Workload mit 20 gleichzeitigen Verbindungen, und erhöhen Sie die Last alle 90 bis 120 Sekunden um 20 gleichzeitige Verbindungen. Kontrollieren Sie die Dienstantworten, und implementieren Sie die Fallbacklogik, durch die im Falle zu vieler Anforderungen (Antwortcode 429) die Last verringert wird. Probieren Sie dann die Erhöhung der Last nach einer Minute erneut, und wenn dies immer noch nicht funktioniert, versuchen Sie es in zwei Minuten noch mal. Verwenden Sie für die Intervalle ein Muster von 1-2-4-4 Minuten.

Es ist generell sehr empfehlenswert, die Workload und die Workloadmuster zu testen, bevor sie in der Produktion verwendet werden.

Text-zu-Sprache: Erhöhen des Grenzwerts für gleichzeitige Anforderungen

Für den Standard-Tarif können Sie diese Menge erhöhen. Stellen Sie vor dem Übermitteln der Anforderung sicher, dass Sie mit dem weiter oben in diesem Artikel besprochenen Material vertraut sind, z. B. mit den bewährten Methoden zum Abmildern der Drosselung.

Das Erhöhen des Grenzwerts für gleichzeitige Anforderungen wirkt sich nicht direkt auf Ihre Kosten aus. Der Speech-Dienst verwendet ein Bezahlmodell, das erfordert, dass Sie nur für das bezahlen, was Sie verwenden. Der Grenzwert gibt an, wie hoch der Dienst skaliert werden kann, bevor Ihre Anforderungen gedrosselt werden.

Sie können den vorhandenen Wert des Grenzwertparameters für gleichzeitige Anforderungen weder im Azure-Portal noch in den Befehlszeilentools oder den API-Anforderungen sehen. Erstellen Sie eine Azure-Supportanfrage, um den vorhandenen Wert zu überprüfen.

Hinweis

Für Speech-Container muss der Grenzwert für gleichzeitige Anforderungen nicht erhöht werden, weil Container einzig durch die CPUs der Hardware eingeschränkt sind, auf der sie gehostet werden.

Vorbereiten der erforderlichen Informationen

Wenn Sie eine Erhöhungsanforderung erstellen möchten, geben Sie Ihre Bereitstellungsregion und die ID des benutzerdefinierten Endpunkts an. Diese Informationen erhalten Sie wie folgt:

  1. Wechseln Sie zum Speech Studio-Portal.
  2. Melden Sie sich, falls erforderlich, an, und wechseln Sie zu Custom Voice.
  3. Wählen Sie Ihr Projekt, und wechseln Sie zu Bereitstellung.
  4. Wählen Sie den erforderlichen Endpunkt aus.
  5. Kopieren und speichern Sie die Werte der folgenden Felder:
    • Dienstregion (Ihre Endpunktregion)
    • Endpunkt-ID

Erstellen und Übermitteln einer Supportanfrage

Übermitteln Sie die Supportanfrage, um für Ihre Ressource die Erhöhung des Grenzwerts für gleichzeitige Anforderungen zu initiieren oder um ggf. den aktuellen Grenzwert zu überprüfen. Gehen Sie dazu wie folgt vor:

  1. Stellen Sie sicher, dass Sie über die im vorherigen Abschnitt aufgeführten erforderlichen Informationen verfügen.
  2. Öffnen Sie das Azure-Portal.
  3. Wählen Sie die Speech-Dienstressource aus, für die Sie den Grenzwert für gleichzeitige Anforderungen erhöhen (oder überprüfen) möchten.
  4. Wählen Sie in der Gruppe Support + Problembehandlung die Option Neue Supportanfrage aus. Daraufhin wird ein neues Fenster mit automatisch ausgefüllten Informationen zum Azure-Abonnement und zur Azure-Ressource angezeigt.
  5. Beschreiben Sie unter Zusammenfassung, was Sie möchten (z. B. „Erhöhen des Grenzwerts für gleichzeitige Anforderungen der Sprachsynthese“).
  6. Wählen Sie unter Problemtyp die Option Kontingent- oder Abonnementprobleme aus.
  7. Wählen Sie unter Problemuntertyp eine der beiden Optionen aus:
    • Quota or concurrent requests increase (Erhöhung eines Kontingents oder der gleichzeitigen Anforderungen) für eine Erhöhungsanforderung.
    • Quota or usage validation (Kontingent- oder Nutzungsüberprüfung) zur Überprüfung des vorhandenen Grenzwerts.
  8. Klicken Sie auf Weiter: Lösungen. Fahren Sie mit der Anforderungserstellung fort.
  9. Geben Sie Folgendes auf der Registerkarte Details im Feld Beschreibung ein:
    • Einen Hinweis darauf, dass es bei der Anfrage um ein Kontingent für die Sprachsynthese geht.
    • Wählen Sie entweder das Basismodell oder das benutzerdefinierte Modell aus.
    • Die zuvor gesammelten Azure-Ressourceninformationen.
    • Alle anderen erforderlichen Informationen.
  10. Wählen Sie auf der Registerkarte Überprüfen + erstellen die Option Erstellen aus.
  11. Notieren Sie sich die Nummer der Supportanfrage aus den Benachrichtigungen im Azure-Portal. Sie werden in Kürze wegen Ihrer Anforderung kontaktiert.