Limity przydziału i limity usługi Mowa

Ten artykuł zawiera szybką dokumentację oraz szczegółowy opis przydziałów i limitów dla usługi Mowa w usługach Azure Cognitive Services. Informacje dotyczą wszystkich warstw cenowych usługi. Zawiera również pewne najlepsze rozwiązania, aby uniknąć ograniczania żądań.

W przypadku warstwy cenowej Bezpłatna (F0) zobacz również miesięczne uprawnienia na stronie cennika.

Dokumentacja limitów przydziału i limitów

Poniższe sekcje zawierają szybki przewodnik po limitach przydziałów i limitach, które mają zastosowanie do usługi Mowa.

Aby uzyskać informacje na temat regulowanych limitów przydziału dla zasobów usługi Mowa w warstwie Standardowa (S0), zobacz dodatkowe wyjaśnienia, najlepsze rozwiązania i instrukcje dotyczące dostosowywania. Limity przydziału i limity dla zasobów bezpłatnej mowy (F0) nie są regulowane.

Limity przydziału i limity zamiany mowy na tekst na zasób

W tej sekcji opisano przydziały i limity zamiany mowy na tekst na zasób usługi Mowa. O ile nie określono inaczej, limity nie są regulowane.

Transkrypcja online i tłumaczenie mowy

Możesz użyć transkrypcji online z zestawem SPEECH SDK lub interfejsem API REST zamiany mowy na tekst w celu uzyskania krótkiego dźwięku.

Ważne

Te limity dotyczą równoczesnych żądań transkrypcji online zamiany mowy na tekst i połączonych żądań tłumaczenia mowy. Jeśli na przykład masz 60 równoczesnych żądań zamiany mowy na tekst i 40 współbieżnych żądań tłumaczenia mowy, osiągniesz limit 100 równoczesnych żądań.

limit przydziału Bezpłatna (F0) Standardowa (S0)
Limit żądań współbieżnych — podstawowy punkt końcowy modelu 1

Ten limit nie jest regulowany.
100 (wartość domyślna)

Szybkość jest regulowana dla zasobów standardowych (S0). Zapoznaj się z dodatkowymi wyjaśnieniami, najlepszymi rozwiązaniami i instrukcjami dotyczącymi korekt.
Limit żądań współbieżnych — niestandardowy punkt końcowy 1

Ten limit nie jest regulowany.
100 (wartość domyślna)

Szybkość jest regulowana dla zasobów standardowych (S0). Zapoznaj się z dodatkowymi wyjaśnieniami, najlepszymi rozwiązaniami i instrukcjami dotyczącymi korekt.

Transkrypcja wsadowa

limit przydziału Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST zamiany mowy na tekst Niedostępne dla F0 300 żądań na minutę
Maksymalny rozmiar pliku wejściowego audio Nie dotyczy 1 GB
Maksymalny rozmiar wejściowego obiektu blob (na przykład może zawierać więcej niż jeden plik w archiwum zip). Zwróć uwagę na limit rozmiaru pliku z poprzedniego wiersza. Nie dotyczy 2,5 GB
Maksymalny rozmiar kontenera obiektów blob Nie dotyczy 5 GB
Maksymalna liczba obiektów blob na kontener Nie dotyczy 10 000
Maksymalna liczba plików na żądanie transkrypcji (jeśli używasz wielu adresów URL zawartości jako danych wejściowych). Nie dotyczy 1000

Dostosowywanie modelu

Limity w tej tabeli dotyczą zasobu usługi Mowa podczas tworzenia modelu usługi Custom Speech.

limit przydziału Bezpłatna (F0) Standardowa (S0)
Limit interfejsu API REST 300 żądań na minutę 300 żądań na minutę
Maksymalna liczba zestawów danych mowy 2 500
Maksymalny rozmiar pliku zestawu danych akustycznych na potrzeby importowania danych 2 GB 2 GB
Maksymalny rozmiar pliku zestawu danych języka na potrzeby importowania danych 200 MB 1,5 GB
Maksymalny rozmiar pliku zestawu danych wymowy na potrzeby importowania danych 1 KB 1 MB
Maksymalny rozmiar tekstu podczas korzystania z parametru w żądaniu interfejsutext API Models_Create 200 KB 500 KB

Limity przydziału i limity zamiany tekstu na mowę na zasób

W tej sekcji opisano przydziały i limity zamiany tekstu na mowę na zasób usługi Mowa. O ile nie określono inaczej, limity nie są regulowane.

Typowe limity przydziału i limity zamiany tekstu na mowę

limit przydziału Bezpłatna (F0) Standardowa (S0)
Maksymalna liczba transakcji na okres dla wstępnie utworzonych głosów neuronowych i niestandardowych głosów neuronowych. 20 transakcji na 60 sekund

Ten limit nie jest regulowany.
200 transakcji na sekundę (TPS) (wartość domyślna)

Szybkość jest regulowana do 1000 TPS dla zasobów standardowych (S0). Zapoznaj się z dodatkowymi wyjaśnieniami, najlepszymi rozwiązaniami i instrukcjami dotyczącymi korekt.
Maksymalna długość dźwięku utworzona na żądanie 10 min 10 min
Maksymalna łączna liczba unikatowych <voice> i <audio> tagów w języku SSML 50 50
Maksymalny rozmiar komunikatu SSML na kolei dla protokołu websocket 64 KB 64 KB

Niestandardowy neuronowy głos

limit przydziału Bezpłatna (F0) Standardowa (S0)
Maksymalna liczba transakcji na sekundę (TPS) Niedostępne dla F0 200 transakcji na sekundę (TPS) (wartość domyślna)
Maksymalna liczba zestawów danych Nie dotyczy 500
Maksymalna liczba równoczesnych przekazań zestawów danych Nie dotyczy 5
Maksymalny rozmiar pliku danych na potrzeby importowania danych na zestaw danych Nie dotyczy 2 GB
Przekazywanie długich audio lub audio bez skryptu Nie dotyczy Tak
Maksymalna liczba równoczesnych szkoleń modelu Nie dotyczy 3
Maksymalna liczba niestandardowych punktów końcowych Nie dotyczy 50

Narzędzie do tworzenia zawartości audio

limit przydziału Bezpłatna (F0) Standardowa (S0)
Rozmiar pliku 3000 znaków na plik 20 000 znaków na plik
Eksportowanie do biblioteki audio 1 współbieżne zadanie Nie dotyczy

Limity przydziału i limity rozpoznawania osoby mówiącej na zasób

Rozpoznawanie osoby mówiącej jest ograniczone do 20 transakcji na sekundę (TPS).

Szczegółowy opis, korekta limitu przydziału i najlepsze rozwiązania

Niektóre limity przydziału usługi Mowa są regulowane. Ta sekcja zawiera dodatkowe wyjaśnienia, najlepsze rozwiązania i instrukcje dotyczące dostosowywania.

Następujące limity przydziału są regulowane dla zasobów standardowych (S0). Limity żądań bezpłatnych (F0) nie są regulowane.

Przed zażądaniem zwiększenia limitu przydziału (jeśli ma to zastosowanie), upewnij się, że jest to konieczne. Usługa mowa używa technologii skalowania automatycznego, aby zapewnić wymagane zasoby obliczeniowe w trybie na żądanie. Jednocześnie usługa rozpoznawania mowy próbuje utrzymać niskie koszty, nie utrzymując nadmiernej ilości pojemności sprzętowej.

Spójrzmy na przykład. Załóżmy, że aplikacja otrzymuje kod odpowiedzi 429, co oznacza, że istnieje zbyt wiele żądań. Aplikacja otrzymuje tę odpowiedź, mimo że obciążenie mieści się w granicach zdefiniowanych przez odwołanie Limity przydziału i limity. Najbardziej prawdopodobnym wyjaśnieniem jest to, że usługa rozpoznawania mowy skaluje się w górę do zapotrzebowania i nie osiągnęła jeszcze wymaganej skali. W związku z tym usługa nie ma natychmiast wystarczającej ilości zasobów do obsłużenia żądania. W większości przypadków ten stan ograniczenia jest przejściowy.

Ogólne najlepsze rozwiązania dotyczące ograniczania przepustowości podczas skalowania automatycznego

Aby zminimalizować problemy związane z ograniczaniem przepustowości, warto użyć następujących technik:

  • Zaimplementuj logikę ponawiania prób w aplikacji.
  • Unikaj gwałtownych zmian w obciążeniu. Stopniowo zwiększaj obciążenie. Załóżmy na przykład, że aplikacja używa tekstu na mowę, a bieżące obciążenie to 5 TPS. Następna sekunda zwiększa obciążenie do 20 TPS (czyli cztery razy więcej). Usługa rozpoznawania mowy natychmiast rozpoczyna skalowanie w górę w celu spełnienia nowego obciążenia, ale nie może skalować w razie potrzeby w ciągu jednej sekundy. Niektóre żądania otrzymają kod odpowiedzi 429 (zbyt wiele żądań).
  • Testuj różne wzorce zwiększania obciążenia. Aby uzyskać więcej informacji, zobacz przykładowy wzorzec obciążenia.
  • Utwórz dodatkowe zasoby usługi Rozpoznawanie mowy w różnych regionach i rozłóż obciążenie między nimi. (Utworzenie wielu zasobów usługi Mowa w tym samym regionie nie wpłynie na wydajność, ponieważ wszystkie zasoby będą obsługiwane przez ten sam klaster zaplecza).

W następnych sekcjach opisano konkretne przypadki dostosowywania limitów przydziału.

Zamiana mowy na tekst: zwiększanie limitu żądań współbieżnych transkrypcji online

Domyślnie liczba równoczesnych żądań transkrypcji mowy na tekst w trybie online i połączonych żądań tłumaczenia mowy jest ograniczona do 100 na zasób w modelu podstawowym i 100 na niestandardowy punkt końcowy w modelu niestandardowym. W przypadku warstwy cenowej Standardowa można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Uwaga

Współbieżne limity żądań dla modeli podstawowych i niestandardowych muszą być dostosowywane oddzielnie. Możesz mieć zasób usługi Rozpoznawanie mowy skojarzony z wieloma niestandardowymi punktami końcowymi obsługującymi wiele wdrożeń modelu niestandardowego. W razie potrzeby należy zażądać oddzielnie korekt limitu dla niestandardowego punktu końcowego.

Zwiększenie limitu żądań współbieżnych nie wpływa bezpośrednio na koszty. Usługa mowa używa modelu płatności, który wymaga płacenia tylko za używane jednostki. Limit określa, jak wysoka może być skalowana usługa przed rozpoczęciem ograniczania żądań.

Nie można wyświetlić istniejącej wartości parametru limitu współbieżnych żądań w Azure Portal, narzędziach wiersza polecenia lub żądaniach interfejsu API. Aby sprawdzić istniejącą wartość, utwórz żądanie pomoc techniczna platformy Azure.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na których są hostowane. Kontenery mowy mają jednak własne ograniczenia pojemności, które należy wziąć pod uwagę. Aby uzyskać więcej informacji, zobacz Kontenery usługi Mowa — często zadawane pytania.

Przygotuj wymagane informacje

  • Dla modelu podstawowego:
    • Identyfikator zasobu usługi Mowa
    • Region (Region)
  • Dla modelu niestandardowego:
    • Region (Region)
    • Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące modelu podstawowego:

  1. Przejdź do witryny Azure Portal.
  2. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
  3. W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
  4. Skopiuj i zapisz wartości następujących pól:
    • Identyfikator zasobu
    • Lokalizacja (region punktu końcowego)

Jak uzyskać informacje dotyczące modelu niestandardowego:

  1. Przejdź do portalu usługi Speech Studio .
  2. Zaloguj się w razie potrzeby i przejdź do usługi Custom Speech.
  3. Wybierz projekt i przejdź do pozycji Wdrożenie.
  4. Wybierz wymagany punkt końcowy.
  5. Skopiuj i zapisz wartości następujących pól:
    • Region usługi (region punktu końcowego)
    • Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu współbieżnych żądań dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto kroki tej procedury:

  1. Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
  2. Przejdź do witryny Azure Portal.
  3. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
  4. W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowy wniosek o pomoc techniczną. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
  5. W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności zamiany mowy na tekst").
  6. W obszarze Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
  7. W podtypie Problem wybierz jedną z następujących pozycji:
    • Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
    • Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
  8. Wybierz pozycję Dalej: Rozwiązania. Kontynuuj tworzenie wniosku.
  9. Na karcie Szczegóły w polu Opis wprowadź następujące elementy:
    • Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany mowy na tekst.
    • Wybierz model podstawowy lub niestandardowy.
    • Zebrane wcześniej informacje o zasobie platformy Azure.
    • Wszelkie inne wymagane informacje.
  10. Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
  11. Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktujesz się z Twoim żądaniem.

Przykład najlepszych rozwiązań dotyczących wzorca obciążenia

Oto ogólny przykład dobrego podejścia do podjęcia. Jest to przeznaczone tylko jako szablon, który można dostosować zgodnie z potrzebami do własnego użytku.

Załóżmy, że zasób usługi Mowa ma limit współbieżnych żądań ustawiony na 300. Uruchom obciążenie z 20 połączeń współbieżnych i zwiększ obciążenie o 20 połączeń współbieżnych co 90–120 sekund. Kontroluj odpowiedzi usługi i zaimplementuj logikę, która spada (zmniejsza obciążenie), jeśli otrzymasz zbyt wiele żądań (kod odpowiedzi 429). Następnie ponów próbę zwiększenia obciążenia w ciągu jednej minuty i jeśli nadal nie zadziała, spróbuj ponownie w ciągu dwóch minut. Użyj wzorca 1-2-4-4 minut dla interwałów.

Ogólnie rzecz biorąc, bardzo dobrym pomysłem jest przetestowanie obciążenia i wzorców obciążeń przed przejściem do środowiska produkcyjnego.

Zamiana tekstu na mowę: zwiększanie limitu żądań współbieżnych

W przypadku standardowej warstwy cenowej można zwiększyć tę kwotę. Przed przesłaniem żądania upewnij się, że znasz materiał omówiony wcześniej w tym artykule, na przykład najlepsze rozwiązania w celu ograniczenia ograniczania przepustowości.

Zwiększenie limitu współbieżnych żądań nie wpływa bezpośrednio na koszty. Usługa mowa korzysta z modelu płatności, który wymaga płacenia tylko za to, czego używasz. Limit określa, jak wysoka może być skalowana usługa przed rozpoczęciem ograniczania żądań.

Nie można wyświetlić istniejącej wartości parametru limitu żądań współbieżnych w Azure Portal, narzędziach wiersza polecenia lub żądaniach interfejsu API. Aby sprawdzić istniejącą wartość, utwórz żądanie pomoc techniczna platformy Azure.

Uwaga

Kontenery mowy nie wymagają zwiększenia limitu żądań współbieżnych, ponieważ kontenery są ograniczone tylko przez procesory sprzętu, na który są hostowane.

Przygotowywanie wymaganych informacji

Aby utworzyć żądanie zwiększenia, musisz podać informacje.

  • Dla wstępnie utworzonego głosu:
    • Identyfikator zasobu usługi Mowa
    • Region (Region)
  • Dla głosu niestandardowego:
    • Region wdrażania
    • Identyfikator niestandardowego punktu końcowego

Jak uzyskać informacje dotyczące wstępnie utworzonego głosu:

  1. Przejdź do witryny Azure Portal.
  2. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć limit żądań współbieżności.
  3. W grupie Zarządzanie zasobami wybierz pozycję Właściwości.
  4. Skopiuj i zapisz wartości następujących pól:
    • Identyfikator zasobu
    • Lokalizacja (region punktu końcowego)

Jak uzyskać informacje o niestandardowym głosie:

  1. Przejdź do portalu usługi Speech Studio .
  2. Zaloguj się, jeśli jest to konieczne, a następnie przejdź do pozycji Niestandardowy głos.
  3. Wybierz projekt i przejdź do pozycji Deploy model (Wdrażanie modelu).
  4. Wybierz wymagany punkt końcowy.
  5. Skopiuj i zapisz wartości następujących pól:
    • Region usługi (region punktu końcowego)
    • Identyfikator punktu końcowego

Tworzenie i przesyłanie wniosku o pomoc techniczną

Zainicjuj zwiększenie limitu współbieżnych żądań dla zasobu lub w razie potrzeby sprawdź bieżący limit, przesyłając wniosek o pomoc techniczną. Oto kroki tej procedury:

  1. Upewnij się, że masz wymagane informacje wymienione w poprzedniej sekcji.
  2. Przejdź do witryny Azure Portal.
  3. Wybierz zasób usługi Mowa, dla którego chcesz zwiększyć (lub sprawdzić) limit żądań współbieżności.
  4. W grupie Pomoc techniczna i rozwiązywanie problemów wybierz pozycję Nowy wniosek o pomoc techniczną. Zostanie wyświetlone nowe okno z automatycznie wypełnionymi informacjami o subskrypcji platformy Azure i zasobie platformy Azure.
  5. W obszarze Podsumowanie opisz, co chcesz (na przykład "Zwiększ limit żądań współbieżności zamiany tekstu na mowę").
  6. W obszarze Typ problemu wybierz pozycję Problemy z limitem przydziału lub subskrypcją.
  7. W podtypie Problem wybierz jedną z następujących pozycji:
    • Zwiększenie limitu przydziału lub współbieżnych żądań dla żądania zwiększenia.
    • Sprawdzanie limitu przydziału lub użycia w celu sprawdzenia istniejącego limitu.
  8. Na karcie Zalecane rozwiązanie wybierz pozycję Dalej.
  9. Na karcie Dodatkowe szczegóły wypełnij wszystkie wymagane elementy. W polu Szczegóły wprowadź następujące elementy:
    • Zwróć uwagę, że żądanie dotyczy limitu przydziału zamiany tekstu na mowę.
    • Wybierz wstępnie utworzony głos lub niestandardowy głos.
    • Zebrane wcześniej informacje o zasobie platformy Azure.
    • Wszelkie inne wymagane informacje.
  10. Na karcie Przeglądanie i tworzenie wybierz pozycję Utwórz.
  11. Zanotuj numer wniosku o pomoc techniczną w powiadomieniach z witryny Azure Portal. Wkrótce skontaktujesz się z Twoim żądaniem.