Usługa rozpoznawania mowy w suwerennych chmurach

Chmury suwerenne Azure to odizolowane platformy krajowe/regionalne z niezależnym uwierzytelnianiem, przechowywaniem i wymaganiami dotyczącymi zgodności. Suwerenne chmury są często używane w granicach geograficznych, w których istnieje ścisłe wymaganie dotyczące rezydencji danych.

Azure Government (Stany Zjednoczone)

Dostępne tylko dla jednostek rządowych USA i ich partnerów. Aby uzyskać więcej informacji na temat Azure Government, zobacz dokumentację Azure Government i Porównaj Azure Government i Azure w regionach globalnych.

  • Azure Portal:
  • Regiony:
    • US Gov Arizona
    • US Gov Wirginia
  • Dostępne warstwy cenowe:
  • Obsługiwane funkcje:
    • Speech Studio
    • Zamiana mowy na tekst
      • Transkrypcja w czasie rzeczywistym
      • Transkrypcja wsadowa
      • Identyfikator języka
      • Dziennik mówcy
      • Mowa niestandardowa
    • Zamiana tekstu na mowę
      • Standardowy głos
      • Głos neuronowy
    • Tłumaczenie mowy
      • Tłumaczenie mowy w czasie rzeczywistym
    • Rozpoznawanie słów kluczowych
  • Nieobsługiwane funkcje:
    • Głos niestandardowy
    • Osobisty głos
    • Awatar Text to Speech
    • Szybka transkrypcja
    • Ocena wymowy
    • Niestandardowe słowo kluczowe
    • Głos na żywo
    • Tłumacz na żywo
    • Tłumaczenie wideo
    • Mowa LLM
  • Obsługiwane języki:
    • Tak samo jak chmury publiczne. Aby zapoznać się z listą obsługiwanych języków, zobacz Obsługa języka.

Informacje o punkcie końcowym

Ta sekcja zawiera informacje o punktach końcowych usługi Mowy na potrzeby użycia z Speech SDK, interfejsu API REST Przekształcanie mowy na tekst oraz interfejsu API REST Przekształcanie tekstu na mowę.

Note

W większości scenariuszy należy użyć niestandardowego formatu punktu końcowego domeny (https://<resource-name>.cognitiveservices.azure.us) zamiast punktów końcowych opartych na regionie. Jeśli jednak wdrożenie wymaga punktów końcowych opartych na regionie w Azure Government, stosowane są poniższe formaty punktów końcowych. Azure Government punkty końcowe używają sufiksów domeny .microsoft.us i .azure.us, które różnią się od standardowych punktów końcowych chmury publicznej.

REST API usługi rozpoznawania mowy

Punkty końcowe interfejsu API REST usługi Mowa w Azure Government mają następujący format:

Typ/operacja interfejsu API REST Format punktu końcowego
token dostępu https://<REGION_IDENTIFIER>.api.cognitive.microsoft.us/sts/v1.0/issueToken
Interfejs API REST zamiany mowy na tekst https://<REGION_IDENTIFIER>.api.cognitive.microsoft.us/<URL_PATH>
API REST do konwersji mowy na tekst dla krótkiego nagrania https://<REGION_IDENTIFIER>.stt.speech.azure.us/<URL_PATH>
interfejs API REST Zamiana tekstu na mowę https://<REGION_IDENTIFIER>.tts.speech.azure.us/<URL_PATH>

Zastąp <REGION_IDENTIFIER> identyfikatorem, który pasuje do regionu zasobu usługi Mowa z tej tabeli:

Identyfikator regionu
US Gov Arizona usgovarizona
US Gov Wirginia usgovvirginia

Zestaw SDK rozpoznawania mowy

W przypadku Speech SDK w chmurach suwerennych musisz użyć wystąpienia klasy SpeechConfig z opcją "z punktu końcowego/z punktem końcowym" lub opcji --endpointSpeech CLI.

SpeechConfig Klasę należy utworzyć w następujący sposób:

var config = SpeechConfig.Endpoint(new Uri(usGovEndpoint), subscriptionKey);

Interfejs wiersza polecenia usługi Mowa powinien być używany w następujący sposób (zwróć uwagę na --endpoint opcję):

spx recognize --endpoint "usGovEndpoint" --file myaudio.wav

Zastąp subscriptionKey swoim kluczem zasobu Speech. Zastąp usGovEndpoint punktem końcowym z portalu Azure.

Firma Microsoft Azure obsługiwana przez firmę 21Vianet

Dostępne dla organizacji z obecnością biznesową w Chinach. Aby uzyskać więcej informacji na temat platformy Microsoft Azure obsługiwanych przez firmę 21Vianet, zobacz omówienie Azure Chiny.

  • Azure Portal:
  • Regiony:
    • Chiny Wschodnie 2
    • Chiny Północne 2
    • Chiny Północne 3
  • Dostępne warstwy cenowe:
  • Obsługiwane funkcje:
    • Speech Studio
    • Zamiana mowy na tekst
      • Transkrypcja w czasie rzeczywistym
      • Transkrypcja wsadowa
      • Identyfikator języka
      • Dziennik mówcy
      • Mowa niestandardowa
    • Ocena wymowy
    • Zamiana tekstu na mowę
      • Standardowy głos
      • Głos neuronowy
    • Tłumaczenie mowy
      • Tłumaczenie mowy w czasie rzeczywistym
    • Rozpoznawanie słów kluczowych
  • Nieobsługiwane funkcje:
    • Głos niestandardowy
    • Osobisty głos
    • Awatar Text to Speech
    • Niestandardowe słowo kluczowe
    • Głos na żywo
    • Tłumacz na żywo
    • Tłumaczenie wideo
    • Mowa LLM
  • Obsługiwane języki:
    • Tak samo jak chmury publiczne. Aby zapoznać się z listą obsługiwanych języków, zobacz Obsługa języka.

Informacje o punkcie końcowym

Ta sekcja zawiera informacje o punktach końcowych usługi Mowy na potrzeby użycia z Speech SDK, interfejsu API REST Przekształcanie mowy na tekst oraz interfejsu API REST Przekształcanie tekstu na mowę.

Note

W większości scenariuszy należy użyć niestandardowego formatu punktu końcowego domeny (https://<resource-name>.cognitiveservices.azure.cn) zamiast punktów końcowych opartych na regionie. Jeśli jednak wdrożenie wymaga punktów końcowych opartych na regionie w Microsoft Azure obsługiwanych przez firmę 21Vianet, poniższe formaty punktów końcowych mają zastosowanie. Te punkty końcowe używają sufiksu .azure.cn domeny, który różni się od standardowych punktów końcowych chmury publicznej.

REST API usługi rozpoznawania mowy

Punkty końcowe interfejsu API REST usługi Mowa w Azure obsługiwane przez firmę 21Vianet mają następujący format:

Typ/operacja interfejsu API REST Format punktu końcowego
token dostępu https://<REGION_IDENTIFIER>.api.cognitive.azure.cn/sts/v1.0/issueToken
Interfejs API REST zamiany mowy na tekst https://<REGION_IDENTIFIER>.api.cognitive.azure.cn/<URL_PATH>
API REST do konwersji mowy na tekst dla krótkiego nagrania https://<REGION_IDENTIFIER>.stt.speech.azure.cn/<URL_PATH>
interfejs API REST Zamiana tekstu na mowę https://<REGION_IDENTIFIER>.tts.speech.azure.cn/<URL_PATH>

Zastąp <REGION_IDENTIFIER> identyfikatorem, który pasuje do regionu zasobu usługi Mowa z tej tabeli:

Identyfikator regionu
Chiny Wschodnie 2 chinaeast2
Chiny Północne 2 chinanorth2
Chiny Północne 3 chinanorth3

Zestaw SDK rozpoznawania mowy

W przypadku Speech SDK w chmurach suwerennych musisz użyć wystąpienia klasy SpeechConfig z opcją "z punktu końcowego/z punktem końcowym" lub opcji --endpointSpeech CLI.

SpeechConfig Klasę należy utworzyć w następujący sposób:

var config = SpeechConfig.Endpoint(new Uri(azCnEndpoint), subscriptionKey);

Interfejs wiersza polecenia usługi Mowa powinien być używany w następujący sposób (zwróć uwagę na --endpoint opcję):

spx recognize --endpoint "azCnEndpoint" --file myaudio.wav

Zastąp subscriptionKey swoim kluczem zasobu Speech. Zastąp azCnEndpoint punktem końcowym z portalu Azure.