Tłumaczenie mowy na tekst

Ukończone

Wzorzec tłumaczenia mowy przy użyciu zestawu AZURE AI Speech SDK jest podobny do rozpoznawania mowy, a dodanie informacji o językach źródłowych i docelowych do tłumaczenia:

A TranslationRecognizer object is created from a SpeechConfig, TranslationConfig, and AudioConfig; and its RecognizeOnceAsync method is used to call the Speech API.

  1. Użyj obiektu SpeechTranslationConfig, aby hermetyzować informacje wymagane do nawiązania połączenia z zasobem usługi Mowa usługi Azure AI. W szczególności jego lokalizacja i klucz.

  2. Obiekt SpeechTranslationConfig służy również do określania języka rozpoznawania mowy (języka, w którym mowa wejściowa jest mówiona) i języków docelowych, w których ma zostać przetłumaczony.

  3. Opcjonalnie użyj pliku AudioConfig , aby zdefiniować źródło wejściowe dla dźwięku do transkrypcji. Domyślnie jest to domyślny mikrofon systemowy, ale można również określić plik dźwiękowy.

  4. Użyj obiektu SpeechTranslationConfig i AudioConfig , aby utworzyć obiekt TranslationRecognizer . Ten obiekt jest klientem proxy interfejsu API tłumaczenia mowy usługi Azure AI.

  5. Użyj metod obiektu TranslationRecognizer , aby wywołać podstawowe funkcje interfejsu API. Na przykład metoda RecognizeOnceAsync() używa usługi Azure AI Speech do asynchronicznego tłumaczenia pojedynczej wypowiedzi mówionej.

  6. Przetwarzanie odpowiedzi z usługi Azure AI Speech. W przypadku metody RecognizeOnceAsync() wynik jest obiektem SpeechRecognitionResult zawierającym następujące właściwości:

    • Czas trwania
    • OffsetInTicks
    • Właściwości
    • Przyczyna
    • ResultId
    • Text
    • Tłumaczenia

Jeśli operacja zakończyła się pomyślnie, właściwość Reason ma wyliczoną wartość RecognizedSpeech, właściwość Text zawiera transkrypcję w oryginalnym języku. Możesz również uzyskać dostęp do właściwości Translations , która zawiera słownik tłumaczeń (przy użyciu dwuznakowego kodu języka ISO, takiego jak "en" dla języka angielskiego, jako klucza).