Tłumaczenie mowy na tekst

3 min

Wzorzec tłumaczenia mowy przy użyciu zestawu AZURE AI Speech SDK jest podobny do rozpoznawania mowy, a dodanie informacji o językach źródłowych i docelowych do tłumaczenia:

Użyj obiektu SpeechTranslationConfig, aby hermetyzować informacje wymagane do nawiązania połączenia z zasobem usługi Azure AI Speech. W szczególności jego lokalizacja i klucz.
Obiekt SpeechTranslationConfig służy również do określania języka rozpoznawania mowy (języka, w którym mówi się mowę wejściową) i języków docelowych, w których ma zostać przetłumaczony.
Opcjonalnie użyj AudioConfig, aby zdefiniować źródło wejściowe dla dźwięku do transkrypcji. Domyślnie jest to domyślny mikrofon systemowy, ale można również określić plik dźwiękowy.
Użyj SpeechTranslationConfigi AudioConfig utworzyć obiekt TranslationRecognizer. Ten obiekt jest klientem proxy interfejsu API tłumaczenia mowy usługi Azure AI.
Użyj metod obiektu TranslationRecognizer w celu wywołania podstawowych funkcji interfejsu API. Na przykład metoda RecognizeOnceAsync() używa usługi Azure AI Speech do asynchronicznego tłumaczenia pojedynczej wypowiedzi mówionej.
Przetwarzanie odpowiedzi z usługi Azure AI Speech. W przypadku metody RecognizeOnceAsync() wynik jest obiektem SpeechRecognitionResult zawierającym następujące właściwości:
- Czas trwania
- OffsetInTicks
- Właściwości
- Powód
- ResultId
- Tekst
- Tłumaczenia

Jeśli operacja zakończyła się pomyślnie, właściwość Reason zawiera wyliczoną wartość RecognizedSpeech, właściwość text zawiera transkrypcję w oryginalnym języku. Możesz również uzyskać dostęp do właściwości Translations, która zawiera słownik tłumaczeń (przy użyciu dwuznakowego kodu języka ISO, takiego jak "en" dla języka angielskiego, jako klucza).

Tłumaczenie mowy na tekst

Opinia