번역 합성
TranslationRecognizer는 음성 입력의 번역된 전사를 반환하며, 기본적으로 가청 음성을 텍스트로 번역합니다.
번역을 음성으로 합성하여 음성 음성 변환 솔루션을 만들 수도 있습니다. 이 작업을 수행하는 방법에는 두 가지가 있습니다.
이벤트 기반 합성
1:1 번역을 수행하려는 경우(한 원본 언어에서 단일 대상 언어로 번역) 이벤트 기반 합성을 사용하여 번역을 오디오 스트림으로 캡처할 수 있습니다. 이렇게 하려면 다음을 수행해야 합니다.
TranslationConfig에서 번역된 음성에 원하는 음성을 지정합니다. TranslationRecognizer 개체의 합성 이벤트에 대한 이벤트 처리기를 만듭니다. 이벤트 처리기에서 Result 매개 변수의 GetAudio() 메서드를 사용하여 번역된 오디오의 바이트 스트림을 검색합니다. 이벤트 처리기를 구현하는 데 사용되는 특정 코드는 사용 중인 프로그래밍 언어에 따라 달라집니다. Speech SDK 설명서에서 C# 및 Python 예제를 참조하세요.
수동 합성
수동 합성은 이벤트 처리기를 구현할 필요가 없는 이벤트 기반 합성에 대한 대체 방법입니다. 수동 합성을 사용하여 하나 이상의 대상 언어에 대한 오디오 번역을 생성할 수 있습니다.
번역의 수동 합성은 기본적으로 다음과 같은 두 가지 개별 연산의 조합일 뿐입니다.
- TranslationRecognizer를 사용하여 음성 입력을 하나 이상의 대상 언어로 텍스트 전사로 번역합니다.
- 번역 작업 결과의 번역 사전을 반복하여, SpeechSynthesizer를 사용하여 각 언어에 대한 오디오 스트림을 합성합니다.