음성을 텍스트로 변환

완료됨

Azure AI Speech SDK를 사용한 음성 번역 패턴은 음성 인식과 유사하며 번역용 원본 및 대상 언어에 대한 정보가 추가됩니다.

A TranslationRecognizer object is created from a SpeechConfig, TranslationConfig, and AudioConfig; and its RecognizeOnceAsync method is used to call the Speech API.

  1. SpeechTranslationConfig 개체를 사용하여 Azure AI 음성 리소스에 연결하는 데 필요한 정보를 캡슐화합니다. 이러한 정보는 구체적으로 해당하는 위치 및 키입니다.

  2. 또한 SpeechTranslationConfig 개체는 음성 인식 언어(입력 음성으로 말하는 언어)와 번역할 대상 언어를 지정하는 데 사용됩니다.

  3. 선택적으로 AudioConfig를 사용하여 전사할 오디오의 입력 원본을 정의할 수 있습니다. 기본적으로 이는 기본 시스템 마이크이지만 오디오 파일을 지정할 수도 있습니다.

  4. SpeechTranslationConfigAudioConfig를 사용하여 TranslationRecognizer 개체를 만듭니다. 이 개체는 Azure AI 음성 번역 API에 대한 프록시 클라이언트입니다.

  5. TranslationRecognizer 개체의 메서드를 사용하여 기본 API 함수를 호출합니다. 예를 들어, RecognizeOnceAsync() 메서드는 Azure AI 음성 서비스를 사용하여 단일 음성 발언을 비동기적으로 번역합니다.

  6. Azure AI 음성의 응답을 처리합니다. RecognizeOnceAsync() 메서드의 경우 결과는 다음 속성을 포함하는 SpeechRecognitionResult 개체입니다.

    • Duration
    • OffsetInTicks
    • 속성
    • 이유
    • ResultId
    • 텍스트
    • Translations

작업이 성공적으로 수행되면 Reason 속성이 열거형 값 RecognizedSpeech를 포함하고 Text 속성이 원래 언어의 대화 내용 기록을 포함합니다. 번역 사전이 포함된 Translations 속성에 액세스할 수도 있습니다(영어의 경우 "en"과 같은 두 문자 ISO 언어 코드를 키로 사용).