연속 인식 음성 텍스트 변환 애플리케이션 만들기

완료됨

이전 연습에서는 간단한 오디오 파일을 전사하기 위해 단일 샷 인식을 사용하는 애플리케이션을 만드는 방법을 알아보았습니다. 이 애플리케이션은 의료 고객이 제공하는 간단한 오디오 메모에 적합하지만 회사에서는 고객의 긴 받아쓰기 파일을 전사하는 데 사용할 수 있는 애플리케이션이 필요합니다.

이 점을 염두에 두고 다음 연습에서는 간단한 메모와 긴 받아쓰기 모두에서 작동하는 연속 인식을 사용하도록 기존 애플리케이션을 수정합니다. 연속 인식을 사용하면 음성 인식 프로세스를 보다 쉽게 제어할 수 있지만 애플리케이션에서 구현하려면 더 많은 코드가 필요합니다.

연속 인식을 사용하여 오디오 파일을 전사하는 애플리케이션 만들기

Azure AI 음성 연속 인식을 사용하여 음성 텍스트 변환 애플리케이션을 만들려면 애플리케이션에서 다음 작업을 모두 수행해야 합니다.

  • Microsoft.CognitiveServices.Speech 패키지를 포함합니다.

  • Azure AI 서비스 계정의 API 키를 사용하여 SpeechConfig 클래스를 만듭니다.

  • WAVE 파일을 원본으로 사용하여 AudioConfig 클래스를 만듭니다.

  • SpeechConfigAudioConfig 클래스를 사용하여 SpeechRecognizer 클래스를 만듭니다.

  • SpeechRecognizer 클래스의 다음 이벤트를 구독합니다.

    • Recognized 이벤트는 텍스트가 인식되었는지 여부를 검색합니다.
    • Canceled 이벤트는 인식이 취소되었는지 여부를 감지합니다. 이는 오류 때문일 수 있습니다.
    • SessionStopped 이벤트는 인식이 중지된 시기를 검색합니다.
  • 변환된 텍스트를 파일에 쓰는 StreamWriter 클래스를 만듭니다.

  • 클래스의 StartContinuousRecognitionAsync() 메서드를 SpeechRecognizer 호출하여 인식을 시작하고 인식을 StopContinuousRecognitionAsync() 중지하는 메서드를 호출합니다.

다음 연습에서는 이러한 모든 단계를 자세히 살펴보겠습니다.