연속 인식 음성 텍스트 변환 애플리케이션 만들기
이전 연습에서는 간단한 오디오 파일을 전사하기 위해 단일 샷 인식을 사용하는 애플리케이션을 만드는 방법을 알아보았습니다. 이 애플리케이션은 의료 고객이 제공하는 간단한 오디오 메모에 적합하지만 회사에서는 고객의 긴 받아쓰기 파일을 전사하는 데 사용할 수 있는 애플리케이션이 필요합니다.
이 점을 염두에 두고 다음 연습에서는 간단한 메모와 긴 받아쓰기 모두에서 작동하는 연속 인식을 사용하도록 기존 애플리케이션을 수정합니다. 연속 인식을 사용하면 음성 인식 프로세스를 보다 쉽게 제어할 수 있지만 애플리케이션에서 구현하려면 더 많은 코드가 필요합니다.
연속 인식을 사용하여 오디오 파일을 전사하는 애플리케이션 만들기
Azure AI 음성 연속 인식을 사용하여 음성 텍스트 변환 애플리케이션을 만들려면 애플리케이션에서 다음 작업을 모두 수행해야 합니다.
Microsoft.CognitiveServices.Speech
패키지를 포함합니다.Azure AI 서비스 계정의 API 키를 사용하여
SpeechConfig
클래스를 만듭니다.WAVE 파일을 원본으로 사용하여
AudioConfig
클래스를 만듭니다.SpeechConfig
및AudioConfig
클래스를 사용하여SpeechRecognizer
클래스를 만듭니다.SpeechRecognizer
클래스의 다음 이벤트를 구독합니다.Recognized
이벤트는 텍스트가 인식되었는지 여부를 검색합니다.Canceled
이벤트는 인식이 취소되었는지 여부를 감지합니다. 이는 오류 때문일 수 있습니다.SessionStopped
이벤트는 인식이 중지된 시기를 검색합니다.
변환된 텍스트를 파일에 쓰는
StreamWriter
클래스를 만듭니다.클래스의
StartContinuousRecognitionAsync()
메서드를SpeechRecognizer
호출하여 인식을 시작하고 인식을StopContinuousRecognitionAsync()
중지하는 메서드를 호출합니다.
다음 연습에서는 이러한 모든 단계를 자세히 살펴보겠습니다.