소개
Azure AI 음성은 음성 지원 애플리케이션을 빌드하는 데 사용할 수 있는 API를 제공합니다. 다음 내용이 포함됩니다.
- 음성 텍스트 변환: 음성 인식(애플리케이션이 음성 입력을 받을 수 있음)을 지원하는 API입니다.
- 텍스트 음성 변환: 음성 합성(애플리케이션이 음성 출력을 제공할 수 있음)을 지원하는 API입니다.
- Speech Translation: 음성 입력을 여러 언어로 번역하는 데 사용할 수 있는 API입니다.
- Speaker Recognition: 애플리케이션이 음성에 따라 개별 화자를 인식할 수 있도록 지원하는 API입니다.
- 의도 인식: 대화 언어 이해를 사용하여 음성 입력의 의미 체계를 확인하는 API입니다.
이 모듈에서는 음성 지원 애플리케이션의 핵심 기능인 음성 인식과 음성 합성에 대해 중점적으로 알아봅니다.
이 모듈에서는 다음을 수행하는 방법을 알아봅니다.
- Azure AI 음성 서비스를 위한 Azure 리소스 프로비전
- 음성 텍스트 변환 API를 사용하여 음성 인식 구현하기
- 텍스트 음성 변환 API를 사용하여 음성 합성 구현하기
- 오디오 형식 및 음성 구성하기
- SSML(Speech Synthesis Markup Language) 사용하기
모듈의 단원에는 Azure AI 음성에 대한 중요한 개념 정보와 지원되는 SDK(소프트웨어 개발 키트) 중 하나를 통해 해당 API를 사용하는 방법이 포함되어 있습니다. 그런 다음 실습 연습에서 Azure AI 음성을 직접 사용해 볼 수 있습니다. 실습을 완료하려면 Microsoft Azure 구독이 필요합니다. 구독이 아직 없다면 https://azure.com/free에서 평가판을 신청할 수 있습니다.