Speech Service는 데이터를 가져오고, 모델을 만들고, 모델 정확도를 테스트하고, 사용자 지정 엔드포인트를 만들고, 일괄 처리 대화 내용 기록을 큐에 추가하고, 구독을 관리하는 데 사용되는 몇 가지 REST API와 상호 작용하는 Swagger 사양을 제공합니다. Speech Studio의 사용자 지정 음성 영역을 통해 사용할 수 있는 대부분의 작업은 이러한 API를 사용하여 프로그래밍 방식으로 완료할 수 있습니다.
참고 항목
Speech Service에는 음성 텍스트 변환 및 텍스트 음성 변환을 위한 몇 가지 REST API가 있습니다.
그러나 Swagger 사양에는 음성 텍스트 변환 REST API 및 사용자 지정 음성 REST API만 설명되어 있습니다. 다른 모든 Speech Services REST API에 대한 정보는 이전 단락에서 참조된 문서를 참조하세요.
Swagger 사양으로 코드 생성
Swagger 사양에는 다양한 경로를 신속하게 테스트할 수 있는 옵션이 포함되어 있습니다. 그러나 때로는 모든 경로에 대한 코드를 생성하고, 향후 솔루션 기반으로 사용할 수 있는 호출의 단일 라이브러리를 만드는 것이 바람직한 경우가 있습니다. 음성 텍스트 변환 REST API 버전 3.1용 Python 라이브러리를 생성하는 프로세스를 살펴보겠습니다.
Swagger를 음성 리소스의 지역으로 설정해야 합니다. Azure Portal에서 음성 리소스 설정의 개요 부분에 있는 지역을 확인할 수 있습니다. 지원되는 지역의 전체 목록은 여기에서 확인할 수 있습니다.
- 브라우저에서 https://editor.swagger.io으로 이동합니다.
- 파일을 선택하고 URL 가져오기를 선택한 다음,
- URL
https://github.com/Azure/azure-rest-api-specs/blob/master/specification/cognitiveservices/data-plane/Speech/SpeechToText/stable/v3.1/speechtotext.json
을 입력하고 확인을 선택합니다. -
클라이언트 생성을 선택한 다음, python을 선택합니다. 클라이언트 라이브러리는
.zip
파일의 컴퓨터에 다운로드합니다. - 다운로드에서 모든 항목을 추출합니다.
tar -xf
를 사용하여 모든 항목을 추출할 수 있습니다. - 추출된 모듈을 Python 환경에 설치합니다.
pip install path/to/package/python-client
- 설치된 패키지의 이름은
swagger_client
입니다. 설치가 성공했는지 확인합니다.
python -c "import swagger_client"
GitHub의 Speech Service 샘플로 생성한 Python 라이브러리를 사용할 수 있습니다.