통화 중 오디오 재생

2025-06-05

Azure Communication Services 통화 자동화 SDK를 통해 제공되는 재생 작업을 사용하면 통화 참가자에게 오디오 프롬프트를 재생할 수 있습니다. 이 작업은 애플리케이션의 서버 쪽 구현을 통해 액세스할 수 있습니다. 오디오를 재생하여 두 가지 방법 중 하나를 통해 참가자에게 전화를 걸 수 있습니다.

Azure Communication Services에서 인증 지원을 통해 액세스할 수 있는 WAV 형식으로 미리 녹음된 오디오 파일에 대한 액세스 권한을 제공합니다.
Azure AI 서비스와의 통합을 통해 음성 출력으로 변환할 수 있는 일반 텍스트입니다.

새로 발표된 Azure Communication Services 및 Azure AI 서비스 간의 통합을 사용하여 Azure 텍스트 음성 변환을 사용하여 맞춤형 응답을 재생할 수 있습니다. 즉시 사용 가능한 인간과 유사한 미리 빌드된 인공신경망 음성을 사용하거나 제품 또는 브랜드에 고유한 사용자 지정 신경망 음성을 만들 수 있습니다. 지원되는 음성, 언어 및 로캘에 대한 자세한 내용은 Speech Service에 대한 언어 및 음성 지원을 참조하세요.

참고 항목

Azure Communication Services는 현재 16KHz로 녹음된 16비트 PCM(펄스 코드 변조) 모노 채널 오디오로 포맷된 WAV 파일과 ID3V2TAG 있는 MP3 파일의 두 가지 파일 형식을 지원합니다. 오디오 콘텐츠 만들기 도구를 통해 음성 합성을 사용하여 고유한 오디오 파일을 만들 수 있습니다.

미리 빌드된 인공신경망 텍스트 음성 변환 음성

Microsoft는 고급 기계 학습을 사용하여 음성 언어로 스트레스와 인톤을 처리하는 데 사용되는 기존 음성 합성의 한계를 극복합니다. 운율 예측 및 음성 합성은 동시에 발생하여 더 부드럽고 자연스럽게 들리는 출력이 생성됩니다. 이러한 인공신경망 음성을 사용하여 챗봇 및 음성 도우미와의 상호 작용을 보다 자연스럽고 매력적으로 만들 수 있습니다. 100개가 넘는 미리 작성된 음성 중에서 선택할 수 있습니다. Azure 텍스트 음성 변환 음성에 대해 자세히 알아봅니다.

일반 사용 예

재생 작업은 여러 가지 방법으로 사용할 수 있으며 개발자가 애플리케이션에서 재생 작업을 사용하는 방법에 대한 몇 가지 예제가 여기에 나열되어 있습니다.

알림

참가자가 통화에 참가하거나 통화에서 나갈 때 애플리케이션은 다른 사용자에게 알리기 위해 공지를 재생할 수 있습니다.

셀프 서비스 고객

IVR(Interactive Voice Response) 시스템 및 가상 도우미를 사용하는 시나리오에서는 애플리케이션 또는 봇을 사용하여 호출자에게 오디오 프롬프트를 재생할 수 있습니다. 이 프롬프트는 해당 상호 작용을 통해 호출자를 안내하는 메뉴 형식일 수 있습니다.

대기 음악

재생 동작을 사용하여 호출자에게 대기 음악을 재생할 수도 있습니다. 이 작업은 에이전트가 호출자를 응대할 수 있을 때까지 음악이 계속 반복 재생되도록 설정할 수 있습니다.

규정 준수 메시지 재생

다양한 산업의 규정 준수 요구 사항의 일환으로 공급업체는 "이 호출은 품질 목적으로 기록됩니다."와 같이 발신자에게 법적 또는 규정 준수 메시지를 재생할 것으로 예상됩니다.

텍스트 음성 변환을 사용하여 통화에서 오디오를 재생하기 위한 샘플 아키텍처

AI로 플레이하기 위한 샘플 아키텍처를 보여 주는 다이어그램.

통화에서 오디오를 재생하기 위한 샘플 아키텍처

재생 동작에 대한 흐름의 스크린샷.

알려진 제한 사항

텍스트 음성 변환 프롬프트는 최대 4,000자를 지원합니다. 프롬프트가 이 제한보다 긴 경우 텍스트 음성 변환 기반 재생 작업에 SSML(Speech Synthesis Markup Language)을 사용하는 것이 좋습니다.
Azure AI Foundry의 HD 음성은 공식적으로 지원되지 않습니다. 이러한 음성을 사용하면 시간 제한이 발생합니다.
음성 서비스 할당량 한도를 초과하는 시나리오의 경우 여기에 설명된 단계에 따라 이 한도 증가를 요청할 수 있습니다.

다음 단계

사용자에게 사용자 지정 음성 프롬프트를 재생하는 방법을 알아보려면 방법 가이드를 확인하세요.
통화 자동화에서 게시한 사용량 및 운영 로그에 대해 알아봅니다.
고객 입력 수집에 대해 알아봅니다.