다음을 통해 공유


통화 중 오디오 재생

Azure Communication Services 통화 자동화 SDK를 통해 제공되는 재생 작업을 사용하면 통화 참가자에게 오디오 프롬프트를 재생할 수 있습니다. 이 작업은 애플리케이션의 서버 쪽 구현을 통해 액세스할 수 있습니다. 오디오를 재생하여 두 가지 방법 중 하나를 통해 참가자에게 전화를 걸 수 있습니다.

  • Azure Communication Services가 인증을 지원하여 액세스할 수 있는 WAV 형식의 미리 녹음된 오디오 파일에 대한 Azure Communication Services 액세스 제공
  • Azure AI 서비스와의 통합을 통해 음성 출력으로 변환할 수 있는 일반 텍스트입니다.

새로 발표된 Azure Communication Services 및 Azure AI 서비스 간의 통합을 사용하여 Azure 텍스트 음성 변환을 사용하여 맞춤형 응답을 재생할 수 있습니다. 즉시 사용 가능한 인간과 유사한 미리 빌드된 인공신경망 음성을 사용하거나 제품 또는 브랜드에 고유한 사용자 지정 신경망 음성을 만들 수 있습니다. 지원되는 음성, 언어 및 로캘에 대한 자세한 내용은 Speech Service에 대한 언어 및 음성 지원을 참조하세요.

참고 항목

Azure Communication Services는 현재 16KHz에서 녹음된 16비트 PCM 모노 채널 오디오 형식으로 포맷된 ID3V2TAG 및 WAV 파일이 있는 MP3 파일의 두 가지 파일 형식을 지원합니다. 오디오 콘텐츠 만들기 도구를 통해 음성 합성을 사용하여 고유한 오디오 파일을 만들 수 있습니다.

미리 빌드된 인공신경망 텍스트 음성 변환 음성

Microsoft는 심층 신경망을 사용하여 음성 언어의 강세 및 억양과 관련하여 기존 음성 합성의 한계를 극복합니다. 운율 예측 및 음성 합성은 동시에 발생하여 더 부드럽고 자연스럽게 들리는 출력이 생성됩니다. 이러한 인공신경망 음성을 사용하여 챗봇 및 음성 도우미와의 상호 작용을 보다 자연스럽고 매력적으로 만들 수 있습니다. 100개가 넘는 미리 작성된 음성 중에서 선택할 수 있습니다. Azure 텍스트 음성 변환 음성에 대해 자세히 알아봅니다.

일반 사용 예

재생 작업은 여러 가지 방법으로 사용할 수 있으며 개발자가 애플리케이션에서 재생 작업을 사용하는 방법에 대한 몇 가지 예제가 여기에 나열되어 있습니다.

알림

참가자가 통화에 참가하거나 통화에서 나갈 때 애플리케이션은 다른 사용자에게 알리기 위해 공지를 재생할 수 있습니다.

셀프 서비스 고객

IVR 및 가상 도우미가 있는 시나리오에서는 애플리케이션 또는 봇을 사용하여 호출자에게 오디오 프롬프트를 재생할 수 있습니다. 이 프롬프트는 상호 작용을 통해 호출자에게 안내되는 메뉴 형식일 수 있습니다.

대기 음악

재생 동작을 사용하여 호출자에게 대기 음악을 재생할 수도 있습니다. 이 작업은 에이전트가 호출자를 응대할 수 있을 때까지 음악이 계속 반복 재생되도록 설정할 수 있습니다.

규정 준수 메시지 재생

다양한 산업의 규정 준수 요구 사항의 일환으로 공급업체는 "이 통화는 품질 관련 목적으로 기록됩니다"와 같이 발신자에게 법적 메시지 또는 규정 준수 메시지를 재생할 것으로 예상됩니다.

텍스트 음성 변환을 사용하여 통화에서 오디오를 재생하기 위한 샘플 아키텍처

AI로 플레이하기 위한 샘플 아키텍처를 보여 주는 다이어그램.

통화에서 오디오를 재생하기 위한 샘플 아키텍처

재생 동작에 대한 흐름의 스크린샷.

알려진 제한 사항

  • 텍스트 음성 변환 텍스트 프롬프트는 최대 400자를 지원합니다. 프롬프트가 이보다 긴 경우 텍스트 음성 변환 기반 재생 작업에 SSML을 사용하는 것이 좋습니다.
  • 음성 서비스 할당량 한도를 초과하는 시나리오의 경우 여기에 설명된 단계에 따라 이 한도 증가를 요청할 수 있습니다.

다음 단계