콜 센터 개요

Azure AI 언어 및 Azure AI 음성은 전화 통신 기반 고객 상호 작용의 부분 또는 전체 자동화를 실현하고 여러 채널에서 접근성을 제공하는 데 도움이 될 수 있습니다. Language 및 Speech Service를 사용하면 콜 센터 대화 내용 기록을 추가로 분석하고, 대화 PII를 추출 및 수정하고, 대화 내용 기록을 요약하고, 감정을 감지할 수 있습니다.

콜 센터 및 연락 센터에서 Azure AI 서비스를 구현하기 위한 몇 가지 예제 시나리오는 다음과 같습니다.

  • 가상 에이전트: 대화형 AI 기반 전화 통합 음성 봇 및 음성 사용 챗봇
  • 상담원 지원: 상담원에게 인사이트를 제공하고 조치를 제안하여 고객 환경을 향상시키기 위한 통화의 실시간 대화 내용 기록 및 분석
  • 통화 후 분석: 통화 후 분석을 통해 고객 대화에 대한 인사이트를 만들어 이해를 높이고 통화 처리, 품질 보증 최적화 및 규정 준수 제어, 기타 인사이트 기반 최적화를 지속적으로 향상시킬 수 있습니다.

Language 및 Speech Service를 사용하여 콜센터 대화를 분석하는 방법에 대한 데모를 보려면 Language Studio 또는 Speech Studio를 사용해 보세요.

코드 없는 접근 방식을 사용하여 콜 센터 대화 내용 기록 솔루션을 Azure에 배포하려면 수집 클라이언트를 사용해 보세요.

콜 센터에 대한 Azure AI 서비스 기능

전체적인 콜 센터 구현은 일반적으로 Language 및 Speech Service의 기술을 통합합니다.

일반적으로 유선 전화, 휴대폰 및 라디오를 통해 생성된 콜 센터에서 사용되는 오디오 데이터는 종종 8KHz 범위의 협대역이므로 음성을 텍스트로 변환할 때 문제가 발생할 수 있습니다. Speech Service 인식 모델은 고품질 대화 내용 기록을 얻을 수 있도록 학습되지만 오디오를 캡처하도록 선택합니다.

오디오가 Speech Service를 사용하여 전사되면 Language Service를 사용하여 감정 분석, 고객 통화 이유 요약, 해결 방법, 대화 PII 추출 및 수정 등과 같은 콜 센터 데이터에 대한 분석을 수행할 수 있습니다.

Speech Service

Speech Service는 콜 센터 사용 사례에 사용할 수 있는 다음과 같은 기능을 제공합니다.

  • 실시간 음성 텍스트 변환: 여러 입력에서 오디오를 실시간으로 인식하고 대화 내용을 기록합니다. 예를 들어 가상 에이전트 또는 에이전트 지원을 사용하면 오디오 입력을 지속적으로 인식하고 여러 이벤트를 기반으로 하여 결과를 처리하는 방법을 제어할 수 있습니다.
  • 음성 텍스트 변환 일괄 처리: 화자 분할을 포함하여 많은 양의 오디오 파일을 비동기적으로 대화 내용을 기록하며, 일반적으로 통화 후 분석 시나리오에 사용됩니다. 분할은 모노 채널 오디오 데이터에서 화자를 인식하고 분리하는 프로세스입니다.
  • 텍스트 음성 변환: 텍스트 음성 변환을 사용하면 애플리케이션, 도구 또는 디바이스에서 텍스트를 인간과 같은 합성된 음성으로 변환할 수 있습니다.
  • 화자 식별: 등록된 화자 그룹 내에서 알 수 없는 화자의 ID를 확인하는 데 도움이 되며, 일반적으로 콜 센터 고객 검증 시나리오 또는 사기 감지에 사용됩니다.
  • 언어 식별: 오디오에서 말하는 언어(예: 가상 에이전트의 출력 언어)를 식별하고, 실시간 분석 및 통화 후 분석에 사용하여 인사이트를 얻거나 환경을 제어할 수 있습니다.

Speech Service는 미리 빌드된 모델에서 잘 작동합니다. 그러나 제품 또는 환경에 맞게 환경을 추가로 사용자 지정하고 튜닝할 수 있습니다. Speech 사용자 지정의 일반적인 예는 다음과 같습니다.

Speech 사용자 지정 설명
사용자 지정 음성 사용되는 음성 텍스트 변환 기능은 사용 사례별 엔터티(예: 영숫자 고객, 사례 및 계약 ID, 번호판 및 이름)의 음성 인식 정확도를 평가하고 향상시킵니다. 고유한 제품 이름과 업계 용어를 사용하여 사용자 지정 모델을 학습시킬 수도 있습니다.
사용자 지정 신경망 음성 애플리케이션에 대한 특별한 사용자 지정 합성 음성을 만들 수 있는 텍스트 음성 변환 기능입니다.

언어 서비스

Language Service는 콜 센터 사용 사례에 사용할 수 있는 다음과 같은 기능을 제공합니다.

  • PII(개인 식별 정보) 추출 및 수정: 대화 기록에서 중요한 정보를 식별, 분류 및 수정합니다.
  • 대화 요약: 각 대화 참가자가 문제 및 해결 방법에 대해 말한 내용을 추상적인 텍스트로 요약합니다. 예를 들어 콜 센터는 양이 많은 제품 문제를 그룹화할 수 있습니다.
  • 감정 분석 및 오피니언 마이닝: 대화 내용 기록을 분석하고, 긍정적, 중립적 또는 부정적 감정을 발화 및 대화 수준에서 연결합니다.

Language Service는 미리 빌드된 모델에서 잘 작동하지만, 데이터에서 더 많은 정보를 추출하기 위해 모델을 추가로 사용자 지정하고 튜닝해야 할 수 있습니다. Language 사용자 지정의 일반적인 예는 다음과 같습니다.

언어 사용자 지정 설명
사용자 지정 NER(명명된 엔터티 인식) 대화 내용 기록에서 엔터티의 검색 및 추출을 향상시킵니다.
사용자 지정 텍스트 분류 전사된 발화를 단일 또는 다중 분류를 사용하여 분류하고 레이블을 지정합니다.

모든 Language Service 기능 및 사용자 지정 옵션에 대한 개요는 여기서 확인할 수 있습니다.

다음 단계