다음을 통해 공유


텍스트 음성 변환을 위한 개인 보이스는 무엇인가요?

개인 보이스를 사용하면 사용자가 몇 초 만에 자신의 목소리가 복제된 AI 음성을 생성할 수 있습니다. 음성 설명과 짧은 음성 샘플을 오디오 프롬프트로 사용하면 사용자를 위한 개인 보이스를 생성할 수 있으며 사용자는 100개가 넘는 로캘에서 지원되는 90개가 넘는 언어로 음성을 생성할 수 있습니다.

참고 항목

개인 보이스는 서유럽, 미국 동부 및 동남 아시아 지역에서 사용할 수 있습니다. 지원되는 로캘은 개인 보이스 언어 지원을 참조하세요.

다음 표에서는 개인 보이스와 전문적인 사용자 지정 신경망 음성의 차이점을 요약합니다.

비교 개인 음성 전문 보이스
대상 시나리오 비즈니스 고객은 사용자가 앱에서 자신의 개인 보이스를 만들고 사용할 수 있도록 앱을 빌드합니다. 챗봇에 대한 브랜드 및 문자 음성 또는 오디오 콘텐츠 읽기와 같은 전문적인 시나리오
사용 사례 특정 사용 사례로 제한됩니다. 투명성 메모를 참조하세요. 승인된 고객은 1,000개 이상의 개인 보이스를 지원할 계획이 있어야 합니다. 특정 사용 사례로 제한됩니다. 투명성 메모를 참조하세요.
학습 데이터 사용 규정을 준수해야 합니다. 사용자 고유의 데이터를 가져옵니다 전문 스튜디오에서 녹음하는 것이 좋습니다.
필요한 데이터 크기 1분 분량의 인간 음성. 300~2,000개의 발화(약 30분~3시간 분량의 인간 음성).
학습 시간 5초 미만 약 20~40 컴퓨팅 시간
음성 품질 자연 매우 자연스러움
다국어 지원 예. 음성은 자동 언어 감지를 사용하도록 설정하여 약 100개 언어를 말할 수 있습니다. 예. 학습 데이터와 다른 언어를 사용하는 모델을 학습하려면 "인공신경망 - 교차 언어" 기능을 선택해야 합니다.
가용성 Speech Studio 데모는 등록 시 사용할 수 있습니다. API에 대한 액세스는 적격 고객 및 승인된 사용 사례로 제한됩니다. 접수 양식을 통해 액세스 권한을 요청하세요. 액세스가 승인된 후에만 CNV Pro 모델을 학습시키고 배포할 수 있습니다. CNV Pro 액세스는 자격 및 사용 조건에 따라 제한됩니다. 접수 양식을 통해 액세스 권한을 요청하세요.
가격 책정 여기1에서 가격 책정 세부 정보를 확인하세요. 여기의 가격 책정 세부 정보를 확인하세요.
책임 있는 AI 요구 사항 화자의 음성 설명이 필요합니다. 승인되지 않은 사용 사례는 허용되지 않습니다. 화자의 음성 설명이 필요합니다. 승인되지 않은 사용 사례는 허용되지 않습니다.

1 개인 음성 가격은 서유럽, 미국 동부 및 동남 아시아를 포함하여 기능을 사용할 수 있는 서비스 지역에만 표시됩니다.

데모 사용해 보기

S0 리소스가 있는 경우 Speech Studio에서 개인 음성 데모에 액세스할 수 있습니다. 개인 음성 API를 사용하기 위해 여기에서 액세스 권한을 신청할 수 있습니다.

  1. Speech Studio로 이동합니다.

  2. 개인 보이스 카드를 선택합니다.

  3. 고유의 음성을 녹음하고 다양한 언어로 음성 출력 샘플을 사용해 볼 수 있습니다. 데모에는 개인 보이스에서 지원하는 언어의 하위 집합이 포함되어 있습니다.

    Speech Studio의 개인 음성 데모 환경 스크린샷.

개인 보이스를 만드는 방법

시작하기 위해 개인 보이스를 만드는 단계에 대한 요약은 다음과 같습니다.

  1. 프로젝트를 만듭니다.
  2. 동의 파일 업로드. 개인 보이스 기능을 사용하려면 모든 음성을 사용자의 명시적 동의로 만들어야 합니다. 사용자의 기록된 문은 고객(Azure AI 음성 리소스 소유자)이 음성을 만들고 사용할 것임을 인정하는 데 필요합니다.
  3. 개인 보이스에 대한 화자 프로필 ID를 가져옵니다. 화자의 구두 동의서 및 오디오 프롬프트에 따라 화자 프로필 ID를 가져옵니다. 사용자의 음성 특성은 텍스트 음성 변환에 사용되는 speakerProfileId 속성에 인코딩됩니다.

개인 보이스가 있으면 이를 사용하여 100개 이상의 로캘에서 지원되는 91개 언어로 음성을 합성할 수 있습니다. 로캘 태그는 필요하지 않습니다. 개인 보이스는 문장 수준에서 자동 언어 감지를 사용합니다. 자세한 내용은 애플리케이션에 개인 보이스 사용을 참조하세요.

GitHub의 Speech SDK 리포지토리에 있는 코드 샘플을 확인하여 애플리케이션에서 개인 보이스를 사용하는 방법을 확인합니다.

참조 설명서

책임 있는 AI

Microsoft는 AI를 사용하는 사람들과 기술에 관심이 있는 만큼 AI의 영향을 받는 사람들을 중요하게 여깁니다. 자세한 내용은 책임 있는 AI 투명성 고지를 참조하세요.

다음 단계