Custom Voice에서 사용자 지정 신경망 음성으로 마이그레이션

아티클
03/05/2024

Important

사용자 지정 음성의 표준 비신경망 학습 계층은 2024년 2월 29일부터 사용 중지됩니다. 2024년 2월 29일 이전에 Speech 리소스에 비신경망 사용자 지정 음성을 사용할 수 있습니다. 이제 음성 리소스에 사용자 지정 신경망 음성만 사용할 수 있습니다. 신경망이 아닌 사용자 지정 음성이 있는 경우 사용자 지정 신경망 음성으로 마이그레이션해야 합니다.

사용자 지정 신경망 음성을 사용하면 더 적은 데이터를 요구하면서 고품질 음성 모델을 구축할 수 있습니다. 보다 현실적이고 자연스러우며 대화형 음성을 키울 수 있습니다. 고객과 최종 사용자는 책임감 있는 방식으로 최신 Text to Speech 기술을 활용할 수 있습니다.

사용자 지정 음성	사용자 지정 신경망 음성
음성 언어를 음성 조각으로 구분하는 Custom Voice의 표준 또는 "기존" 방법으로, 기존 프로그래밍 또는 통계 방법을 사용하여 다시 혼합해서 일치시킬 수 있습니다.	사용자 지정 신경망 음성은 고전적 프로그래밍이나 통계 방법을 사용하는 대신 윗주와 자연인의 음성을 결합하는 방식을 "학습"한 심층 신경망을 사용하여 음성을 합성합니다.
Custom Voice¹는 더 인간과 유사한 음성 모델을 생성하기 위해 대용량의 음성 데이터가 필요합니다. 녹음된 줄이 적어 표준 사용자 지정 음성 모델은 더 명확하게 로봇처럼 들리는 경향이 있습니다.	사용자 지정 신경망 음성 기능을 사용하면 작은 녹음 세트를 사용하여 여러 언어 및 스타일로 고유한 브랜드 음성을 만들 수 있습니다.

¹ Custom Voice 모델을 생성할 때 구독당 가져올 수 있는 최대 데이터 파일 수는 무료 구독(F0) 사용자의 경우 10개의 .zip 파일이고 표준 구독(S0) 사용자의 경우 500개입니다.

필요한 동작

사용자 지정 신경망 음성으로 마이그레이션하려면 먼저 애플리케이션을 수락해야 합니다. 사용자 지정 신경망 음성 서비스에 대한 액세스 권한은 Microsoft가 적격 기준에 따라 단독 재량으로 결정합니다. Microsoft의 책임 있는 AI 원칙 및 사용 규정에 따라 사용자 지정 신경망 음성을 사용하기로 약속해야 합니다.

팁

Azure 계정이 없어도 Speech Studio에서 음성 샘플을 듣고 비즈니스 요구 사항에 적합한 음성을 결정할 수 있습니다.

액세스 제한 정책에 대해 자세히 알아보고 여기에서 신청합니다.
애플리케이션이 승인되면 "신경망" 학습 기능에 대한 액세스 권한이 제공됩니다. 애플리케이션에서 제공하는 것과 동일한 Azure 구독을 사용하여 Speech Studio 에 로그인해야 합니다.
사용자 지정 음성 모델을 학습시키고 배포하려면 먼저 성우 프로필을 만들어야 합니다. 이 프로필에는 자신의 음성 데이터를 사용하여 사용자 지정 음성 모델을 학습시키는 데 동의한 성우가 녹음한 오디오 파일이 필요합니다.
새 모델을 사용하여 새 엔드포인트를 만든 경우 앱에서 코드를 업데이트합니다.

Custom Voice 세부 정보(사용되지 않음)

Custom Voice에 대한 자세한 내용은 다음 섹션을 참조하세요.

언어 지원

Custom Voice은 다음 언어(로캘)를 지원합니다.

언어	로캘
중국어(북경어, 간체)	`zh-CN`
중국어(북경어, 간체), 영어 이중 언어	`zh-CN` 이중 언어
영어(인도)	`en-IN`
영어(영국)	`en-GB`
영어(미국)	`en-US`
프랑스어(프랑스)	`fr-FR`
독일어(독일)	`de-DE`
이탈리아어(이탈리아)	`it-IT`
포르투갈어(브라질)	`pt-BR`
스페인어(멕시코)	`es-MX`

국가별 지원

사용자 지정 음성 글꼴을 만든 경우 만든 엔드포인트를 사용합니다. 이 섹션에 나열된 엔드포인트를 사용하여 음성 모델의 배포 ID로 바꿀 {deploymentId} 수도 있습니다.

지역	엔드포인트
오스트레일리아 동부	`https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
브라질 남부	`https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
캐나다 중부	`https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 중부	`https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
동아시아	`https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 동부	`https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 동부 2	`https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
프랑스 중부	`https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
인도 중부	`https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
일본 동부	`https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
일본 서부	`https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
한국 중부	`https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 중북부	`https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
북유럽	`https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 중남부	`https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
동남아시아	`https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
영국 남부	`https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
서유럽	`https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 중서부	`https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 서부	`https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
미국 서부 2	`https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`

다음 단계

사용자 지정 신경망 음성 사용해 보기

Share via