개인 음성 프로젝트에 사용자 동의 추가
개인 보이스 기능을 사용하려면 모든 음성을 사용자의 명시적 동의로 만들어야 합니다. 사용자의 기록된 문은 고객(Azure AI 음성 리소스 소유자)이 음성을 만들고 사용할 것임을 인정하는 데 필요합니다.
개인 보이스 프로젝트에 사용자 동의를 추가하려면 공개적으로 액세스할 수 있는 URL(Consents_Create)에서 사전 녹음된 동의 오디오 파일을 제공하거나 오디오 파일(Consents_Post)을 업로드합니다.
동의 문
동의 문을 말하는 사용자의 오디오 녹음이 필요합니다.
텍스트 음성 변환 GitHub 리포지토리로 각 로캘에 대한 동의 문 텍스트를 가져올 수 있습니다. verbal-statement-all-locales.txt에서 동의문을 참조하세요. 다음은 en-US
로캘에 대한 샘플입니다.
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
동의 오디오에 지원되는 오디오 형식
동의 오디오 파일에 대해 지원되는 형식은 아래 표를 참조하세요.
형식 | 샘플 속도 | 비트 전송률: | 비트 수준 |
---|---|---|---|
mp3 | 16kHz, 24kHz, 44.1kHz, 48kHz | 128kbps, 192kbps, 256kbps, 320kbps | / |
wav | 16kHz, 24kHz, 44.1kHz, 48kHz | / | 16비트, 24비트, 32비트 |
파일에서 동의 추가
이 시나리오에서는 오디오 파일을 로컬로 사용할 수 있어야 합니다.
로컬 오디오 파일에서 개인 보이스 프로젝트에 동의를 추가하려면 사용자 지정 음성 API의 Consents_Post
작업을 사용합니다. 다음 지침에 따라 요청 본문을 생성합니다.
- 필수
projectId
속성을 설정합니다. 프로젝트 만들기를 참조하세요. - 필수
voiceTalentName
속성을 설정합니다. 성우 이름은 나중에 변경할 수 없습니다. - 필수
companyName
속성을 설정합니다. 회사 이름은 나중에 변경할 수 없습니다. - 동의 오디오 파일을 사용하여 필수
audiodata
속성을 설정합니다. - 필수
locale
속성을 설정합니다. 동의의 로캘이어야 합니다. 로캘은 나중에 변경할 수 없습니다. 여기에서 텍스트 음성 변환 로캘 목록을 찾을 수 있습니다.
다음 Consents_Post
예제와 같이 URI를 사용하여 HTTP POST 요청을 수행합니다.
YourResourceKey
를 Speech 리소스 키로 바꿉니다.YourResourceRegion
을 음성 리소스 지역으로 바꿉니다.JessicaConsentId
를 선택한 동의 ID로 대체합니다. 대/소문자 구분 ID는 동의 URI에 사용되며 나중에 변경할 수 없습니다.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
응답 본문은 다음 형식으로 표시되어야 합니다.
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
응답 헤더에는 Operation-Location
속성이 포함되어 있습니다. 이 URI를 사용하여 Consents_Post
작업에 대한 세부 정보를 가져옵니다. 응답 헤더의 예는 다음과 같습니다.
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314
URL에서 동의 추가
이 시나리오에서는 오디오 파일이 Azure Blob Storage 컨테이너에 이미 저장되어 있어야 합니다.
오디오 파일의 URL에서 개인 보이스 프로젝트에 대한 동의를 추가하려면 사용자 지정 음성 API의 Consents_Create 작업을 사용합니다. 다음 지침에 따라 요청 본문을 생성합니다.
- 필수
projectId
속성을 설정합니다. 프로젝트 만들기를 참조하세요. - 필수
voiceTalentName
속성을 설정합니다. 성우 이름은 나중에 변경할 수 없습니다. - 필수
companyName
속성을 설정합니다. 회사 이름은 나중에 변경할 수 없습니다. - 필수
audioUrl
속성을 설정합니다. 성우 동의 오디오 파일의 URL입니다. SAS(공유 액세스 서명) 토큰과 함께 URI를 사용합니다. - 필수
locale
속성을 설정합니다. 동의의 로캘이어야 합니다. 로캘은 나중에 변경할 수 없습니다. 여기에서 텍스트 음성 변환 로캘 목록을 찾을 수 있습니다.
다음 Consents_Create 예제와 같이 URI를 사용하여 HTTP PUT 요청을 수행합니다.
YourResourceKey
를 Speech 리소스 키로 바꿉니다.YourResourceRegion
을 음성 리소스 지역으로 바꿉니다.JessicaConsentId
를 선택한 동의 ID로 대체합니다. 대/소문자 구분 ID는 동의 URI에 사용되며 나중에 변경할 수 없습니다.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
응답 본문은 다음 형식으로 표시되어야 합니다.
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
응답 헤더에는 Operation-Location
속성이 포함되어 있습니다. 이 URI를 사용하여 Consents_Create 작업에 대한 세부 정보를 가져옵니다. 응답 헤더의 예는 다음과 같습니다.
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314