개인 보이스 프로젝트에 사용자 동의 추가 - Speech Service - Azure AI services

아티클
09/27/2024

개인 보이스 기능을 사용하려면 모든 음성을 사용자의 명시적 동의로 만들어야 합니다. 사용자의 기록된 문은 고객(Azure AI 음성 리소스 소유자)이 음성을 만들고 사용할 것임을 인정하는 데 필요합니다.

개인 보이스 프로젝트에 사용자 동의를 추가하려면 공개적으로 액세스할 수 있는 URL(Consents_Create)에서 사전 녹음된 동의 오디오 파일을 제공하거나 오디오 파일(Consents_Post)을 업로드합니다.

동의 문을 말하는 사용자의 오디오 녹음이 필요합니다.

텍스트 음성 변환 GitHub 리포지토리로 각 로캘에 대한 동의 문 텍스트를 가져올 수 있습니다. verbal-statement-all-locales.txt에서 동의문을 참조하세요. 다음은 en-US 로캘에 대한 샘플입니다.

"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

동의 오디오 파일에 대해 지원되는 형식은 아래 표를 참조하세요.

형식	샘플 속도	비트 전송률:	비트 수준
mp3	16kHz, 24kHz, 44.1kHz, 48kHz	128kbps, 192kbps, 256kbps, 320kbps	/
wav	16kHz, 24kHz, 44.1kHz, 48kHz	/	16비트, 24비트, 32비트

이 시나리오에서는 오디오 파일을 로컬로 사용할 수 있어야 합니다.

로컬 오디오 파일에서 개인 보이스 프로젝트에 동의를 추가하려면 사용자 지정 음성 API의 Consents_Post 작업을 사용합니다. 다음 지침에 따라 요청 본문을 생성합니다.

필수 projectId 속성을 설정합니다. 프로젝트 만들기를 참조하세요.
필수 voiceTalentName 속성을 설정합니다. 성우 이름은 나중에 변경할 수 없습니다.
필수 companyName 속성을 설정합니다. 회사 이름은 나중에 변경할 수 없습니다.
동의 오디오 파일을 사용하여 필수 audiodata 속성을 설정합니다.
필수 locale 속성을 설정합니다. 동의의 로캘이어야 합니다. 로캘은 나중에 변경할 수 없습니다. 여기에서 텍스트 음성 변환 로캘 목록을 찾을 수 있습니다.

다음 Consents_Post 예제와 같이 URI를 사용하여 HTTP POST 요청을 수행합니다.

YourResourceKey를 Speech 리소스 키로 바꿉니다.
YourResourceRegion을 음성 리소스 지역으로 바꿉니다.
JessicaConsentId를 선택한 동의 ID로 대체합니다. 대/소문자 구분 ID는 동의 URI에 사용되며 나중에 변경할 수 없습니다.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

응답 본문은 다음 형식으로 표시되어야 합니다.

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

응답 헤더에는 Operation-Location 속성이 포함되어 있습니다. 이 URI를 사용하여 Consents_Post 작업에 대한 세부 정보를 가져옵니다. 응답 헤더의 예는 다음과 같습니다.

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

이 시나리오에서는 오디오 파일이 Azure Blob Storage 컨테이너에 이미 저장되어 있어야 합니다.

오디오 파일의 URL에서 개인 보이스 프로젝트에 대한 동의를 추가하려면 사용자 지정 음성 API의 Consents_Create 작업을 사용합니다. 다음 지침에 따라 요청 본문을 생성합니다.

필수 projectId 속성을 설정합니다. 프로젝트 만들기를 참조하세요.
필수 voiceTalentName 속성을 설정합니다. 성우 이름은 나중에 변경할 수 없습니다.
필수 companyName 속성을 설정합니다. 회사 이름은 나중에 변경할 수 없습니다.
필수 audioUrl 속성을 설정합니다. 성우 동의 오디오 파일의 URL입니다. SAS(공유 액세스 서명) 토큰과 함께 URI를 사용합니다.
필수 locale 속성을 설정합니다. 동의의 로캘이어야 합니다. 로캘은 나중에 변경할 수 없습니다. 여기에서 텍스트 음성 변환 로캘 목록을 찾을 수 있습니다.

다음 Consents_Create 예제와 같이 URI를 사용하여 HTTP PUT 요청을 수행합니다.

YourResourceKey를 Speech 리소스 키로 바꿉니다.
YourResourceRegion을 음성 리소스 지역으로 바꿉니다.
JessicaConsentId를 선택한 동의 ID로 대체합니다. 대/소문자 구분 ID는 동의 URI에 사용되며 나중에 변경할 수 없습니다.

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

응답 본문은 다음 형식으로 표시되어야 합니다.

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

응답 헤더에는 Operation-Location 속성이 포함되어 있습니다. 이 URI를 사용하여 Consents_Create 작업에 대한 세부 정보를 가져옵니다. 응답 헤더의 예는 다음과 같습니다.

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

다음 단계

개인 보이스를 만듭니다..

다음을 통해 공유

다음 단계

피드백

추가 리소스

다음을 통해 공유

개인 음성 프로젝트에 사용자 동의 추가

동의 문

동의 오디오에 지원되는 오디오 형식

파일에서 동의 추가

URL에서 동의 추가

다음 단계

피드백

추가 리소스