Dela via


Lägga till användarens medgivande till det personliga röstprojektet

Med den personliga röstfunktionen krävs att varje röst skapas med uttryckligt medgivande från användaren. En inspelad instruktion från användaren krävs som bekräftar att kunden (Azure AI Speech-resursägaren) skapar och använder sin röst.

Om du vill lägga till användarens medgivande till det personliga röstprojektet anger du den förinspelade ljudfilen för medgivande från en offentligt tillgänglig URL (Consents_Create) eller laddar upp ljudfilen (Consents_Post).

Du behöver en ljudinspelning av användaren som talar med medgivandemeddelandet.

Du kan hämta texten för medgivandeuttryck för varje språkvariant från text till tal GitHub-lagringsplats. Mer information om medgivande finns i verbal-statement-all-locales.txt . Nedan visas ett exempel för språkvarianten en-US :

"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Se tabellen nedan för de format som stöds för ljudfiler för medgivande:

Format Exempelfrekvens Bithastighet Bitdjup
mp3 16 kHz, 24 kHz, 44,1 kHz, 48 kHz 128 kbps, 192 kbps, 256 kbps, 320 kbps /
wav 16 kHz, 24 kHz, 44,1 kHz, 48 kHz / 16-bitars, 24-bitars, 32-bitars

I det här scenariot måste ljudfilerna vara tillgängliga lokalt.

Om du vill lägga till medgivande till ett personligt röstprojekt från en lokal ljudfil använder du Consents_Post funktionen för det anpassade röst-API:et. Skapa begärandetexten enligt följande instruktioner:

  • Ange den obligatoriska projectId egenskapen. Se skapa ett projekt.
  • Ange den obligatoriska voiceTalentName egenskapen. Rösttalangens namn kan inte ändras senare.
  • Ange den obligatoriska companyName egenskapen. Företagsnamnet kan inte ändras senare.
  • Ange den obligatoriska audiodata egenskapen med medgivandeljudfilen.
  • Ange den obligatoriska locale egenskapen. Detta bör vara språkvarianten för medgivandet. Språkvarianten kan inte ändras senare. Du hittar språklistan för text till tal här.

Gör en HTTP POST-begäran med hjälp av URI:n enligt följande Consents_Post exempel.

  • Ersätt YourResourceKey med din Speech-resursnyckel.
  • Ersätt YourResourceRegion med din Speech-resursregion.
  • Ersätt JessicaConsentId med ett valfritt medgivande-ID. Skiftlägeskänsligt ID används i medgivandets URI och kan inte ändras senare.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Du bör få en svarstext i följande format:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Svarshuvudet innehåller egenskapen Operation-Location . Använd den här URI:n för att få information om åtgärden Consents_Post . Här är ett exempel på svarshuvudet:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

I det här scenariot måste ljudfilerna redan lagras i en Azure Blob Storage-container.

Om du vill lägga till medgivande till ett personligt röstprojekt från URL:en för en ljudfil använder du den Consents_Create åtgärden för det anpassade röst-API:et. Skapa begärandetexten enligt följande instruktioner:

  • Ange den obligatoriska projectId egenskapen. Se skapa ett projekt.
  • Ange den obligatoriska voiceTalentName egenskapen. Rösttalangens namn kan inte ändras senare.
  • Ange den obligatoriska companyName egenskapen. Företagsnamnet kan inte ändras senare.
  • Ange den obligatoriska audioUrl egenskapen. URL:en för ljudfilen för rösttalangens medgivande. Använd en URI med sas-token (signaturer för delad åtkomst).
  • Ange den obligatoriska locale egenskapen. Detta bör vara språkvarianten för medgivandet. Språkvarianten kan inte ändras senare. Du hittar språklistan för text till tal här.

Gör en HTTP PUT-begäran med hjälp av URI:n enligt följande Consents_Create exempel.

  • Ersätt YourResourceKey med din Speech-resursnyckel.
  • Ersätt YourResourceRegion med din Speech-resursregion.
  • Ersätt JessicaConsentId med ett valfritt medgivande-ID. Skiftlägeskänsligt ID används i medgivandets URI och kan inte ändras senare.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Du bör få en svarstext i följande format:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Svarshuvudet innehåller egenskapen Operation-Location . Använd den här URI:n för att få information om den Consents_Create åtgärden. Här är ett exempel på svarshuvudet:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Nästa steg