Lägga till användarens medgivande till det personliga röstprojektet
Med den personliga röstfunktionen krävs att varje röst skapas med uttryckligt medgivande från användaren. En inspelad instruktion från användaren krävs som bekräftar att kunden (Azure AI Speech-resursägaren) skapar och använder sin röst.
Om du vill lägga till användarens medgivande till det personliga röstprojektet anger du den förinspelade ljudfilen för medgivande från en offentligt tillgänglig URL (Consents_Create) eller laddar upp ljudfilen (Consents_Post).
Medgivandeuttryck
Du behöver en ljudinspelning av användaren som talar med medgivandemeddelandet.
Du kan hämta texten för medgivandeuttryck för varje språkvariant från text till tal GitHub-lagringsplats. Mer information om medgivande finns i verbal-statement-all-locales.txt . Nedan visas ett exempel för språkvarianten en-US
:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Ljudformat som stöds för medgivandeljud
Se tabellen nedan för de format som stöds för ljudfiler för medgivande:
Format | Exempelfrekvens | Bithastighet | Bitdjup |
---|---|---|---|
mp3 | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | 128 kbps, 192 kbps, 256 kbps, 320 kbps | / |
wav | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | / | 16-bitars, 24-bitars, 32-bitars |
Lägga till medgivande från en fil
I det här scenariot måste ljudfilerna vara tillgängliga lokalt.
Om du vill lägga till medgivande till ett personligt röstprojekt från en lokal ljudfil använder du Consents_Post
funktionen för det anpassade röst-API:et. Skapa begärandetexten enligt följande instruktioner:
- Ange den obligatoriska
projectId
egenskapen. Se skapa ett projekt. - Ange den obligatoriska
voiceTalentName
egenskapen. Rösttalangens namn kan inte ändras senare. - Ange den obligatoriska
companyName
egenskapen. Företagsnamnet kan inte ändras senare. - Ange den obligatoriska
audiodata
egenskapen med medgivandeljudfilen. - Ange den obligatoriska
locale
egenskapen. Detta bör vara språkvarianten för medgivandet. Språkvarianten kan inte ändras senare. Du hittar språklistan för text till tal här.
Gör en HTTP POST-begäran med hjälp av URI:n enligt följande Consents_Post
exempel.
- Ersätt
YourResourceKey
med din Speech-resursnyckel. - Ersätt
YourResourceRegion
med din Speech-resursregion. - Ersätt
JessicaConsentId
med ett valfritt medgivande-ID. Skiftlägeskänsligt ID används i medgivandets URI och kan inte ändras senare.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Du bör få en svarstext i följande format:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Svarshuvudet innehåller egenskapen Operation-Location
. Använd den här URI:n för att få information om åtgärden Consents_Post
. Här är ett exempel på svarshuvudet:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314
Lägga till medgivande från en URL
I det här scenariot måste ljudfilerna redan lagras i en Azure Blob Storage-container.
Om du vill lägga till medgivande till ett personligt röstprojekt från URL:en för en ljudfil använder du den Consents_Create åtgärden för det anpassade röst-API:et. Skapa begärandetexten enligt följande instruktioner:
- Ange den obligatoriska
projectId
egenskapen. Se skapa ett projekt. - Ange den obligatoriska
voiceTalentName
egenskapen. Rösttalangens namn kan inte ändras senare. - Ange den obligatoriska
companyName
egenskapen. Företagsnamnet kan inte ändras senare. - Ange den obligatoriska
audioUrl
egenskapen. URL:en för ljudfilen för rösttalangens medgivande. Använd en URI med sas-token (signaturer för delad åtkomst). - Ange den obligatoriska
locale
egenskapen. Detta bör vara språkvarianten för medgivandet. Språkvarianten kan inte ändras senare. Du hittar språklistan för text till tal här.
Gör en HTTP PUT-begäran med hjälp av URI:n enligt följande Consents_Create exempel.
- Ersätt
YourResourceKey
med din Speech-resursnyckel. - Ersätt
YourResourceRegion
med din Speech-resursregion. - Ersätt
JessicaConsentId
med ett valfritt medgivande-ID. Skiftlägeskänsligt ID används i medgivandets URI och kan inte ändras senare.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Du bör få en svarstext i följande format:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Svarshuvudet innehåller egenskapen Operation-Location
. Använd den här URI:n för att få information om den Consents_Create åtgärden. Här är ett exempel på svarshuvudet:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314