Dodawanie zgody użytkownika do osobistego projektu głosowego
Funkcja głosu osobistego wymaga, aby każdy głos był tworzony z jawną zgodą użytkownika. Zarejestrowana instrukcja od użytkownika jest wymagana z potwierdzeniem, że klient (właściciel zasobu usługi Azure AI Speech) utworzy i użyje swojego głosu.
Aby dodać zgodę użytkownika do osobistego projektu głosowego, należy podać wstępnie rozpoznany plik audio zgody z publicznie dostępnego adresu URL (Consents_Create) lub przekazać plik audio (Consents_Post).
Instrukcja zgody
Potrzebujesz nagrania audio użytkownika mówiącego o instrukcji wyrażania zgody.
Tekst instrukcji zgody dla każdego ustawienia regionalnego można uzyskać z repozytorium GitHub zamiany tekstu na mowę. Aby uzyskać instrukcję zgody, zobacz verbal-statement-all-locales.txt . Poniżej przedstawiono przykład ustawień en-US
regionalnych:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Obsługiwane formaty audio dla dźwięku zgody
Zapoznaj się z poniższą tabelą, aby zapoznać się z obsługiwanymi formatami dla plików audio zgody:
Formatuj | Częstotliwość próbkowania | Szybkość transmisji bitów | Głębokość bitu |
---|---|---|---|
mp3 | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | 128 kb/s, 192 kb/s, 256 kb/s, 320 kb/s | / |
wav | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | / | 16-bitowy, 24-bitowy, 32-bitowy |
Dodawanie zgody z pliku
W tym scenariuszu pliki audio muszą być dostępne lokalnie.
Aby dodać zgodę na osobisty projekt głosowy z lokalnego pliku audio, użyj Consents_Post
operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:
- Ustaw wymaganą
projectId
właściwość. Zobacz Tworzenie projektu. - Ustaw wymaganą
voiceTalentName
właściwość. Nie można później zmienić nazwy talentu głosowego. - Ustaw wymaganą
companyName
właściwość. Nie można później zmienić nazwy firmy. - Ustaw wymaganą
audiodata
właściwość z plikiem audio zgody. - Ustaw wymaganą
locale
właściwość. Powinno to być ustawienia regionalne zgody. Nie można później zmienić ustawień regionalnych. Tekst na liście ustawień regionalnych mowy można znaleźć tutaj.
Utwórz żądanie HTTP POST przy użyciu identyfikatora URI, jak pokazano w poniższym Consents_Post
przykładzie.
- Zastąp
YourResourceKey
ciąg kluczem zasobu usługi Mowa. - Zastąp
YourResourceRegion
element regionem zasobu usługi Mowa. - Zastąp
JessicaConsentId
ciąg wybranym identyfikatorem zgody. Identyfikator uwzględniający wielkość liter będzie używany w identyfikatorze URI zgody i nie można go później zmienić.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Nagłówek odpowiedzi zawiera Operation-Location
właściwość . Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o Consents_Post
operacji. Oto przykład nagłówka odpowiedzi:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314
Dodawanie zgody z adresu URL
W tym scenariuszu pliki audio muszą być już przechowywane w kontenerze usługi Azure Blob Storage.
Aby dodać zgodę na osobisty projekt głosowy z adresu URL pliku audio, użyj Consents_Create operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:
- Ustaw wymaganą
projectId
właściwość. Zobacz Tworzenie projektu. - Ustaw wymaganą
voiceTalentName
właściwość. Nie można później zmienić nazwy talentu głosowego. - Ustaw wymaganą
companyName
właściwość. Nie można później zmienić nazwy firmy. - Ustaw wymaganą
audioUrl
właściwość. Adres URL pliku audio wyrażania zgody przez talent głosowy. Użyj identyfikatora URI z tokenem sygnatur dostępu współdzielonego (SAS). - Ustaw wymaganą
locale
właściwość. Powinno to być ustawienia regionalne zgody. Nie można później zmienić ustawień regionalnych. Tekst na liście ustawień regionalnych mowy można znaleźć tutaj.
Utwórz żądanie HTTP PUT przy użyciu identyfikatora URI, jak pokazano w poniższym przykładzie Consents_Create .
- Zastąp
YourResourceKey
ciąg kluczem zasobu usługi Mowa. - Zastąp
YourResourceRegion
element regionem zasobu usługi Mowa. - Zastąp
JessicaConsentId
ciąg wybranym identyfikatorem zgody. Identyfikator uwzględniający wielkość liter będzie używany w identyfikatorze URI zgody i nie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Nagłówek odpowiedzi zawiera Operation-Location
właściwość . Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o operacji Consents_Create . Oto przykład nagłówka odpowiedzi:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314