Udostępnij za pośrednictwem


Dodawanie zgody użytkownika do osobistego projektu głosowego

Funkcja głosu osobistego wymaga, aby każdy głos był tworzony z jawną zgodą użytkownika. Zarejestrowana instrukcja od użytkownika jest wymagana z potwierdzeniem, że klient (właściciel zasobu usługi Azure AI Speech) utworzy i użyje swojego głosu.

Aby dodać zgodę użytkownika do osobistego projektu głosowego, należy podać wstępnie rozpoznany plik audio zgody z publicznie dostępnego adresu URL (Consents_Create) lub przekazać plik audio (Consents_Post).

Potrzebujesz nagrania audio użytkownika mówiącego o instrukcji wyrażania zgody.

Tekst instrukcji zgody dla każdego ustawienia regionalnego można uzyskać z repozytorium GitHub zamiany tekstu na mowę. Aby uzyskać instrukcję zgody, zobacz verbal-statement-all-locales.txt . Poniżej przedstawiono przykład ustawień en-US regionalnych:

"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Zapoznaj się z poniższą tabelą, aby zapoznać się z obsługiwanymi formatami dla plików audio zgody:

Formatuj Częstotliwość próbkowania Szybkość transmisji bitów Głębokość bitu
mp3 16 kHz, 24 kHz, 44,1 kHz, 48 kHz 128 kb/s, 192 kb/s, 256 kb/s, 320 kb/s /
wav 16 kHz, 24 kHz, 44,1 kHz, 48 kHz / 16-bitowy, 24-bitowy, 32-bitowy

W tym scenariuszu pliki audio muszą być dostępne lokalnie.

Aby dodać zgodę na osobisty projekt głosowy z lokalnego pliku audio, użyj Consents_Post operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:

  • Ustaw wymaganą projectId właściwość. Zobacz Tworzenie projektu.
  • Ustaw wymaganą voiceTalentName właściwość. Nie można później zmienić nazwy talentu głosowego.
  • Ustaw wymaganą companyName właściwość. Nie można później zmienić nazwy firmy.
  • Ustaw wymaganą audiodata właściwość z plikiem audio zgody.
  • Ustaw wymaganą locale właściwość. Powinno to być ustawienia regionalne zgody. Nie można później zmienić ustawień regionalnych. Tekst na liście ustawień regionalnych mowy można znaleźć tutaj.

Utwórz żądanie HTTP POST przy użyciu identyfikatora URI, jak pokazano w poniższym Consents_Post przykładzie.

  • Zastąp YourResourceKey ciąg kluczem zasobu usługi Mowa.
  • Zastąp YourResourceRegion element regionem zasobu usługi Mowa.
  • Zastąp JessicaConsentId ciąg wybranym identyfikatorem zgody. Identyfikator uwzględniający wielkość liter będzie używany w identyfikatorze URI zgody i nie można go później zmienić.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Nagłówek odpowiedzi zawiera Operation-Location właściwość . Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o Consents_Post operacji. Oto przykład nagłówka odpowiedzi:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

W tym scenariuszu pliki audio muszą być już przechowywane w kontenerze usługi Azure Blob Storage.

Aby dodać zgodę na osobisty projekt głosowy z adresu URL pliku audio, użyj Consents_Create operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:

  • Ustaw wymaganą projectId właściwość. Zobacz Tworzenie projektu.
  • Ustaw wymaganą voiceTalentName właściwość. Nie można później zmienić nazwy talentu głosowego.
  • Ustaw wymaganą companyName właściwość. Nie można później zmienić nazwy firmy.
  • Ustaw wymaganą audioUrl właściwość. Adres URL pliku audio wyrażania zgody przez talent głosowy. Użyj identyfikatora URI z tokenem sygnatur dostępu współdzielonego (SAS).
  • Ustaw wymaganą locale właściwość. Powinno to być ustawienia regionalne zgody. Nie można później zmienić ustawień regionalnych. Tekst na liście ustawień regionalnych mowy można znaleźć tutaj.

Utwórz żądanie HTTP PUT przy użyciu identyfikatora URI, jak pokazano w poniższym przykładzie Consents_Create .

  • Zastąp YourResourceKey ciąg kluczem zasobu usługi Mowa.
  • Zastąp YourResourceRegion element regionem zasobu usługi Mowa.
  • Zastąp JessicaConsentId ciąg wybranym identyfikatorem zgody. Identyfikator uwzględniający wielkość liter będzie używany w identyfikatorze URI zgody i nie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Nagłówek odpowiedzi zawiera Operation-Location właściwość . Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o operacji Consents_Create . Oto przykład nagłówka odpowiedzi:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Następne kroki