Hinzufügen der Benutzerzustimmung zum persönlichen VoIP-Projekt
Mit der persönlichen Sprachfunktion ist es erforderlich, dass jede Stimme mit expliziter Zustimmung des Benutzers erstellt wird. Es ist eine aufgezeichnete Erklärung des Benutzers erforderlich, in der er bestätigt, dass der Kunde (Eigentümer der Azure AI Speech-Ressource) seine Stimme erstellen und verwenden wird.
Um dem Personal Voice-Projekt eine Benutzereinwilligung hinzuzufügen, stellen Sie die vorab aufgezeichnete Einwilligungsaudiodatei über eine öffentlich zugängliche URL bereit (Consents_Create), oder laden Sie die Audiodatei hoch (Consents_Post).
Zustimmungserklärung
Sie benötigen eine Audioaufzeichnung des Benutzers, der die Zustimmungserklärung spricht.
Sie können den Text der Zustimmungserklärung für jedes Gebietsschema aus dem Text in das GitHub-Repository für Sprachsynthese abrufen. Die Einwilligungserklärung finde Sie unter verbal-statement-all-locales.txt. Im Folgenden finden Sie ein Beispiel für das Gebietsschema en-US
:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Unterstützte Audioformate für Einwilligungsaudiodateien
In der folgenden Tabelle finden Sie die unterstützten Formate für Einwilligungsaudiodateien:
Format | Samplingrate | Bitrate | Bittiefe |
---|---|---|---|
MP3 | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | 128 KBit/s, 192 KBit/s, 256 KBit/s, 320 KBit/s | / |
WAV | 16 kHz, 24 kHz, 44,1 kHz, 48 kHz | / | 16 Bit, 24 Bit, 32 Bit |
Hinzufügen der Einwilligung aus einer Datei
In diesem Szenario müssen die Audiodateien lokal verfügbar sein.
Verwenden Sie den Consents_Post
-Vorgang der benutzerdefinierten VoIP-API, um ein persönliches VoIP-Projekt aus einer benutzerdefinierten Audiodatei hinzuzufügen. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:
- Legen Sie die erforderliche
projectId
-Eigenschaft fest. Siehe Erstellen eines Projekts. - Legen Sie die erforderliche
voiceTalentName
-Eigenschaft fest. Der Name des Sprachtalents kann später nicht geändert werden. - Legen Sie die erforderliche
companyName
-Eigenschaft fest. Der Firmenname kann später nicht geändert werden. - Legen Sie die erforderliche
audiodata
-Eigenschaft mit der Einwilligungs-Audiodatei fest. - Legen Sie die erforderliche
locale
-Eigenschaft fest. Dies sollte das Gebietsschema der Zustimmung sein. Das Gebietsschema können Sie später nicht mehr ändern. Hier finden Sie den Text zur Sprachsynthese-Gebietsliste.
Erstellen Sie eine HTTP POST-Anforderung, und verwenden Sie dabei den URI, wie im folgenden Consents_Post
-Beispiel gezeigt.
- Ersetzen Sie
YourResourceKey
durch Ihren Speech-Ressourcenschlüssel. - Ersetzen Sie
YourResourceRegion
durch Ihre Speech-Ressourcenregion. - Ersetzen Sie
JessicaConsentId
durch eine Zustimmungs-ID Ihrer Wahl. Die URI der Zustimmung wird bei der Groß-/Kleinschreibung beachtet und kann später nicht geändert werden.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Sie sollten einen Antworttext im folgenden Format erhalten:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Der Antwortheader enthält die Operation-Location
-Eigenschaft. Verwenden Sie diesen URI, um Details zum Consents_Post
-Vorgang abzurufen. Hier ist ein Beispiel für die Antwort:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314
Hinzufügen der Zustimmung aus einer URL
In diesem Szenario müssen die Audiodateien bereits in einem Azure Blob Storage-Container gespeichert werden.
Um die Einwilligung zum Projekt „Persönliche Stimme“ über die URL einer Audiodatei hinzuzufügen, verwenden Sie den Consents_Create-Vorgang der benutzerdefinierten VoIP-API. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:
- Legen Sie die erforderliche
projectId
-Eigenschaft fest. Siehe Erstellen eines Projekts. - Legen Sie die erforderliche
voiceTalentName
-Eigenschaft fest. Der Name des Sprachtalents kann später nicht geändert werden. - Legen Sie die erforderliche
companyName
-Eigenschaft fest. Der Firmenname kann später nicht geändert werden. - Legen Sie die erforderliche
audioUrl
-Eigenschaft fest. Die URL der Audiodatei zur Zustimmung von VoIP-Talenten. Verwenden Sie einen URI mit dem SAS-Token (Shared Access Signatures). - Legen Sie die erforderliche
locale
-Eigenschaft fest. Dies sollte das Gebietsschema der Zustimmung sein. Das Gebietsschema können Sie später nicht mehr ändern. Hier finden Sie den Text zur Sprachsynthese-Gebietsliste.
Senden Sie eine HTTP PUT-Anforderung unter Verwendung des URI, wie im folgenden Beispiel Consents_Create gezeigt.
- Ersetzen Sie
YourResourceKey
durch Ihren Speech-Ressourcenschlüssel. - Ersetzen Sie
YourResourceRegion
durch Ihre Speech-Ressourcenregion. - Ersetzen Sie
JessicaConsentId
durch eine Zustimmungs-ID Ihrer Wahl. Die URI der Zustimmung wird bei der Groß-/Kleinschreibung beachtet und kann später nicht geändert werden.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Sie sollten einen Antworttext im folgenden Format erhalten:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2024-09-01T05:30:00.000Z",
"lastActionDateTime": "2024-09-02T10:15:30.000Z"
}
Der Antwortheader enthält die Operation-Location
-Eigenschaft. Verwenden Sie diesen URI, um Details zum Consents_Create-Vorgang abzurufen. Hier ist ein Beispiel für die Antwort:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314