Hinzufügen der Benutzerzustimmung zum persönlichen VoIP-Projekt

Artikel
09/30/2024

Mit der persönlichen Sprachfunktion ist es erforderlich, dass jede Stimme mit expliziter Zustimmung des Benutzers erstellt wird. Es ist eine aufgezeichnete Erklärung des Benutzers erforderlich, in der er bestätigt, dass der Kunde (Eigentümer der Azure AI Speech-Ressource) seine Stimme erstellen und verwenden wird.

Um dem Personal Voice-Projekt eine Benutzereinwilligung hinzuzufügen, stellen Sie die vorab aufgezeichnete Einwilligungsaudiodatei über eine öffentlich zugängliche URL bereit (Consents_Create), oder laden Sie die Audiodatei hoch (Consents_Post).

Sie benötigen eine Audioaufzeichnung des Benutzers, der die Zustimmungserklärung spricht.

Sie können den Text der Zustimmungserklärung für jedes Gebietsschema aus dem Text in das GitHub-Repository für Sprachsynthese abrufen. Die Einwilligungserklärung finde Sie unter verbal-statement-all-locales.txt. Im Folgenden finden Sie ein Beispiel für das Gebietsschema en-US:

"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

In der folgenden Tabelle finden Sie die unterstützten Formate für Einwilligungsaudiodateien:

Format	Samplingrate	Bitrate	Bittiefe
MP3	16 kHz, 24 kHz, 44,1 kHz, 48 kHz	128 KBit/s, 192 KBit/s, 256 KBit/s, 320 KBit/s	/
WAV	16 kHz, 24 kHz, 44,1 kHz, 48 kHz	/	16 Bit, 24 Bit, 32 Bit

In diesem Szenario müssen die Audiodateien lokal verfügbar sein.

Verwenden Sie den Consents_Post-Vorgang der benutzerdefinierten VoIP-API, um ein persönliches VoIP-Projekt aus einer benutzerdefinierten Audiodatei hinzuzufügen. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:

Legen Sie die erforderliche projectId-Eigenschaft fest. Siehe Erstellen eines Projekts.
Legen Sie die erforderliche voiceTalentName-Eigenschaft fest. Der Name des Sprachtalents kann später nicht geändert werden.
Legen Sie die erforderliche companyName-Eigenschaft fest. Der Firmenname kann später nicht geändert werden.
Legen Sie die erforderliche audiodata-Eigenschaft mit der Einwilligungs-Audiodatei fest.
Legen Sie die erforderliche locale-Eigenschaft fest. Dies sollte das Gebietsschema der Zustimmung sein. Das Gebietsschema können Sie später nicht mehr ändern. Hier finden Sie den Text zur Sprachsynthese-Gebietsliste.

Erstellen Sie eine HTTP POST-Anforderung, und verwenden Sie dabei den URI, wie im folgenden Consents_Post-Beispiel gezeigt.

Ersetzen Sie YourResourceKey durch Ihren Speech-Ressourcenschlüssel.
Ersetzen Sie YourResourceRegion durch Ihre Speech-Ressourcenregion.
Ersetzen Sie JessicaConsentId durch eine Zustimmungs-ID Ihrer Wahl. Die URI der Zustimmung wird bei der Groß-/Kleinschreibung beachtet und kann später nicht geändert werden.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'description="Consent for Jessica voice"' -F 'projectId="ProjectId"' -F 'voiceTalentName="Jessica Smith"' -F 'companyName="Contoso"' -F 'audiodata=@"D:\PersonalVoiceTest\jessica-consent.wav"' -F 'locale="en-US"' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Der Antwortheader enthält die Operation-Location-Eigenschaft. Verwenden Sie diesen URI, um Details zum Consents_Post-Vorgang abzurufen. Hier ist ein Beispiel für die Antwort:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

In diesem Szenario müssen die Audiodateien bereits in einem Azure Blob Storage-Container gespeichert werden.

Um die Einwilligung zum Projekt „Persönliche Stimme“ über die URL einer Audiodatei hinzuzufügen, verwenden Sie den Consents_Create-Vorgang der benutzerdefinierten VoIP-API. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:

Legen Sie die erforderliche projectId-Eigenschaft fest. Siehe Erstellen eines Projekts.
Legen Sie die erforderliche voiceTalentName-Eigenschaft fest. Der Name des Sprachtalents kann später nicht geändert werden.
Legen Sie die erforderliche companyName-Eigenschaft fest. Der Firmenname kann später nicht geändert werden.
Legen Sie die erforderliche audioUrl-Eigenschaft fest. Die URL der Audiodatei zur Zustimmung von VoIP-Talenten. Verwenden Sie einen URI mit dem SAS-Token (Shared Access Signatures).
Legen Sie die erforderliche locale-Eigenschaft fest. Dies sollte das Gebietsschema der Zustimmung sein. Das Gebietsschema können Sie später nicht mehr ändern. Hier finden Sie den Text zur Sprachsynthese-Gebietsliste.

Senden Sie eine HTTP PUT-Anforderung unter Verwendung des URI, wie im folgenden Beispiel Consents_Create gezeigt.

Ersetzen Sie YourResourceKey durch Ihren Speech-Ressourcenschlüssel.
Ersetzen Sie YourResourceRegion durch Ihre Speech-Ressourcenregion.
Ersetzen Sie JessicaConsentId durch eine Zustimmungs-ID Ihrer Wahl. Die URI der Zustimmung wird bei der Groß-/Kleinschreibung beachtet und kann später nicht geändert werden.

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2024-09-01T05:30:00.000Z",
  "lastActionDateTime": "2024-09-02T10:15:30.000Z"
}

Der Antwortheader enthält die Operation-Location-Eigenschaft. Verwenden Sie diesen URI, um Details zum Consents_Create-Vorgang abzurufen. Hier ist ein Beispiel für die Antwort:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Nächste Schritte

Erstellen Sie eine persönliche Stimme.

Freigeben über

Nächste Schritte

Feedback

Zusätzliche Ressourcen

Freigeben über

Zustimmungserklärung

Unterstützte Audioformate für Einwilligungsaudiodateien

Hinzufügen der Einwilligung aus einer Datei

Hinzufügen der Zustimmung aus einer URL

Nächste Schritte

Feedback

Zusätzliche Ressourcen