Freigeben über


Erstellen eines Projekts für professionelle Stimmen

Für den Einstieg benötigen Sie lediglich einige Audiodateien und die dazugehörigen Transkriptionen. Überprüfen Sie, ob benutzerdefinierte VoIP Ihre Sprache und Region unterstützt.

Starten der Feinabstimmung

Im Azure AI Foundry-Portal können Sie einige Azure AI-Dienstemodelle optimieren. Sie können beispielsweise ein professionelles Sprachmodell optimieren.

Führen Sie die folgenden Schritte aus, um ein professionelles Sprachmodell zu optimieren:

  1. Gehen Sie zu Ihrem Azure AI Foundry-Projekt im Azure AI Foundry-Portal. Wenn Sie ein Projekt erstellen müssen, lesen Sie Erstellen eines Azure KI Foundry-Projekts.

  2. Wählen Sie im linken Bereich Optimierung aus.

  3. Wählen Sie Feinabstimmung des KI-Dienstes>+ Feinabstimmen aus.

    Screenshot der Seite zum Auswählen der Optimierung von Azure KI Services-Modellen.

  4. Wählen Sie im Assistenten "Benutzerdefinierte Stimme" (professionelle Sprachoptimierung) aus.

  5. Wählen Sie Weiteraus.

  6. Folgen Sie den Anweisungen des Assistenten, um Ihren Feinabstimmungsarbeitsbereich zu erstellen.

Weiter optimieren

Wechseln Sie zur Azure AI Speech-Dokumentation, um zu erfahren, wie Sie Ihr professionelles Sprachmodell optimieren:

Anzeigen optimierter Modelle

Nach der Feinabstimmung können Sie über die Feinabstimmungsseite auf Ihre benutzerdefinierten Sprachmodelle und Bereitstellungen zugreifen.

  1. Melden Sie sich beim Azure AI Foundry-Portal an.

  2. Wählen Sie im linken Bereich Optimierung aus.

  3. Wählen Sie Feinabstimmung des KI-Dienstes aus. Sie können den Status Ihrer Feinabstimmungsaufgaben und der erstellten Modelle anzeigen.

    Screenshot der Seite zum Anzeigen fein abgestimmter KI-Dienstemodelle.

Nächste Schritte

Inhalte für benutzerdefinierte Sprachfunktionen wie Daten, Modelle, Tests und Endpunkte sind in Projekten in Speech Studio organisiert. Jedes Projekt ist spezifisch für ein Land/eine Region und eine Sprache sowie das Geschlecht der Stimme, die Sie erstellen möchten. So können Sie beispielsweise ein Projekt mit einer weiblichen Stimme für die Chatbots Ihres Callcenters erstellen, die US-amerikanisches Englisch verwenden.

Für den Einstieg benötigen Sie lediglich einige Audiodateien und die dazugehörigen Transkriptionen. Überprüfen Sie, ob benutzerdefinierte VoIP Ihre Sprache und Region unterstützt.

Starten der Feinabstimmung

Führen Sie die folgenden Schritte aus, um ein professionelles Sprachmodell zu optimieren:

  1. Melden Sie sich in Speech Studio an.

  2. Wählen Sie das Abonnement und die Speech-Ressource aus, mit denen Sie arbeiten möchten.

    Wichtig

    Benutzerdefinierte Sprachschulungen sind derzeit nur in einigen Regionen verfügbar. Nachdem Ihr Sprachmodell trainiert wurde, können Sie es nach Bedarf in eine Speech-Ressource in einer anderen Region kopieren. Weitere Informationen finden Sie in den Fußnoten der Tabelle Regionen.

  3. Wählen Sie Benutzerdefinierte Stimme>Projekt erstellen aus.

  4. Wählen Sie Benutzerdefinierte neuronale Stimme Pro>Weiter aus.

  5. Folgen Sie den Anweisungen des Assistenten, um Ihr Projekt zu erstellen.

Wählen Sie das neue Projekt nach Name aus, oder klicken Sie auf Zum Projekt wechseln. Im linken Bereich werden die folgenden Menüelemente angezeigt: Sprecher einrichten, Trainingsdaten vorbereiten, Modell trainieren und Modell bereitstellen.

Nächste Schritte

„Professionelle Stimme“-Projekte enthalten die Einwilligungserklärung für Sprecher*innen, Schulungsdatensätze, Stimmenmodelle und Endpunkte.

Jedes Projekt ist spezifisch für ein Land/eine Region und eine Sprache sowie das Geschlecht der Stimme, die Sie erstellen möchten. So können Sie beispielsweise ein Projekt mit einer weiblichen Stimme für die Chatbots Ihres Callcenters erstellen, die US-amerikanisches Englisch verwenden.

Erstellen eines Projekts

Um ein professionelles Sprachprojekt zu erstellen, verwenden Sie den Vorgang Projects_Create der benutzerdefinierten Sprach-API. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:

  • Legen Sie die benötigte Eigenschaft „kind“ auf „ProfessionalVoice“ fest. Die Art kann später nicht geändert werden.
  • Legen Sie optional die description-Eigenschaft für die Projektbeschreibung fest. Die Projektbeschreibung kann später geändert werden.

Stellen Sie eine HTTP PUT-Anforderung unter Verwendung der URI, wie im folgenden Beispiel Projects_Create gezeigt.

  • Ersetzen Sie YourResourceKey durch Ihren Speech-Ressourcenschlüssel.
  • Ersetzen Sie YourResourceRegion durch Ihre Sprachressourcenregion.
  • Ersetzen Sie sie ProjectId durch eine Projekt-ID Ihrer Wahl. Die ID (Groß-/Kleinschreibung beachten) muss innerhalb der Sprachressource eindeutig sein. Die ID wird in der URI des Projekts verwendet und kann später nicht mehr geändert werden.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

Sie verwenden das Projekt id in nachfolgenden API-Anforderungen, um die Einwilligung für Sprecher*innen hinzuzufügen und einen Schulungssatz zu erstellen.

Nächste Schritte