Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Für den Einstieg benötigen Sie lediglich einige Audiodateien und die dazugehörigen Transkriptionen. Überprüfen Sie, ob benutzerdefinierte VoIP Ihre Sprache und Region unterstützt.
Starten der Feinabstimmung
Im Azure AI Foundry-Portal können Sie einige Azure AI-Dienstemodelle optimieren. Sie können beispielsweise ein professionelles Sprachmodell optimieren.
Führen Sie die folgenden Schritte aus, um ein professionelles Sprachmodell zu optimieren:
Gehen Sie zu Ihrem Azure AI Foundry-Projekt im Azure AI Foundry-Portal. Wenn Sie ein Projekt erstellen müssen, lesen Sie Erstellen eines Azure KI Foundry-Projekts.
Wählen Sie im linken Bereich Optimierung aus.
Wählen Sie Feinabstimmung des KI-Dienstes>+ Feinabstimmen aus.
Wählen Sie im Assistenten "Benutzerdefinierte Stimme" (professionelle Sprachoptimierung) aus.
Wählen Sie Weiteraus.
Folgen Sie den Anweisungen des Assistenten, um Ihren Feinabstimmungsarbeitsbereich zu erstellen.
Weiter optimieren
Wechseln Sie zur Azure AI Speech-Dokumentation, um zu erfahren, wie Sie Ihr professionelles Sprachmodell optimieren:
- VoIP-Talentzustimmung hinzufügen
- Hinzufügen von Schulungsdatensätzen
- Trainieren Ihres Sprachmodells
- Ihr professionelles Sprachmodell als Endpunkt bereitstellen
Anzeigen optimierter Modelle
Nach der Feinabstimmung können Sie über die Feinabstimmungsseite auf Ihre benutzerdefinierten Sprachmodelle und Bereitstellungen zugreifen.
Melden Sie sich beim Azure AI Foundry-Portal an.
Wählen Sie im linken Bereich Optimierung aus.
Wählen Sie Feinabstimmung des KI-Dienstes aus. Sie können den Status Ihrer Feinabstimmungsaufgaben und der erstellten Modelle anzeigen.
Nächste Schritte
Inhalte für benutzerdefinierte Sprachfunktionen wie Daten, Modelle, Tests und Endpunkte sind in Projekten in Speech Studio organisiert. Jedes Projekt ist spezifisch für ein Land/eine Region und eine Sprache sowie das Geschlecht der Stimme, die Sie erstellen möchten. So können Sie beispielsweise ein Projekt mit einer weiblichen Stimme für die Chatbots Ihres Callcenters erstellen, die US-amerikanisches Englisch verwenden.
Für den Einstieg benötigen Sie lediglich einige Audiodateien und die dazugehörigen Transkriptionen. Überprüfen Sie, ob benutzerdefinierte VoIP Ihre Sprache und Region unterstützt.
Starten der Feinabstimmung
Führen Sie die folgenden Schritte aus, um ein professionelles Sprachmodell zu optimieren:
Melden Sie sich in Speech Studio an.
Wählen Sie das Abonnement und die Speech-Ressource aus, mit denen Sie arbeiten möchten.
Wichtig
Benutzerdefinierte Sprachschulungen sind derzeit nur in einigen Regionen verfügbar. Nachdem Ihr Sprachmodell trainiert wurde, können Sie es nach Bedarf in eine Speech-Ressource in einer anderen Region kopieren. Weitere Informationen finden Sie in den Fußnoten der Tabelle Regionen.
Wählen Sie Benutzerdefinierte Stimme>Projekt erstellen aus.
Wählen Sie Benutzerdefinierte neuronale Stimme Pro>Weiter aus.
Folgen Sie den Anweisungen des Assistenten, um Ihr Projekt zu erstellen.
Wählen Sie das neue Projekt nach Name aus, oder klicken Sie auf Zum Projekt wechseln. Im linken Bereich werden die folgenden Menüelemente angezeigt: Sprecher einrichten, Trainingsdaten vorbereiten, Modell trainieren und Modell bereitstellen.
Nächste Schritte
„Professionelle Stimme“-Projekte enthalten die Einwilligungserklärung für Sprecher*innen, Schulungsdatensätze, Stimmenmodelle und Endpunkte.
Jedes Projekt ist spezifisch für ein Land/eine Region und eine Sprache sowie das Geschlecht der Stimme, die Sie erstellen möchten. So können Sie beispielsweise ein Projekt mit einer weiblichen Stimme für die Chatbots Ihres Callcenters erstellen, die US-amerikanisches Englisch verwenden.
Erstellen eines Projekts
Um ein professionelles Sprachprojekt zu erstellen, verwenden Sie den Vorgang Projects_Create der benutzerdefinierten Sprach-API. Erstellen Sie den Anforderungstext gemäß den folgenden Anweisungen:
- Legen Sie die benötigte Eigenschaft „
kind
“ auf „ProfessionalVoice
“ fest. Die Art kann später nicht geändert werden. - Legen Sie optional die
description
-Eigenschaft für die Projektbeschreibung fest. Die Projektbeschreibung kann später geändert werden.
Stellen Sie eine HTTP PUT-Anforderung unter Verwendung der URI, wie im folgenden Beispiel Projects_Create gezeigt.
- Ersetzen Sie
YourResourceKey
durch Ihren Speech-Ressourcenschlüssel. - Ersetzen Sie
YourResourceRegion
durch Ihre Sprachressourcenregion. - Ersetzen Sie sie
ProjectId
durch eine Projekt-ID Ihrer Wahl. Die ID (Groß-/Kleinschreibung beachten) muss innerhalb der Sprachressource eindeutig sein. Die ID wird in der URI des Projekts verwendet und kann später nicht mehr geändert werden.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"
Sie sollten einen Antworttext im folgenden Format erhalten:
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
Sie verwenden das Projekt id
in nachfolgenden API-Anforderungen, um die Einwilligung für Sprecher*innen hinzuzufügen und einen Schulungssatz zu erstellen.