Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Aby zacząć, wystarczy kilka plików audio i powiązanych transkrypcji. Sprawdź, czy niestandardowy głos jest dostępny dla twojego języka i regionu.
Rozpocznij dostrajanie
Aby dostosować profesjonalny model głosu w nowym portalu Microsoft Foundry, wykonaj następujące kroki:
-
Zaloguj się do usługi Microsoft Foundry. Upewnij się, że przełącznik New Foundry jest włączony. Te właśnie kroki odnoszą się do Foundry (new).
Z menu w prawym górnym rogu wybierz pozycję Kompiluj.
W okienku po lewej stronie wybierz pozycję Modele.
Na karcie AI Services wybierz Azure Speech — Text to Speech.
W prawym górnym rogu tekstu na placu zabaw dla mowy wybierz pozycję Dostosuj , aby otworzyć okienko Dostrajanie modelu .
W okienku Podstawowe szczegóły wypełnij następujące ustawienia:
- Wybierz model: Sprawdź, czy wybrano Azure Speech - Text to Speech. Ta wartość jest wstępnie wypełniona na podstawie placu zabaw wprowadzonego z kreatora.
- Typ: Sprawdź, czy wybrano pozycję Profesjonalny głos .
- Płeć głosu: wybierz płeć talentu głosowego.
- Język danych treningowych: wybierz język danych treningowych.
- Nazwa głosu: wprowadź nazwę modelu głosowego.
- Opis: opcjonalnie wprowadź opis.
Wybierz Dalej.
Pozostaw otwarty panel Dostrajanie modelu i przejdź do Dodawanie zgody lektora, aby zarejestrować lektora.
Kontynuuj doskonalenie szczegółów
Przejdź do dokumentacji narzędzi Azure Speech in Foundry Tools, aby dowiedzieć się, jak kontynuować dostosowywanie profesjonalnego modelu głosu:
- Dodaj zgodę lektora
- Dodawanie zestawów danych szkoleniowych
- Trenowanie modelu głosu
- Uruchom swój profesjonalny model głosu jako punkt końcowy
Wyświetl dopracowane modele
Po dostrojeniu możesz uzyskać dostęp do niestandardowych modeli głosu i wdrożeń na stronie Dostrajanie .
- Zaloguj się do usługi Microsoft Foundry. Upewnij się, że przełącznik New Foundry jest włączony. Kroki te dotyczą nowego Foundry.
- Z menu w prawym górnym rogu wybierz pozycję Kompiluj.
- W lewym panelu wybierz pozycję Dostrajanie.
- Wybierz kartę Usługi sztucznej inteligencji , aby wyświetlić stan zadań dostrajania i utworzonych modeli. Wybierz nazwę modelu, aby otworzyć stronę szczegółów modelu, na której można wyświetlić stan trenowania, uruchomić testy i zarządzać wdrożeniami.
Następny krok
Zawartość niestandardowego głosu, takiego jak dane, modele, testy i punkty końcowe, jest zorganizowana w projekty w usłudze Speech Studio. Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt z kobiecym głosem dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stanach Zjednoczonych.
Aby zacząć, wystarczy kilka plików audio i powiązanych transkrypcji. Sprawdź, czy niestandardowy głos jest dostępny dla twojego języka i regionu.
Rozpocznij dostrajanie
Aby dostosować profesjonalny model głosu, wykonaj następujące kroki:
Zaloguj się do programu Speech Studio.
Wybierz subskrypcję i zasób usługi Mowa do pracy.
Ważne
Personalizowane szkolenie głosowe jest obecnie dostępne tylko w niektórych regionach. Po wytrenowanym modelu głosowym w obsługiwanym regionie możesz skopiować go do zasobu usługi Mowa w innym regionie zgodnie z potrzebami. Aby uzyskać więcej informacji, zobacz przypisy dolne w tabeli regionów .
Wybierz pozycję Niestandardowy głos>Utwórz projekt.
Wybierz Niestandardowy neuronowy głos Pro>Dalej.
Postępuj zgodnie z instrukcjami podanymi przez kreatora, aby utworzyć projekt.
Wybierz nowy projekt według nazwy lub wybierz pozycję Przejdź do projektu. Te elementy menu są widoczne na panelu po lewej stronie: Konfigurowanie talentów głosowych, Przygotowywanie danych treningowych, Trenowanie modelu i Wdrażanie modelu.
Następne kroki
Profesjonalne projekty głosowe zawierają oświadczenie o wyrażeniu zgody na talent głosowy, zestawy danych szkoleniowych, modele głosowe i punkty końcowe.
Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt z kobiecym głosem dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stanach Zjednoczonych.
Tworzenie projektu
Aby utworzyć profesjonalny projekt głosowy, użyj operacji Projects_Create niestandardowego interfejsu API dla głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:
- Ustaw wymaganą
kindwłaściwość naProfessionalVoice. Nie można później zmienić rodzaju. - Opcjonalnie, ustaw właściwość
locale. Ustawienia regionalne tego projektu. Kod ustawień regionalnych jest zgodny ze standardem BCP-47. Listę ustawień regionalnych text to speech można znaleźć here. Jeśli podasz ustawienia regionalne, projekt będzie można używać w programie Speech Studio. - Opcjonalnie ustaw właściwość
descriptiondla opisu projektu. Opis projektu można zmienić później.
Utwórz żądanie HTTP PUT, korzystając z identyfikatora URI, jak pokazano w przykładzie Projects_Create poniżej.
- Zastąp
YourResourceKeykluczem zasobu Speech. - Zastąp
YourResourceNamenazwą zasobu Speech. - Zastąp
ProjectIdelement wybranym identyfikatorem projektu. Identyfikator uwzględniający wielkość liter musi być unikatowy w ramach zasobu Speech. Id będzie używany w URI projektu i nie będzie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice",
"locale": "en-US"
} ' "https://YourResourceName.cognitiveservices.azure.com/customvoice/projects/ProjectId?api-version=2026-01-01"
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"locale": "en-US",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
Używasz projektu id w kolejnych żądaniach API, aby dodać zgodę talentu głosowego i utworzyć zestaw szkoleniowy.