Tworzenie projektu dla profesjonalnego głosu

Aby zacząć, wystarczy kilka plików audio i powiązanych transkrypcji. Sprawdź, czy niestandardowy głos jest dostępny dla twojego języka i regionu.

Rozpocznij dostrajanie

Aby dostosować profesjonalny model głosu w nowym portalu Microsoft Foundry, wykonaj następujące kroki:

  1. Zaloguj się do usługi Microsoft Foundry. Upewnij się, że przełącznik New Foundry jest włączony. Te właśnie kroki odnoszą się do Foundry (new).

  2. Z menu w prawym górnym rogu wybierz pozycję Kompiluj.

  3. W okienku po lewej stronie wybierz pozycję Modele.

  4. Na karcie AI Services wybierz Azure Speech — Text to Speech.

  5. W prawym górnym rogu tekstu na placu zabaw dla mowy wybierz pozycję Dostosuj , aby otworzyć okienko Dostrajanie modelu .

  6. W okienku Podstawowe szczegóły wypełnij następujące ustawienia:

    • Wybierz model: Sprawdź, czy wybrano Azure Speech - Text to Speech. Ta wartość jest wstępnie wypełniona na podstawie placu zabaw wprowadzonego z kreatora.
    • Typ: Sprawdź, czy wybrano pozycję Profesjonalny głos .
    • Płeć głosu: wybierz płeć talentu głosowego.
    • Język danych treningowych: wybierz język danych treningowych.
    • Nazwa głosu: wprowadź nazwę modelu głosowego.
    • Opis: opcjonalnie wprowadź opis.
  7. Wybierz Dalej.

Pozostaw otwarty panel Dostrajanie modelu i przejdź do Dodawanie zgody lektora, aby zarejestrować lektora.

Kontynuuj doskonalenie szczegółów

Przejdź do dokumentacji narzędzi Azure Speech in Foundry Tools, aby dowiedzieć się, jak kontynuować dostosowywanie profesjonalnego modelu głosu:

Wyświetl dopracowane modele

Po dostrojeniu możesz uzyskać dostęp do niestandardowych modeli głosu i wdrożeń na stronie Dostrajanie .

  1. Zaloguj się do usługi Microsoft Foundry. Upewnij się, że przełącznik New Foundry jest włączony. Kroki te dotyczą nowego Foundry.
  2. Z menu w prawym górnym rogu wybierz pozycję Kompiluj.
  3. W lewym panelu wybierz pozycję Dostrajanie.
  4. Wybierz kartę Usługi sztucznej inteligencji , aby wyświetlić stan zadań dostrajania i utworzonych modeli. Wybierz nazwę modelu, aby otworzyć stronę szczegółów modelu, na której można wyświetlić stan trenowania, uruchomić testy i zarządzać wdrożeniami.

Następny krok

Zawartość niestandardowego głosu, takiego jak dane, modele, testy i punkty końcowe, jest zorganizowana w projekty w usłudze Speech Studio. Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt z kobiecym głosem dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stanach Zjednoczonych.

Aby zacząć, wystarczy kilka plików audio i powiązanych transkrypcji. Sprawdź, czy niestandardowy głos jest dostępny dla twojego języka i regionu.

Rozpocznij dostrajanie

Aby dostosować profesjonalny model głosu, wykonaj następujące kroki:

  1. Zaloguj się do programu Speech Studio.

  2. Wybierz subskrypcję i zasób usługi Mowa do pracy.

    Ważne

    Personalizowane szkolenie głosowe jest obecnie dostępne tylko w niektórych regionach. Po wytrenowanym modelu głosowym w obsługiwanym regionie możesz skopiować go do zasobu usługi Mowa w innym regionie zgodnie z potrzebami. Aby uzyskać więcej informacji, zobacz przypisy dolne w tabeli regionów .

  3. Wybierz pozycję Niestandardowy głos>Utwórz projekt.

  4. Wybierz Niestandardowy neuronowy głos Pro>Dalej.

  5. Postępuj zgodnie z instrukcjami podanymi przez kreatora, aby utworzyć projekt.

Wybierz nowy projekt według nazwy lub wybierz pozycję Przejdź do projektu. Te elementy menu są widoczne na panelu po lewej stronie: Konfigurowanie talentów głosowych, Przygotowywanie danych treningowych, Trenowanie modelu i Wdrażanie modelu.

Następne kroki

Profesjonalne projekty głosowe zawierają oświadczenie o wyrażeniu zgody na talent głosowy, zestawy danych szkoleniowych, modele głosowe i punkty końcowe.

Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt z kobiecym głosem dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stanach Zjednoczonych.

Tworzenie projektu

Aby utworzyć profesjonalny projekt głosowy, użyj operacji Projects_Create niestandardowego interfejsu API dla głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:

  • Ustaw wymaganą kind właściwość na ProfessionalVoice. Nie można później zmienić rodzaju.
  • Opcjonalnie, ustaw właściwość locale. Ustawienia regionalne tego projektu. Kod ustawień regionalnych jest zgodny ze standardem BCP-47. Listę ustawień regionalnych text to speech można znaleźć here. Jeśli podasz ustawienia regionalne, projekt będzie można używać w programie Speech Studio.
  • Opcjonalnie ustaw właściwość description dla opisu projektu. Opis projektu można zmienić później.

Utwórz żądanie HTTP PUT, korzystając z identyfikatora URI, jak pokazano w przykładzie Projects_Create poniżej.

  • Zastąp YourResourceKey kluczem zasobu Speech.
  • Zastąp YourResourceName nazwą zasobu Speech.
  • Zastąp ProjectId element wybranym identyfikatorem projektu. Identyfikator uwzględniający wielkość liter musi być unikatowy w ramach zasobu Speech. Id będzie używany w URI projektu i nie będzie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "locale": "en-US"
} '  "https://YourResourceName.cognitiveservices.azure.com/customvoice/projects/ProjectId?api-version=2026-01-01"

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "locale": "en-US",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

Używasz projektu id w kolejnych żądaniach API, aby dodać zgodę talentu głosowego i utworzyć zestaw szkoleniowy.

Następne kroki