Udostępnij za pośrednictwem


Tworzenie projektu dla profesjonalnego głosu

Zawartość niestandardowego neuronowego głosu , takiego jak dane, modele, testy i punkty końcowe, są zorganizowane w projekty w usłudze Speech Studio. Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt dla kobiecego głosu dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stany Zjednoczone.

Napiwek

Wypróbuj niestandardowy neuronowy głos (CNV) Lite , aby przeprowadzić pokaz i ocenić CNV przed zainwestowaniem w profesjonalne nagrania, aby stworzyć głos o wyższej jakości.

Wszystko, co trzeba rozpocząć, to kilka plików audio i skojarzonych transkrypcji. Sprawdź, czy niestandardowy neuronowy głos obsługuje Twój język i region.

Tworzenie niestandardowego projektu neuronowego głosu Pro

Aby utworzyć niestandardowy projekt neuronowego głosu Pro, wykonaj następujące kroki:

  1. Zaloguj się do programu Speech Studio.

  2. Wybierz subskrypcję i zasób usługi Mowa do pracy.

    Ważne

    Niestandardowe trenowanie neuronowego głosu jest obecnie dostępne tylko w niektórych regionach. Po wytrenowanym modelu głosowym w obsługiwanym regionie możesz skopiować go do zasobu usługi Mowa w innym regionie zgodnie z potrzebami. Aby uzyskać więcej informacji, zobacz przypisy dolne w tabeli regionów .

  3. Wybierz pozycję Niestandardowy głos>Utwórz projekt.

  4. Wybierz pozycję Niestandardowy neuronowy głos Pro>Dalej.

  5. Postępuj zgodnie z instrukcjami podanymi przez kreatora, aby utworzyć projekt.

Wybierz nowy projekt według nazwy lub wybierz pozycję Przejdź do projektu. Te elementy menu zostaną wyświetlone na panelu po lewej stronie: Konfigurowanie talentów głosowych, Przygotowywanie danych treningowych, Trenowanie modelu i Wdrażanie modelu.

Następne kroki

Profesjonalne projekty głosowe zawierają instrukcję wyrażania zgody na talent głos, zestawy danych szkoleniowych, modele głosowe i punkty końcowe.

Każdy projekt jest specyficzny dla kraju/regionu i języka oraz płci głosu, który chcesz utworzyć. Możesz na przykład utworzyć projekt dla kobiecego głosu dla czatbotów centrum telefonicznego, które używają języka angielskiego w Stany Zjednoczone.

Tworzenie projektu

Aby utworzyć profesjonalny projekt głosowy, użyj Projects_Create operacji niestandardowego interfejsu API głosu. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:

  • Ustaw wymaganą kind właściwość na ProfessionalVoice. Nie można później zmienić rodzaju.
  • Opcjonalnie ustaw description właściwość opisu projektu. Opis projektu można zmienić później.

Utwórz żądanie HTTP PUT przy użyciu identyfikatora URI, jak pokazano w poniższym przykładzie Projects_Create .

  • Zastąp YourResourceKey ciąg kluczem zasobu usługi Mowa.
  • Zastąp YourResourceRegion element regionem zasobu usługi Mowa.
  • Zastąp ProjectId element wybranym identyfikatorem projektu. Identyfikator uwzględniający wielkość liter musi być unikatowy w ramach zasobu usługi Mowa. Identyfikator będzie używany w identyfikatorze URI projektu i nie można go później zmienić.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

Projekt jest używany w kolejnych żądaniach interfejsu id API, aby dodać zgodę na talent głosowy i utworzyć zestaw szkoleniowy.

Następne kroki