Compartir vía


Creación de un proyecto para voz profesional

El contenido de Voz neuronal personalizada, como datos, modelos, pruebas y puntos de conexión, se organiza en proyectos en Speech Studio. Cada proyecto es específico de un país/región y un idioma, y del género de la voz que desea crear. Por ejemplo, puede crear un proyecto de voz femenina para los bots de chat del centro de llamadas que utilizan el inglés de Estados Unidos.

Sugerencia

Pruebe Voz neuronal personalizada (CNV) Básico para realizar una demostración y evaluar CNV antes de invertir en grabaciones profesionales a fin de crear una voz de mayor calidad.

Todo lo que se necesita para empezar son unos cuantos archivos de audio y las transcripciones asociadas. Consulte si Voz neuronal personalizada admite su idioma y región.

Creación de un proyecto profesional de Voz neuronal personalizada

Para crear un proyecto profesional de Voz neuronal personalizada, siga estos pasos:

  1. Inicie sesión en Speech Studio.

  2. Seleccione la suscripción y el recurso de voz con los que quiere trabajar.

    Importante

    El entrenamiento de voz neuronal personalizada actualmente solo está disponible en algunas regiones. Una vez entrenado el modelo de voz en una región compatible, puede copiarlo en un recurso de Voz que se encuentre en otra región, según sea necesario. Consulte las notas al pie en la tabla de regiones para obtener más información.

  3. Seleccione Voz personalizada>Crear un proyecto.

  4. Seleccione Voz neuronal personalizada profesional>Siguiente.

  5. Siga las instrucciones del asistente para crear el proyecto.

Seleccione el nuevo proyecto por el nombre o elija Ir al proyecto. Verá estos elementos de menú en el panel izquierdo: Set up voice talent (Configurar actor de voz), Prepare training data (Preparar datos de entrenamiento), Entrenar modelo e Implementar modelo.

Pasos siguientes

Los proyectos profesionales de voz contienen la declaración de consentimiento del actor de voz, los conjuntos de datos de entrenamiento, los modelos de voz y los puntos de conexión.

Cada proyecto es específico de un país/región y un idioma, y del género de la voz que desea crear. Por ejemplo, puede crear un proyecto de voz femenina para los bots de chat del centro de llamadas que utilizan el inglés de Estados Unidos.

Creación de un proyecto

Para crear un proyecto de Voz profesional, use la operación Projects_Create de la API de voz personalizada. Construya el cuerpo de la solicitud según las instrucciones siguientes:

  • Establezca la propiedad kind necesaria en ProfessionalVoice. El tipo no se puede cambiar más adelante.
  • Opcionalmente, establezca la propiedad description para la descripción del proyecto. La descripción del proyecto se puede cambiar más adelante.

Haz una solicitud HTTP PUT usando el URI como se muestra en el siguiente ejemplo de Projects_Create.

  • Reemplace YourResourceKey por su clave de recurso de Voz.
  • Reemplace YourResourceRegion por la región del recurso de Voz.
  • Reemplace ProjectId por un identificador de proyecto de su elección. El identificador que distingue mayúsculas de minúsculas debe ser único dentro del recurso de Voz. El identificador se usará en el URI del proyecto y no se puede cambiar más adelante.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Project description",
  "kind": "ProfessionalVoice"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"

Debe recibir un cuerpo de respuesta en el formato siguiente:

{
  "id": "ProjectId",
  "description": "Project description",
  "kind": "ProfessionalVoice",
  "createdDateTime": "2023-04-01T05:30:00.000Z"
}

Use el proyecto id en las solicitudes de API posteriores para agregar consentimiento del actor de voz y crear un conjunto de formación.

Pasos siguientes