Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Todo lo que se necesita para empezar son unos cuantos archivos de audio y las transcripciones asociadas. Vea si la voz personalizada admite el idioma y la región.
Inicio de la optimización
En el portal de Microsoft Foundry, puede ajustar algunos modelos de Herramientas de Foundry. Por ejemplo, puede ajustar un modelo de voz profesional.
Para ajustar un modelo de voz profesional, siga estos pasos:
Ir al proyecto de Microsoft Foundry en el Portal de Microsoft Foundry. Si necesita crear un proyecto, consulte Creación de un proyecto de Microsoft Foundry.
Seleccione Ajuste preciso en el panel izquierdo.
Seleccione Ajuste preciso del servicio de IA>+ Ajuste preciso.
En el asistente, seleccione Voz personalizada (ajuste de voz profesional).
Seleccione Siguiente.
Siga las instrucciones proporcionadas por el asistente para crear el área de trabajo de ajuste.
Continuar con la optimización
Vaya a la documentación de Azure Speech in Foundry Tools para aprender a seguir ajustando el modelo de voz profesional:
- Agregar consentimiento de actor de voz
- Adición de conjuntos de datos de entrenamiento
- Entrenamiento del modelo de voz
- Implementación del modelo de voz profesional como punto de conexión
Visualización de los modelos ajustados
Después de ajustarlo, puede acceder a los modelos de voz personalizados e implementaciones desde la página Ajuste preciso.
Inicie sesión en el portal de Microsoft Foundry.
Seleccione Ajuste preciso en el panel izquierdo.
Seleccione Ajuste preciso del servicio de IA. Puede ver el estado de las tareas de ajuste y los modelos que se crearon.
Pasos siguientes
El contenido de voz personalizada , como datos, modelos, pruebas y puntos de conexión, se organizan en proyectos de Speech Studio. Cada proyecto es específico de un país/región y un idioma, y del género de la voz que desea crear. Por ejemplo, puede crear un proyecto de voz femenina para los bots de chat del centro de llamadas que utilizan el inglés de Estados Unidos.
Todo lo que se necesita para empezar son unos cuantos archivos de audio y las transcripciones asociadas. Vea si la voz personalizada admite el idioma y la región.
Inicio de la optimización
Para ajustar un modelo de voz profesional, siga estos pasos:
Inicie sesión en Speech Studio.
Seleccione la suscripción y el recurso de voz con los que quiere trabajar.
Importante
El entrenamiento de voz personalizada solo está disponible actualmente en algunas regiones. Una vez entrenado el modelo de voz en una región compatible, puede copiarlo en un recurso de Voz que se encuentre en otra región, según sea necesario. Consulte las notas al pie en la tabla de regiones para obtener más información.
Seleccione Voz personalizada>Crear un proyecto.
Seleccione Voz neuronal personalizada profesional>Siguiente.
Siga las instrucciones del asistente para crear el proyecto.
Seleccione el nuevo proyecto por el nombre o elija Ir al proyecto. Puede ver estos elementos de menú en el panel izquierdo: Configurar actor de voz, Preparar datos de entrenamiento, Entrenar modelo e Implementar modelo.
Pasos siguientes
Los proyectos profesionales de voz contienen la declaración de consentimiento del actor de voz, los conjuntos de datos de entrenamiento, los modelos de voz y los puntos de conexión.
Cada proyecto es específico de un país/región y un idioma, y del género de la voz que desea crear. Por ejemplo, puede crear un proyecto de voz femenina para los bots de chat del centro de llamadas que utilizan el inglés de Estados Unidos.
Crear un proyecto
Para crear un proyecto de Voz profesional, use la operación Projects_Create de la API de voz personalizada. Construya el cuerpo de la solicitud según las instrucciones siguientes:
- Establezca la propiedad
kindnecesaria enProfessionalVoice. El tipo no se puede cambiar más adelante. - Opcionalmente, establezca la propiedad
descriptionpara la descripción del proyecto. La descripción del proyecto se puede cambiar más adelante.
Haz una solicitud HTTP PUT usando el URI como se muestra en el siguiente ejemplo de Projects_Create.
- Reemplace
YourResourceKeypor su clave de recurso de Voz. - Reemplace
YourResourceRegionpor la región del recurso de Voz. - Reemplace
ProjectIdpor un identificador de proyecto de su elección. El identificador que distingue mayúsculas de minúsculas debe ser único dentro del recurso de Voz. El identificador se usará en el URI del proyecto y no se puede cambiar más adelante.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Project description",
"kind": "ProfessionalVoice"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/projects/ProjectId?api-version=2024-02-01-preview"
Debe recibir un cuerpo de respuesta en el formato siguiente:
{
"id": "ProjectId",
"description": "Project description",
"kind": "ProfessionalVoice",
"createdDateTime": "2023-04-01T05:30:00.000Z"
}
Use el proyecto id en las solicitudes de API posteriores para agregar consentimiento del actor de voz y crear un conjunto de formación.