Inicio rápido: Texto a voz con Azure OpenAI Service
En este inicio rápido, usará Azure OpenAI Service para texto a voz con voces de OpenAI.
Las voces disponibles son: alloy
, echo
, fable
, onyx
, nova
y shimmer
. Para más información, consulte la documentación de referencia de Azure OpenAI Service para texto a voz.
Requisitos previos
- Una suscripción a Azure (cree una cuenta gratuita).
- Acceso concedido a Azure OpenAI Service en la suscripción de Azure deseada.
- Un recurso de Azure OpenAI creado en las regiones Centro-norte de EE. UU. o Centro de Suecia con el modelo implementado
tts-1
otts-1-hd
. Para obtener más información, consulte Creación de un recurso e implementación de un modelo con Azure OpenAI.
Nota:
Actualmente, debe enviar una aplicación para acceder a Azure OpenAI Service. Para solicitar acceso, complete este formulario.
Configuración
Recuperación de la clave y el punto de conexión
Para realizar correctamente una llamada en Azure OpenAI, necesita un punto de conexión y una clave.
Nombre de la variable | Valor |
---|---|
AZURE_OPENAI_ENDPOINT |
Este valor se puede encontrar en la sección Claves y punto de conexión al examinar el recurso en Azure Portal. Como alternativa, puede encontrar el valor en Azure OpenAI Studio>Playground>Code View. Punto de conexión de ejemplo: https://aoai-docs.openai.azure.com/ . |
AZURE_OPENAI_API_KEY |
Este valor se puede encontrar en la sección Claves y punto de conexión al examinar el recurso en Azure Portal. Puede usar KEY1 o KEY2 . |
Vaya al recurso en Azure Portal. El punto de conexión y las claves se pueden encontrar en la sección Administración de recursos. Copie el punto de conexión y la clave de acceso, ya que los necesita para autenticar las llamadas API. Puede usar KEY1
o KEY2
. Tener siempre dos claves permite rotar y regenerar las claves de forma segura sin provocar una interrupción del servicio.
Cree y asigne variables de entorno persistentes para la clave y el punto de conexión.
Variables de entorno
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
API DE REST
En un shell de Bash, ejecute el siguiente comando. Es necesario reemplazar YourDeploymentName
por el nombre de implementación que ha elegido al implementar el modelo de texto a voz. El nombre de implementación no es necesariamente el mismo que el nombre del modelo. Al escribir el nombre del modelo se producirá un error a menos que elija un nombre de implementación idéntico al nombre del modelo subyacente.
curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/speech?api-version=2024-02-15-preview \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "tts-1-hd",
"input": "I'm excited to try text to speech.",
"voice": "alloy"
}' --output speech.mp3
El formato de su primera línea del comando con un ejemplo de punto de conexión aparecería como se indica en curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/speech?api-version=2024-02-15-preview \
.
Importante
En el caso de producción, use una forma segura de almacenar sus credenciales y acceder a ellas, como Azure Key Vault. Para obtener más información sobre la seguridad de las credenciales, consulte el artículo Seguridad de servicios de Azure AI.
Limpieza de recursos
Si quiere limpiar y quitar un recurso de Azure OpenAI, puede eliminar el recurso. Antes de eliminar el recurso, primero deberá eliminar los modelos implementados.
Pasos siguientes
- Obtenga más información sobre cómo trabajar con texto a voz con Azure OpenAI Service en la documentación de referencia de Azure OpenAI Service.
- Para obtener más ejemplos, consulte el repositorio de GitHub de ejemplos de Azure OpenAl