Esdeveniment
Crea aplicacions intel·ligents
17 de març, 21 - 21 de març, 10
Uneix-te a la sèrie de trobades per crear solucions d'IA escalables basades en casos d'ús del món real amb altres desenvolupadors i experts.
Registreu-vos-hi araAquest navegador ja no s’admet.
Feu l’actualització al Microsoft Edge per aprofitar les característiques més recents, les actualitzacions de seguretat i l’assistència tècnica.
En este artículo, obtendrá información sobre las ventajas y funcionalidades de la traducción con Voz de Azure AI. El servicio Voz admite la conversión de voz a voz en varios idiomas en tiempo real y la traducción de voz a texto de secuencias de audio.
Con el SDK de Voz o la CLI de Voz, las aplicaciones, herramientas y dispositivos pueden acceder a las transcripciones de origen y a las salidas de traducción del audio proporcionado. A medida que se detecta la voz, se van devolviendo resultados provisionales de transcripción y traducción. Asimismo, los resultados finales pueden convertirse en voz sintetizada.
Para obtener una lista de los idiomas admitidos para la traducción de voz, consulte Compatibilidad con idiomas y voces.
Propina
Vaya a Speech Studio para probar y traducir rápidamente la voz en otros idiomas de su elección con baja latencia.
Entre las características principales de la traducción de voz se incluyen las siguientes:
La característica estándar que ofrece el servicio Voz es la capacidad de tomar una secuencia de audio de entrada en el idioma de origen especificado y traducirla y generarla como texto en el idioma de destino especificado.
Como complemento de la característica anterior, el servicio Voz también ofrece la opción de leer en voz alta el texto traducido mediante nuestra gran base de datos de voces previamente entrenadas, lo que permite una salida natural de la voz de entrada.
La traducción de voz multilingüe implementa un nuevo nivel de tecnología de traducción de voz que desbloquea diversas funcionalidades, como no tener ningún idioma de entrada especificado, controlar los conmutadores de idioma dentro de la misma sesión y admitir traducciones de streaming en vivo en inglés. Estas características permiten un nuevo nivel de habilidades de traducción de voz que se pueden implementar en sus productos.
Algunos casos de uso de traducción de voz multilingüe son los siguientes:
Para obtener una lista de los idiomas de entrada (origen) admitidos, consulte la documentación de idiomas de conversión de voz en texto. Para obtener una lista de los idiomas de salida (destino) admitidos, consulte la tabla Traducción al idioma del texto en la documentación de idiomas de traducción de voz.
Para obtener más información sobre la traducción de voz multilingüe, consulte la guía paso a paso de traducción de voz y ejemplos de traducción de voz en GitHub.
En escenarios en los que desea resultados en varios idiomas, el servicio Voz le ofrece directamente la posibilidad de traducir el idioma de entrada en dos idiomas de destino. Esto les permite recibir dos salidas y compartir estas traducciones con un público más amplio con una sola llamada API. Si se requieren más idiomas de salida, puede crear un recurso de varios servicios o usar servicios de traducción independientes.
Si necesita traducción en más de dos idiomas de destino, debe Crear un recurso de servicios de Azure AI o usar servicios de traducción independientes para más idiomas más allá del segundo. Si decide llamar al servicio de traducción de voz con un recurso de varios servicios, tenga en cuenta que se aplican tarifas de traducción a cada idioma además del segundo, en función del recuento de caracteres de la traducción.
Para calcular la tarifa de traducción aplicada, consulte Precios de Traductor de Azure AI.
Es importante tener en cuenta que el servicio de traducción de voz funciona en tiempo real y los resultados de voz intermedios se traducen para generar resultados de traducción intermedios. Por lo tanto, el volumen de traducción real es mayor que los tokens del audio de entrada. Se le cobra por la transcripción de voz a texto y la traducción de texto para cada idioma de destino.
Por ejemplo, supongamos que desea traducciones de texto de un archivo de audio de una hora a tres idiomas de destino. Si la transcripción inicial de voz a texto contiene 10 000 caracteres, es posible que se le cobren 2,80 USD.
Advertiment
Los precios de este ejemplo solo tienen fines ilustrativos. Consulte Precios de Voz de Azure AI y Precios de Traductor de Azure AI para obtener la información de precios más actualizada.
El precio del ejemplo anterior de 2,80 USD se ha calculado mediante la combinación de los costos de traducción de texto y transcripción de voz a texto. Aquí se muestra cómo se ha realizado el cálculo:
Como primer paso, pruebe con el artículo de Inicio rápido de traducción de voz. El servicio de traducción de voz está disponible con el SDK de Voz y la CLI de Voz.
Encontrará ejemplos de conversión de voz en texto y traducción del SDK de Voz en GitHub. En estos ejemplos se tratan escenarios comunes como la lectura de audio de un archivo o flujo, el reconocimiento y traducción únicos y continuos, y el trabajo con modelos personalizados.
Esdeveniment
Crea aplicacions intel·ligents
17 de març, 21 - 21 de març, 10
Uneix-te a la sèrie de trobades per crear solucions d'IA escalables basades en casos d'ús del món real amb altres desenvolupadors i experts.
Registreu-vos-hi araFormació
Mòdul
Traducción de voz con el servicio de Voz de Azure AI - Training
Traducción de voz con el servicio de Voz de Azure AI
Certificació
Microsoft Certified: Aspectos básicos de Azure AI - Certifications
Demostrar conceptos fundamentales de inteligencia artificial relacionados con el desarrollo de software y servicios de Microsoft Azure para crear soluciones de inteligencia artificial.
Documentació
Procedimientos para la traducción de voz: servicio de voz - Azure AI services
Obtenga información sobre cómo traducir la voz de un idioma a texto en otro idioma, incluidos los formatos de entrada de audio admitidos y la construcción de objetos.
Inicio rápido de traducción de voz: servicio Voz - Azure AI services
En este inicio rápido, se traslada interactivamente la voz de un idioma a texto en otro idioma.
¿Qué es Speech Service? - Azure AI services
El servicio de Voz proporciona funcionalidades de conversión de voz en texto, texto a voz y traducción de voz con un recurso de Azure. Agregue fácilmente funcionalidad de voz a sus aplicaciones, herramientas y dispositivos mediante el SDK de voz, Speech Studio o las API REST.