Compatibilidad con idiomas y voz para Azure Voz

En las tablas siguientes se resume la compatibilidad del lenguaje con speech a texto, text to speech, pronunciation assessment, speech translation y más características de Azure Speech. Úselos para comprobar si el idioma de destino y la configuración regional están disponibles para cada Azure funcionalidad de voz.

También puede ver la lista de configuraciones regionales y voces admitidas para cada región o punto de conexión específicos:

Idiomas admitidos

La compatibilidad con idiomas varía según la funcionalidad de Azure Voz.

Nota

Consulte los contenedores de voz y la documentación de voz insertada para sus idiomas admitidos.

Elija una característica:

En la tabla de esta sección se resumen las configuraciones regionales admitidas para la transcripción en tiempo real, la transcripción rápida y la transcripción por lotes.

En esta sección

Propina

Para compilar y ejecutar ejemplos en Visual Studio Code, pruebe el Azure Speech Toolkit.

Configuraciones regionales de conversión de voz en texto

Configuración regional (BCP-47) Idioma Compatibilidad con la transcripción rápida
af-ZA Afrikaans (Sudáfrica)
am-ET Amharico (Etiopía)
ar-AE Árabe (Emiratos Árabes Unidos)
ar-BH Árabe (Bahréin)
ar-DZ Árabe (Argelia)
ar-EG Árabe (Egipto)
ar-IL Árabe (Israel)
ar-IQ Árabe (Irak)
ar-JO Árabe (Jordania)
ar-KW Árabe (Kuwait)
ar-LB Árabe (Líbano)
ar-LY Árabe (Libia)
ar-MA Árabe (Marruecos)
ar-OM Árabe (Oman)
ar-PS Árabe (Autoridad Palestina)
ar-QA Árabe (Qatar)
ar-SA Árabe (Arabia Saudita)
ar-SY Árabe (Siria)
ar-TN Árabe (Túnez)
ar-YE Árabe (Yemen)
as-IN Asamés (India)
az-AZ Azerbaiyán (latino, Azerbaiyán)
bg-BG Búlgaro (Bulgaria)
bn-IN Bengalí (India)
bs-BA Bosnio (Bosnia y Herzegovina)
ca-ES Catalán
cs-CZ Checo (Checo)
cy-GB Welsh (Reino Unido)
da-DK Danés (Dinamarca)
de-AT Alemán (Austria)
de-CH Alemán (Suiza)
de-DE Alemán (Alemania)
el-GR Griego (Grecia)
en-AU Inglés (Australia)
en-CA Inglés (Canadá)
en-GB Inglés (Reino Unido)
en-GH Inglés (Ghana)
en-HK Inglés (RAE de Hong Kong)
en-IE Inglés (Irlanda)
en-IN Inglés (India)
en-KE Inglés (Kenia)
en-NG Inglés (Nigeria)
en-NZ Inglés (Nueva Zelanda)
en-PH Inglés (Filipinas)
en-SG Inglés (Singapur)
en-TZ Inglés (Tanzania)
en-US Inglés (Estados Unidos)
en-ZA Inglés (Sudáfrica)
es-AR Español (Argentina)
es-BO Español (Bolivia)
es-CL Español (Chile)
es-CO Español (Colombia)
es-CR Español (Costa Rica)
es-CU Español (Cuba)
es-DO Español (República Dominicana)
es-EC Español (Ecuador)
es-ES Español (España)
es-GQ Español (Guinea Ecuatorial)
es-GT Español (Guatemala)
es-HN Español (Honduras)
es-MX Español (México)
es-NI Español (Nicaragua)
es-PA Español (Panamá)
es-PE Español (Perú)
es-PR Español (Puerto Rico)
es-PY Español (Paraguay)
es-SV Español (El Salvador)
es-US Español (Estados Unidos)1
es-UY Español (Uruguay)
es-VE Español (Venezuela)
et-EE Estonio (Estonia)
eu-ES Vasco
fa-IR Persa (Irán)
fi-FI Finlandés (Finlandia)
fil-PH Filipinas (Filipinas)
fr-BE Francés (Bélgica)
fr-CA Francés (Canadá)
fr-CH Francés (Suiza)
fr-FR Francés (Francia)
ga-IE Irlandés (Irlanda)
gl-ES Gallego
gu-IN Gujarati (India)
he-IL Hebreo (Israel)
hi-IN Hindi (India)
hr-HR Croata (Croacia)
hu-HU Húngaro (Hungría)
hy-AM Armenio (Armenia)
id-ID Indonesia (Indonesia)
is-IS Islandés (Islandia)
it-CH Italiano (Suiza)
it-IT Italiano (Italia)
ja-JP Japonés (Japón)
jv-ID Javanese (latino, Indonesia)
ka-GE Georgiano (Georgia)
kk-KZ Kazajo (Kazajstán)
km-KH Khmer (Camboya)
kn-IN Canarés (India)
ko-KR Coreano (Corea)
lo-LA Lao (Laos)
lt-LT Lituano (Lituania)
lv-LV Letón (Letonia)
mk-MK Macedonio (Macedonia del Norte)
ml-IN Malayalam (India)
mn-MN Mongolia (Mongolia)
mr-IN Maratí (India)
ms-MY Malayo (Malasia)
mt-MT Maltés (Malta)
my-MM Birmano (Myanmar)
nb-NO Noruego Bokmål (Noruega)
ne-NP Nepalí (Nepal)
nl-BE Neerlandés (Bélgica)
nl-NL Neerlandés (Países Bajos)
or-IN Odia (India)
pa-IN Punjabí (India)
pl-PL Polaco (Polonia)
ps-AF Pashto (Afganistán)
pt-BR Portugués (Brasil)
pt-PT Portugués (Portugal)
ro-RO Rumano (Rumania)
ru-RU Ruso (Rusia)
si-LK Cingalés (Sri Lanka)
sk-SK Eslovaco (Eslovaquia)
sl-SI Esloveno (Eslovenia)
so-SO Somalia (Somalia)
sq-AL Albanés (Albania)
sr-RS Serbio (cirílico, Serbia)
sv-SE Sueco (Suecia)
sw-KE Kiswahili (Kenia)
sw-TZ Kiswahili (Tanzania)
ta-IN Tamil (India)
te-IN Telugu (India)
th-TH Tailandés (Tailandia)
tr-TR Turco (Türkiye)
uk-UA Ucrania (Ucrania)
ur-IN Urdu (India)
uz-UZ Uzbek (latino, Uzbekistán)
vi-VN Vietnamita (Vietnam)
wuu-CN Chino (Wu, simplificado)
yue-CN Chino (cantonés, simplificado)
zh-CN Chino (mandarín, simplificado)
zh-CN-shandong Chino (Jilu Mandarín, simplificado)
zh-CN-sichuan Chino (mandarín suroeste, simplificado)
zh-HK Chino (cantonés, tradicional)
zh-TW Chino (mandarín taiwanés, tradicional)
zu-ZA Zulu (Sudáfrica)

Voz personalizada

Para mejorar la precisión del reconocimiento de voz a texto, puede personalizar algunos lenguajes y modelos base. Dependiendo de la configuración regional, puede cargar audio con transcripciones con etiquetas humanas, texto sin formato, texto estructurado y datos de pronunciación. De forma predeterminada, todos los modelos base disponibles admiten la personalización de texto sin formato. Para obtener más información sobre la personalización, consulte ¿Qué es la voz personalizada?.

Configuración regional (BCP-47) Idioma Compatibilidad con voz personalizada
af-ZA Afrikaans (Sudáfrica) Texto sin formato
am-ET Amharico (Etiopía) Texto sin formato
ar-AE Árabe (Emiratos Árabes Unidos) Transcripción con etiqueta humana y audio

Texto sin formato
ar-BH Árabe (Bahréin) Transcripción con etiqueta humana y audio

Texto sin formato
ar-DZ Árabe (Argelia) Transcripción con etiqueta humana y audio

Texto sin formato
ar-EG Árabe (Egipto) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
ar-IL Árabe (Israel) Transcripción con etiqueta humana y audio

Texto sin formato
ar-IQ Árabe (Irak) Transcripción con etiqueta humana y audio

Texto sin formato
ar-JO Árabe (Jordania) Transcripción con etiqueta humana y audio

Texto sin formato
ar-KW Árabe (Kuwait) Transcripción con etiqueta humana y audio

Texto sin formato
ar-LB Árabe (Líbano) Transcripción con etiqueta humana y audio

Texto sin formato
ar-LY Árabe (Libia) Transcripción con etiqueta humana y audio

Texto sin formato
ar-MA Árabe (Marruecos) Transcripción con etiqueta humana y audio

Texto sin formato
ar-OM Árabe (Oman) Transcripción con etiqueta humana y audio

Texto sin formato
ar-PS Árabe (Autoridad Palestina) Transcripción con etiqueta humana y audio

Texto sin formato
ar-QA Árabe (Qatar) Transcripción con etiqueta humana y audio

Texto sin formato
ar-SA Árabe (Arabia Saudita) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
ar-SY Árabe (Siria) Transcripción con etiqueta humana y audio

Texto sin formato
ar-TN Árabe (Túnez) Transcripción con etiqueta humana y audio

Texto sin formato
ar-YE Árabe (Yemen) Transcripción con etiqueta humana y audio

Texto sin formato
as-IN Asamés (India) Transcripción con etiqueta humana y audio
az-AZ Azerbaiyán (latino, Azerbaiyán) Texto sin formato
bg-BG Búlgaro (Bulgaria) Texto sin formato
bn-IN Bengalí (India) Transcripción con etiqueta humana y audio

Texto sin formato
bs-BA Bosnio (Bosnia y Herzegovina) Texto sin formato
ca-ES Catalán Texto sin formato

Pronunciación
cs-CZ Checo (Checo) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
cy-GB Welsh (Reino Unido) Texto sin formato
da-DK Danés (Dinamarca) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
de-AT Alemán (Austria) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
de-CH Alemán (Suiza) Transcripción con etiqueta humana y audio

Texto sin formato

Pronunciación
de-DE Alemán (Alemania) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
el-GR Griego (Grecia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
en-AU Inglés (Australia) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-CA Inglés (Canadá) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-GB Inglés (Reino Unido) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-GH Inglés (Ghana) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Pronunciación
en-HK Inglés (RAE de Hong Kong) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-IE Inglés (Irlanda) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-IN Inglés (India) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-KE Inglés (Kenia) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Pronunciación
en-NG Inglés (Nigeria) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-NZ Inglés (Nueva Zelanda) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-PH Inglés (Filipinas) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-SG Inglés (Singapur) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-TZ Inglés (Tanzania) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Pronunciación
en-US Inglés (Estados Unidos) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
en-ZA Inglés (Sudáfrica) Transcripción con etiqueta humana y audio

Audio

Texto sin formato

Texto estructurado

Pronunciación
es-AR Español (Argentina) Texto sin formato

Texto estructurado

Pronunciación
es-BO Español (Bolivia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-CL Español (Chile) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-CO Español (Colombia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-CR Español (Costa Rica) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-CU Español (Cuba) Texto sin formato

Texto estructurado

Pronunciación
es-DO Español (República Dominicana) Texto sin formato

Texto estructurado

Pronunciación
es-EC Español (Ecuador) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-ES Español (España) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
es-GQ Español (Guinea Ecuatorial) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
es-GT Español (Guatemala) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-HN Español (Honduras) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-MX Español (México) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
es-NI Español (Nicaragua) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-PA Español (Panamá) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-PE Español (Perú) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-PR Español (Puerto Rico) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-PY Español (Paraguay) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-SV Español (El Salvador) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-US Español (Estados Unidos) Texto sin formato

Texto estructurado

Pronunciación
es-UY Español (Uruguay) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
es-VE Español (Venezuela) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
et-EE Estonio (Estonia) Texto sin formato

Pronunciación
eu-ES Vasco Texto sin formato
fa-IR Persa (Irán) Texto sin formato
fi-FI Finlandés (Finlandia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
fil-PH Filipinas (Filipinas) Texto sin formato

Pronunciación
fr-BE Francés (Bélgica) Texto sin formato
fr-CA Francés (Canadá) Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
fr-CH Francés (Suiza) Texto sin formato

Pronunciación
fr-FR Francés (Francia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
ga-IE Irlandés (Irlanda) Texto sin formato

Pronunciación
gl-ES Gallego Texto sin formato
gu-IN Gujarati (India) Transcripción con etiqueta humana y audio

Texto sin formato
he-IL Hebreo (Israel) Transcripción con etiqueta humana y audio

Texto sin formato
hi-IN Hindi (India) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
hr-HR Croata (Croacia) Texto sin formato

Pronunciación
hu-HU Húngaro (Hungría) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
hy-AM Armenio (Armenia) Texto sin formato
id-ID Indonesia (Indonesia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Pronunciación
is-IS Islandés (Islandia) Texto sin formato
it-CH Italiano (Suiza) Texto sin formato
it-IT Italiano (Italia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
ja-JP Japonés (Japón) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
jv-ID Javanese (latino, Indonesia) Texto sin formato
ka-GE Georgiano (Georgia) Texto sin formato
kk-KZ Kazajo (Kazajstán) Texto sin formato
km-KH Khmer (Camboya) Texto sin formato
kn-IN Canarés (India) Transcripción con etiqueta humana y audio

Texto sin formato
ko-KR Coreano (Corea) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
lo-LA Lao (Laos) Texto sin formato
lt-LT Lituano (Lituania) Texto sin formato

Pronunciación
lv-LV Letón (Letonia) Texto sin formato

Pronunciación
mk-MK Macedonio (Macedonia del Norte) Texto sin formato
ml-IN Malayalam (India) Transcripción con etiqueta humana y audio

Texto sin formato
mn-MN Mongolia (Mongolia) Texto sin formato
mr-IN Maratí (India) Transcripción con etiqueta humana y audio

Texto sin formato
ms-MY Malayo (Malasia) Texto sin formato
mt-MT Maltés (Malta) Texto sin formato
my-MM Birmano (Myanmar) Texto sin formato
nb-NO Noruego BokmÃ**l (Noruega) Texto sin formato

Formato de salida
ne-NP Nepalí (Nepal) Texto sin formato
nl-BE Neerlandés (Bélgica) Texto sin formato
nl-NL Neerlandés (Países Bajos) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
or-IN Odia (India) Transcripción con etiqueta humana y audio
pa-IN Punjabí (India) Transcripción con etiqueta humana y audio
pl-PL Polaco (Polonia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
ps-AF Pashto (Afganistán) Texto sin formato
pt-BR Portugués (Brasil) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
pt-PT Portugués (Portugal) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
ro-RO Rumano (Rumania) Texto sin formato

Pronunciación
ru-RU Ruso (Rusia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
si-LK Cingalés (Sri Lanka) Texto sin formato
sk-SK Eslovaco (Eslovaquia) Texto sin formato

Pronunciación
sl-SI Esloveno (Eslovenia) Texto sin formato

Pronunciación
so-SO Somalia (Somalia) Texto sin formato
sq-AL Albanés (Albania) Texto sin formato
sr-ME Serbio (Montenegro) Texto sin formato
sr-RS Serbio (cirílico, Serbia) Texto sin formato
sr-XK Serbio (Kosovo) Texto sin formato
sv-SE Sueco (Suecia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida

Pronunciación
sw-KE Kiswahili (Kenia) Texto sin formato
sw-TZ Kiswahili (Tanzania) Texto sin formato
ta-IN Tamil (India) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
te-IN Telugu (India) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado
th-TH Tailandés (Tailandia) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
tr-TR Turco (TÃ1/4rkiye) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
uk-UA Ucrania (Ucrania) Transcripción con etiqueta humana y audio

Texto sin formato
ur-IN Urdu (India) Transcripción con etiqueta humana y audio
uz-UZ Uzbek (latino, Uzbekistán) Texto sin formato
vi-VN Vietnamita (Vietnam) Texto sin formato
wuu-CN Chino (Wu, simplificado) Texto sin formato
yue-CN Chino (cantonés, simplificado) Texto sin formato
zh-CN Chino (mandarín, simplificado) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
zh-CN-shandong Chino (Jilu Mandarín, simplificado) Texto sin formato
zh-CN-sichuan Chino (mandarín suroeste, simplificado) Texto sin formato
zh-HK Chino (cantonés, tradicional) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
zh-TW Chino (mandarín taiwanés, tradicional) Transcripción con etiqueta humana y audio

Texto sin formato

Texto estructurado

Formato de salida
zu-ZA isiZulu (Sudáfrica) Texto sin formato

Nota

La lista de frases es una característica de reconocimiento en tiempo de ejecución, no una funcionalidad de personalización del modelo. Puede usar listas de frases con transcripción en tiempo real y transcripción rápida en puntos de conexión de voz base y personalizados, para configuraciones regionales en las que está habilitada la característica. La lista de frases no requiere el entrenamiento del modelo. Para obtener detalles de uso y configuraciones regionales compatibles, consulte Mejora de la precisión del reconocimiento con la lista de frases.

Compatibilidad con la visualización de voz personalizada

Estas configuraciones regionales admiten la característica de formato de texto para mostrar: da-DK, de-DEen-AUen-CAen-GBen-HKen-IEen-INen-NGen-NZen-PHen-SGen-USes-ESes-MXfi-FIfr-CAfr-FRhi-INit-ITja-JPko-KRnb-NOnl-NLpl-PLpt-BRpt-PTsv-SEtr-TR, . zh-CNzh-HK

Traducción de voz de LLM

LLM Speech admite los siguientes idiomas para la transcripción y la traducción.

Configuración regional Idioma Compatibilidad con la traducción de voz de LLM
de Alemán
en Inglés
es Español
fr Francés
it Italiano
ja Japonés
ko Coreano
pt Portugués
zh Chino

Idiomas admitidos por MAI Transcribe-1

En la tabla siguiente se resumen los idiomas admitidos por MAI Transcribe-1 para el reconocimiento de voz.

Código de idioma Idioma Compatibilidad con MAI-Transcribe-1.5 Compatibilidad con MAI-transcribe-1
ar Árabe
as Assamese
bg Búlgaro
bn Bengalí
ca Catalán
cs Checo
da Danés
de Alemán
el Griego
en Inglés
es Español
et Estonio
fi Finlandés
fr Francés
gu Gujarati
hi Hindi
hu Húngaro
id Indonesio
it Italiano
ja Japonés
kn Kannada
ko Coreano
lt Lituano
ml Malayalam
mr Marathi
nb Noruego Bokmål
nl Holandés
or Odia
pa Punjabi (script de Gurmukhi)
pl Polaco
pt Portugués
ro Rumano
ru Ruso
sk Eslovaco
sl Esloveno
sv Sueco
ta Tamil
te Telugu
th Tailandés
tr Turco
uk Ucraniano
vi Vietnamita