Compatibilidad con idiomas en Video Indexer de Azure AI
En este artículo se explican las opciones de idioma de Video Indexer y se proporciona una lista de compatibilidad con idiomas para cada uno. Incluye la compatibilidad de idiomas con características de Video Indexer, traducción, identificación de idioma, personalización y configuración de idioma del sitio web de Video Indexer.
Idiomas admitidos por escenario
En esta sección se explican las opciones de idioma de Video Indexer y se incluye una tabla de los idiomas admitidos para cada uno.
Importante
Todos los idiomas enumerados admiten la traducción al indexar a través de la API.
Explicaciones de columna
Idioma de origen admitido: el idioma hablado en el archivo multimedia compatible con la transcripción, la traducción y la búsqueda.
Identificación del idioma: indica si Video Indexer puede detectar automáticamente el idioma cuando se usa la identificación del idioma para la indexación. Para más información, consulte Uso de Azure AI Video Indexer para identificar automáticamente los idiomas hablados y la sección Identificación del idioma.
Personalización (modelo de lenguaje): indica si el lenguaje se puede usar al personalizar modelos de lenguaje en Video Indexer. Para más información, consulte Personalización de un modelo de lenguaje en Video Indexer de Azure AI.
Pronunciación (modelo de lenguaje): indica si el lenguaje se puede usar para crear un conjunto de datos de pronunciación como parte de un modelo de voz personalizado. Para más información, consulte Personalización de un modelo de voz con Azure AI Video Indexer.
Traducción de sitios web: indica si el idioma es compatible con la traducción al usar el sitio web de Azure AI Video Indexer. Seleccione el idioma traducido en el menú desplegable idioma.
Las siguientes conclusiones se traducen:
- Expediente
- Palabras clave
- Temas
- Etiquetas
- Patrones de marco (solo para hebreo por ahora).
Todas las demás conclusiones aparecen en inglés al usar la traducción.
Idioma del sitio web: indica si el idioma se puede seleccionar para su uso en el sitio web de Video Indexer de Azure AI. Seleccione el icono Configuración y, a continuación, seleccione el idioma en la lista desplegable Configuración de idioma .
Lenguaje | Código | Soportado lengua origen |
Language identificación |
Personalización (modelo de lenguaje) |
Pronunciación (modelo de lenguaje) |
Sitio web Traducción |
Sitio web Idioma |
---|---|---|---|---|---|---|---|
Afrikáans | af-ZA | ✔ | |||||
Árabe (Israel) | ar-IL | ✔ | ✔ | ||||
Árabe (Iraq) | ar-IQ | ✔ | ✔ | ||||
Árabe (Jordania) | ar-JO | ✔ | ✔ | ✔ | |||
Árabe (Kuwait) | ar-KW | ✔ | ✔ | ✔ | |||
Árabe (Líbano) | ar-LB | ✔ | ✔ | ||||
Árabe (Omán) | ar-OM | ✔ | ✔ | ✔ | |||
Árabe (Autoridad Palestina) | ar-PS | ✔ | ✔ | ||||
Árabe (Qatar) | ar-QA | ✔ | ✔ | ✔ | |||
Árabe (Arabia Saudí) | ar-SA | ✔ | ✔ | ✔ | |||
Árabe (Emiratos Árabes Unidos) | ar-AE | ✔ | ✔ | ✔ | |||
Árabe (Egipto) | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Árabe estándar moderno (Bahréin) | ar-BH | ✔ | ✔ | ✔ | |||
Árabe (República Árabe Siria) | ar-SY | ✔ | ✔ | ✔ | |||
Armenio | hy-AM | ✔ | |||||
Bengalí | bn-BD | ✔ | |||||
Bosnio | bs-Latn | ✔ | |||||
Búlgaro | bg-BG | ✔ | ✔ | ✔ | |||
Catalán | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chino (cantonés, tradicional) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chino (simplificado) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chino (simplificado) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chino (tradicional) | zh-Hant | ✔ | |||||
Croata | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Checo | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Danés | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Neerlandés | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Inglés (Australia) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglés (Reino Unido) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglés (Estados Unidos) | en-US | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estonio | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fiyiano | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finés | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francés | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francés (Canadá) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Alemán | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Griego | el-GR | ✔ | ✔ | ✔ | |||
Gujarati | gu-IN | ✔ | ✔ | ✔ | |||
Haitiano | fr-HT | ✔ | |||||
Hebreo | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Húngaro | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Islandés | is-IS | ✔ | |||||
Indonesio | id-ID | ✔ | ✔ | ✔ | |||
Irlandés | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italiano | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonés | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Canarés | kn-IN | ✔ | ✔ | ||||
Kiswahili | sw-KE | ✔ | |||||
Coreano | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Letón | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lituano | lt-LT | ✔ | ✔ | ✔ | |||
Malgache | mg-MG | ✔ | |||||
Malayo | ms-MY | ✔ | ✔ | ||||
Malayalam | ml-IN | ✔ | ✔ | ||||
Maltés | mt-MT | ✔ | |||||
Noruego | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persa | fa-IR | ✔ | ✔ | ✔ | |||
Polaco | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugués | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugués (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Rumano | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ruso | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoano | en-WS | ||||||
Serbio (cirílico) | sr-Cyrl-RS | ✔ | |||||
Serbio (latino) | sr-Latn-RS | ✔ | |||||
Eslovaco | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Esloveno | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Español | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Español (México) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Sueco | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamil | ta-IN | ✔ | ✔ | ✔ | |||
Telugu | te-IN | ✔ | ✔ | ||||
Tailandés | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tongano | to-TO | ✔ | |||||
Turco | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ucraniano | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | ur-PK | ✔ | |||||
Vietnamita | vi-VN | ✔ | ✔ | ✔ |
Obtención de idiomas admitidos a través de la API
Use la llamada a get supported languages API para extraer una lista completa de los idiomas admitidos por área. Para obtener más información, vea Obtener idiomas admitidos.
La API devuelve una lista de idiomas admitidos con los siguientes valores:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Idioma de origen admitido:
Si
isSourceLanguage
es false, el idioma solo se admite para la traducción. SiisSourceLanguage
es true, el idioma se admite como origen para la transcripción, la traducción y la búsqueda.Identificación de idioma (detección automática):
Si
isAutoDetect
es true, el idioma se admite para la identificación de idioma (LID) y la identificación multi language (MLID).
Identificación del idioma
Al cargar un archivo multimedia en Video Indexer, puede especificar el idioma de origen del archivo multimedia. Si indexa un archivo a través del sitio web de Video Indexer, puede hacerlo seleccionando un idioma durante la carga de archivos. Si va a enviar el trabajo de indexación a través de la API, se realiza mediante el parámetro language. A continuación, se usa el idioma seleccionado para generar la transcripción del archivo.
Si no está seguro del idioma de origen del archivo multimedia o puede contener varios idiomas, Video Indexer puede detectar los idiomas hablados. Si selecciona Detectar automáticamente un solo idioma (LID) o multi-idioma (MLID) para el idioma de origen del archivo multimedia, se usará el idioma o los idiomas detectados para transcribir el archivo multimedia. Para más información sobre LID y MLID, consulte Uso de Azure AI Video Indexer para identificar automáticamente los idiomas hablados, consulte Identificación automática del idioma hablado con el modelo de identificación de idioma e Identificación automática y transcripción automática de contenido de varios idiomas.
Hay un límite de 10 idiomas permitidos para la identificación durante la indexación de un archivo multimedia para LID y MLID. A continuación se muestran los 9 idiomas predeterminados de identificación del idioma (LID) y la identificación multi language (MILD):
- Alemán (de-DE)
- Inglés Estados Unidos (en-US)
- Español (es-ES)
- Francés (fr-FR)
- Italiano (it-IT)
- Japonés (ja-JP)
- Portugués (pt-BR)
- Ruso (ru-RU)
- Chino (simplificado) (zh-Hans)
Cómo cambiar la lista de idiomas predeterminados
Si necesita usar idiomas para la identificación que no se usan de forma predeterminada, puede personalizar la lista a cualquier 10 idiomas que admitan la personalización a través del sitio web o de la API:
Usar el sitio web para cambiar la lista
Seleccione la pestaña Id. de idioma en Personalización del modelo. La lista de idiomas es específica de la cuenta de Video Indexer que usa y para el usuario que ha iniciado sesión. La lista predeterminada de idiomas se guarda por usuario en su dispositivo local, por dispositivo y explorador. Como resultado, cada usuario puede configurar su propia lista de idioma identificada predeterminada.
Use Agregar idioma para buscar y agregar más idiomas. Si ya hay 10 idiomas seleccionados, primero debe quitar uno de los idiomas detectados existentes antes de agregar uno nuevo.
Uso de la API para cambiar la lista
Al cargar un archivo, el modelo de lenguaje video Indexer cruza las referencias a 9 idiomas de forma predeterminada. Si hay una coincidencia, el modelo genera la transcripción para el archivo con el idioma detectado.
Use el parámetro language para especificar multi
parámetros (MLID) o auto
(LID). Use el customLanguages
parámetro para especificar hasta 10 idiomas. (El parámetro solo se usa cuando el parámetro language está establecido en multi
o auto
). Para más información sobre el uso de la API, consulte Uso de Azure AI Video Indexer API.