Compartir a través de


Compatibilidad con idiomas en Video Indexer de Azure AI

En este artículo se explican las opciones de idioma de Video Indexer y se proporciona una lista de compatibilidad con idiomas para cada uno. Incluye la compatibilidad de idiomas con características de Video Indexer, traducción, identificación de idioma, personalización y configuración de idioma del sitio web de Video Indexer.

Idiomas admitidos por escenario

En esta sección se explican las opciones de idioma de Video Indexer y se incluye una tabla de los idiomas admitidos para cada uno.

Importante

Todos los idiomas enumerados admiten la traducción al indexar a través de la API.

Explicaciones de columna

  • Idioma de origen admitido: el idioma hablado en el archivo multimedia compatible con la transcripción, la traducción y la búsqueda.

  • Identificación del idioma: indica si Video Indexer puede detectar automáticamente el idioma cuando se usa la identificación del idioma para la indexación. Para más información, consulte Uso de Azure AI Video Indexer para identificar automáticamente los idiomas hablados y la sección Identificación del idioma.

  • Personalización (modelo de lenguaje): indica si el lenguaje se puede usar al personalizar modelos de lenguaje en Video Indexer. Para más información, consulte Personalización de un modelo de lenguaje en Video Indexer de Azure AI.

  • Pronunciación (modelo de lenguaje): indica si el lenguaje se puede usar para crear un conjunto de datos de pronunciación como parte de un modelo de voz personalizado. Para más información, consulte Personalización de un modelo de voz con Azure AI Video Indexer.

  • Traducción de sitios web: indica si el idioma es compatible con la traducción al usar el sitio web de Azure AI Video Indexer. Seleccione el idioma traducido en el menú desplegable idioma.

    Captura de pantalla que muestra un menú con descarga, inglés y vistas como elementos de menú. Una información sobre herramientas se muestra como mouseover en el elemento en inglés y dice Traducción está establecida en inglés.

    Las siguientes conclusiones se traducen:

    • Expediente
    • Palabras clave
    • Temas
    • Etiquetas
    • Patrones de marco (solo para hebreo por ahora).

    Todas las demás conclusiones aparecen en inglés al usar la traducción.

  • Idioma del sitio web: indica si el idioma se puede seleccionar para su uso en el sitio web de Video Indexer de Azure AI. Seleccione el icono Configuración y, a continuación, seleccione el idioma en la lista desplegable Configuración de idioma .

    Captura de pantalla que muestra un menú con la configuración del usuario en la que se muestran todos activados.

Lenguaje Código Soportado
lengua origen
Language
identificación
Personalización
(modelo de lenguaje)
Pronunciación
(modelo de lenguaje)
Sitio web
Traducción
Sitio web
Idioma
Afrikáans af-ZA
Árabe (Israel) ar-IL
Árabe (Iraq) ar-IQ
Árabe (Jordania) ar-JO
Árabe (Kuwait) ar-KW
Árabe (Líbano) ar-LB
Árabe (Omán) ar-OM
Árabe (Autoridad Palestina) ar-PS
Árabe (Qatar) ar-QA
Árabe (Arabia Saudí) ar-SA
Árabe (Emiratos Árabes Unidos) ar-AE
Árabe (Egipto) ar-EG
Árabe estándar moderno (Bahréin) ar-BH
Árabe (República Árabe Siria) ar-SY
Armenio hy-AM
Bengalí bn-BD
Bosnio bs-Latn
Búlgaro bg-BG
Catalán ca-ES
Chino (cantonés, tradicional) zh-HK
Chino (simplificado) zh-Hans
Chino (simplificado) zh-CK
Chino (tradicional) zh-Hant
Croata hr-HR
Checo cs-CZ
Danés da-DK
Neerlandés nl-NL
Inglés (Australia) en-AU
Inglés (Reino Unido) en-GB
Inglés (Estados Unidos) en-US
Estonio et-EE
Fiyiano en-FJ
Filipino fil-PH
Finés fi-FI
Francés fr-FR
Francés (Canadá) fr-CA
Alemán de-DE
Griego el-GR
Gujarati gu-IN
Haitiano fr-HT
Hebreo he-IL
Hindi hi-IN
Húngaro hu-HU
Islandés is-IS
Indonesio id-ID
Irlandés ga-IE
Italiano it-IT
Japonés ja-JP
Canarés kn-IN
Kiswahili sw-KE
Coreano ko-KR
Letón lv-LV
Lituano lt-LT
Malgache mg-MG
Malayo ms-MY
Malayalam ml-IN
Maltés mt-MT
Noruego nb-NO
Persa fa-IR
Polaco pl-PL
Portugués pt-BR
Portugués (Portugal) pt-PT
Rumano ro-RO
Ruso ru-RU
Samoano en-WS
Serbio (cirílico) sr-Cyrl-RS
Serbio (latino) sr-Latn-RS
Eslovaco sk-SK
Esloveno sl-SI
Español es-ES
Español (México) es-MX
Sueco sv-SE
Tamil ta-IN
Telugu te-IN
Tailandés th-TH
Tongano to-TO
Turco tr-TR
Ucraniano uk-UA
Urdu ur-PK
Vietnamita vi-VN

Obtención de idiomas admitidos a través de la API

Use la llamada a get supported languages API para extraer una lista completa de los idiomas admitidos por área. Para obtener más información, vea Obtener idiomas admitidos.

La API devuelve una lista de idiomas admitidos con los siguientes valores:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Idioma de origen admitido:

    Si isSourceLanguage es false, el idioma solo se admite para la traducción. Si isSourceLanguage es true, el idioma se admite como origen para la transcripción, la traducción y la búsqueda.

  • Identificación de idioma (detección automática):

    Si isAutoDetect es true, el idioma se admite para la identificación de idioma (LID) y la identificación multi language (MLID).

Identificación del idioma

Al cargar un archivo multimedia en Video Indexer, puede especificar el idioma de origen del archivo multimedia. Si indexa un archivo a través del sitio web de Video Indexer, puede hacerlo seleccionando un idioma durante la carga de archivos. Si va a enviar el trabajo de indexación a través de la API, se realiza mediante el parámetro language. A continuación, se usa el idioma seleccionado para generar la transcripción del archivo.

Si no está seguro del idioma de origen del archivo multimedia o puede contener varios idiomas, Video Indexer puede detectar los idiomas hablados. Si selecciona Detectar automáticamente un solo idioma (LID) o multi-idioma (MLID) para el idioma de origen del archivo multimedia, se usará el idioma o los idiomas detectados para transcribir el archivo multimedia. Para más información sobre LID y MLID, consulte Uso de Azure AI Video Indexer para identificar automáticamente los idiomas hablados, consulte Identificación automática del idioma hablado con el modelo de identificación de idioma e Identificación automática y transcripción automática de contenido de varios idiomas.

Hay un límite de 10 idiomas permitidos para la identificación durante la indexación de un archivo multimedia para LID y MLID. A continuación se muestran los 9 idiomas predeterminados de identificación del idioma (LID) y la identificación multi language (MILD):

  • Alemán (de-DE)
  • Inglés Estados Unidos (en-US)
  • Español (es-ES)
  • Francés (fr-FR)
  • Italiano (it-IT)
  • Japonés (ja-JP)
  • Portugués (pt-BR)
  • Ruso (ru-RU)
  • Chino (simplificado) (zh-Hans)

Cómo cambiar la lista de idiomas predeterminados

Si necesita usar idiomas para la identificación que no se usan de forma predeterminada, puede personalizar la lista a cualquier 10 idiomas que admitan la personalización a través del sitio web o de la API:

Usar el sitio web para cambiar la lista

  1. Seleccione la pestaña Id. de idioma en Personalización del modelo. La lista de idiomas es específica de la cuenta de Video Indexer que usa y para el usuario que ha iniciado sesión. La lista predeterminada de idiomas se guarda por usuario en su dispositivo local, por dispositivo y explorador. Como resultado, cada usuario puede configurar su propia lista de idioma identificada predeterminada.

  2. Use Agregar idioma para buscar y agregar más idiomas. Si ya hay 10 idiomas seleccionados, primero debe quitar uno de los idiomas detectados existentes antes de agregar uno nuevo.

    Captura de pantalla que muestra una tabla que muestra todos los idiomas seleccionados.

Uso de la API para cambiar la lista

Al cargar un archivo, el modelo de lenguaje video Indexer cruza las referencias a 9 idiomas de forma predeterminada. Si hay una coincidencia, el modelo genera la transcripción para el archivo con el idioma detectado.

Use el parámetro language para especificar multi parámetros (MLID) o auto (LID). Use el customLanguages parámetro para especificar hasta 10 idiomas. (El parámetro solo se usa cuando el parámetro language está establecido en multi o auto). Para más información sobre el uso de la API, consulte Uso de Azure AI Video Indexer API.