Compartilhar via


Suporte a idiomas no Azure AI Video Indexer

Este artigo explica as opções de idioma do Video Indexer e fornece uma lista de suporte a idiomas para cada uma. Ele inclui o suporte a idiomas para recursos do Video Indexer, tradução, identificação de idioma, personalização e as configurações de idioma do site do Video Indexer.

Idiomas com suporte por cenário

Esta seção explica as opções de idioma do Video Indexer e tem uma tabela dos idiomas com suporte para cada um.

Importante

Todos os idiomas listados suportam tradução ao indexar por meio da API.

Explicações da coluna

  • Idioma de origem com suporte – o idioma falado no arquivo de mídia com suporte para transcrição, tradução e pesquisa.

  • Identificação de idioma – se o idioma pode ser detectado automaticamente pelo Video Indexer quando a identificação de idioma é usada para indexação. Para saber mais, confira Usar o Azure AI Video Indexer para identificar automaticamente os idiomas falados e a seção Identificação de Idioma .

  • Personalização (modelo de linguagem) – se a linguagem pode ser usada ao personalizar modelos de linguagem no Video Indexer. Para saber mais, confira Personalizar um modelo de linguagem no Azure AI Video Indexer.

  • Pronúncia (modelo de idioma) – se o idioma pode ser usado para criar um conjunto de dados de pronúncia como parte de um modelo de fala personalizado. Para saber mais, confira Personalizar um modelo de fala com o Azure AI Video Indexer.

  • Tradução de site – se o idioma tem suporte para tradução ao usar o site do Azure AI Video Indexer. Selecione o idioma traduzido no menu suspenso de idiomas.

    Captura de tela mostrando um menu com download, inglês e visualizações como itens de menu. Uma dica de ferramenta é mostrada ao passar o mouse sobre o item em inglês e diz que a tradução está definida como inglês.

    Os seguintes insights são traduzidos:

    • Transcrição
    • Palavras-chave
    • Tópicos
    • Rótulos
    • Padrões de quadro (somente para hebraico a partir de agora)

    Todos os outros insights aparecem em inglês ao usar a tradução.

  • Idioma do site – se o idioma pode ser selecionado para uso no site do Azure AI Video Indexer. Selecione o ícone Configurações e, em seguida, selecione o idioma no menu suspenso Configurações de idioma.

    A captura de tela mostrando um menu com as configurações do usuário mostra todos ativados.

Idioma Código Suportado
Idioma de origem
Linguagem
identificação
Personalização
(modelo de linguagem)
Pronúncia
(modelo de linguagem)
Local na rede Internet
Tradução
Local na rede Internet
Idioma
Africâner af-ZA
Árabe (Israel) ar-IL
Árabe (Iraque) ar-IQ
Árabe (Jordânia) ar-JO
Árabe (Kuwait) ar-KW
Árabe (Líbano) ar-LB
Árabe (Omã) ar-OM
Árabe (Autoridade Palestina) ar-PS
Árabe (Catar) ar-QA
Árabe (Arábia Saudita) ar-SA
Árabe (Emirados Árabes Unidos) ar-AE
Árabe (Egito) ar-EG
Árabe Padrão Moderno (Barein) ar-BH
Árabe (República Árabe Síria) ar-SY
Armênia hy-AM
Bangla bn-BD
Bósnio bs-Latn
Búlgaro bg-BG
Catalão ca-ES
Chinês (Cantonês tradicional) zh-HK
Chinês (Simplificado) zh-Hans
Chinês (Simplificado) zh-CK
Chinês (Tradicional) zh-Hans
Croata hr-HR
Tcheco cs-CZ
Dinamarquês da-DK
Holandês nl-NL
Inglês (Austrália) en-AU
Inglês (Reino Unido) en-GB
Inglês (Estados Unidos) pt-BR
Estoniano et-EE
Fijiano pt-FJ
Filipino fil-PH
Finlandês fi-FI
Francês fr-FR
Francês (Canadá) fr-CA
Alemão de-DE
Grego el-GR
Guzerate gu-IN
Haitiano fr-HT
Hebraico he-IL
Híndi hi-IN
Húngaro hu-HU
Islandês iS-IS
Indonésio id-ID
Irlandês ga-IE
Italiano it-IT
Japonês ja-JP
canarim kn-IN
Suaíli sw-KE
Coreano ko-KR
Letão lv-LV
Lituano lt-LT
Malgaxe mg-MG
Malaio ms-MY
Malaiala ml-IN
Maltês mt-MT
Norueguês nb-NO
Persa fa-IR
Polonês pl-PL
Português pt-BR
Português (Portugal) pt-PT
Romeno ro-RO
Russo ru-RU
Samoano pt-WS
Sérvio (Cirílico) sr-Cyrl-RS
Sérvio (latino) sr-Latn-RS
Eslovaco sk-SK
Esloveno sl-SI
Espanhol es-ES
Espanhol (México) es-MX
Sueco sv-SE
Tâmil ta-IN
Télugo te-IN
Tailandês th-TH
Tongan para-PARA
Turco tr-TR
Ucraniano uk-UA
Urdu ur-PK
Vietnamita vi-VN

Obter idiomas suportados por meio da API

Use a chamada à API Obter Idiomas Suportados para obter uma lista completa de idiomas suportados por área. Para obter mais informações, consulte Obter idiomas com suporte.

A API retorna uma lista de idiomas com suporte com os seguintes valores:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Idioma de origem com suporte:

    Se isSourceLanguage for false, o idioma terá suporte apenas para tradução. Se isSourceLanguage for true, o idioma terá suporte como fonte para transcrição, tradução e pesquisa.

  • Identificação do idioma (detecção automática):

    Se isAutoDetect for true, o idioma terá suporte para identificação de idioma (LID) e identificação multilíngue (MLID).

Identificação de idioma

Ao carregar um arquivo de mídia no Video Indexer, você pode especificar o idioma de origem do arquivo de mídia. Se estiver indexando um arquivo por meio do site do Video Indexer, isso pode ser feito selecionando um idioma durante o carregamento do arquivo. Se você estiver enviando o trabalho de indexação por meio da API, isso será feito usando o parâmetro language. O idioma selecionado é então usado para gerar a transcrição do arquivo.

Se você não tiver certeza do idioma de origem do arquivo de mídia ou se ele puder conter vários idiomas, o Video Indexer poderá detectar os idiomas falados. Se você selecionar Detectar automaticamente um único idioma (LID) ou vários idiomas (MLID) para o idioma de origem do arquivo de mídia, o idioma ou idiomas detectados serão usados para transcrever o arquivo de mídia. Para saber mais sobre LID e MLID, consulte Usar o Azure AI Video Indexer para identificar automaticamente idiomas falados, consulte Identificar automaticamente o idioma falado com o modelo de identificação de idioma e Identificar e transcrever automaticamente conteúdo multilíngue

Há um limite de 10 idiomas permitidos para identificação durante a indexação de um arquivo de mídia para LID e MLID. A seguir estão os 9 idiomas padrão de identificação de idioma (LID) e identificação multilíngue (MILD):

  • Alemão (de-DE)
  • Inglês Estados Unidos (en-US)
  • Espanhol (es-ES)
  • Francês (fr-FR)
  • Italiano (it-IT)
  • Japonês (ja-JP)
  • Português (pt-BR)
  • Russo (ru-RU)
  • Chinês (simplificado) (zh-Hans)

Como alterar a lista de idiomas padrão

Se você precisar usar idiomas para identificação que não são usados por padrão, poderá personalizar a lista para quaisquer 10 idiomas que ofereçam suporte à personalização por meio do site ou da API:

Use o site para alterar a lista

  1. Selecione a guia ID do idioma em Personalização do modelo. A lista de idiomas é específica para a conta do Video Indexer que você está usando e para o usuário conectado. A lista padrão de idiomas é salva por usuário em seu dispositivo local, por dispositivo e navegador. Como resultado, cada usuário pode configurar sua própria lista de idiomas identificados padrão.

  2. Use Adicionar idioma para pesquisar e adicionar mais idiomas. Se 10 idiomas já estiverem selecionados, primeiro você deve remover um dos idiomas detectados existentes antes de adicionar um novo.

    Captura de tela mostrando uma tabela mostrando todos os idiomas selecionados.

Usar a API para alterar a lista

Quando você carrega um arquivo, o modelo de linguagem do Video Indexer faz referência cruzada a 9 idiomas por padrão. Se houver uma correspondência, o modelo gerará a transcrição do arquivo com o idioma detectado.

Use o parâmetro de idioma para especificar multi os parâmetros (MLID) ou auto (LID). Use o customLanguages parâmetro para especificar até 10 idiomas. (O parâmetro é usado somente quando o parâmetro de idioma é definido como multi ou auto.) Para saber mais sobre como usar a API, consulte Usar a API do Azure AI Video Indexer.