Compartilhar via


Idiomas com suporte no Azure AI Video Indexer

Este artigo explica as opções de idioma do Video Indexer e fornece uma lista de suporte a idiomas para cada uma. Ele inclui o suporte a idiomas para recursos do Video Indexer, tradução, identificação de idioma, personalização e as configurações de idioma do site do Video Indexer.

Idiomas com suporte por cenário

Esta seção explica as opções de idioma do Video Indexer e tem uma tabela dos idiomas com suporte para cada um.

Importante

  • Ao indexar com o Video Indexer do Azure, todos os idiomas listados dão suporte à tradução ao indexar por meio da API.
  • Se houver suporte para indexação com o Video Indexer de IA do Azure habilitado pelo Arc, tanto por meio do aplicativo Web quanto da API, há suporte apenas para a tradução para o inglês.

Explicações da coluna

  • Idioma de origem com suporte – o idioma falado no arquivo de mídia com suporte para transcrição, tradução e pesquisa.

  • Identificação de idioma – se o idioma pode ser detectado automaticamente pelo Video Indexer quando a identificação de idioma é usada para indexação. Para saber mais, confira Usar o Video Indexer de IA do Azure para identificar automaticamente idiomas falados e a seção Identificação de Idiomas .

  • Personalização (modelo de linguagem) – se o idioma pode ser usado ao personalizar modelos de linguagem no Video Indexer. Para saber mais, consulte Personalizar um modelo de idioma no Video Indexer de IA do Azure.

  • Pronúncia (modelo de linguagem) – se o idioma pode ser usado para criar um conjunto de dados de pronúncia como parte de um modelo de fala personalizado. Para saber mais, consulte Personalizar um modelo de fala com o Video Indexer de IA do Azure.

  • Tradução do Site – se o idioma tem suporte para tradução ao usar o site do Azure AI Video Indexer. Selecione o idioma traduzido no menu suspenso de idiomas.

    Captura de tela mostrando um menu com download, inglês e visualizações como itens de menu. Uma dica de ferramenta é mostrada quando o mouse passa sobre o item inglês e informa que a tradução está definida como inglês.

    Os seguintes insights são traduzidos:

    • Transcrição
    • Palavras-chave
    • Tópicos
    • Rótulos
    • Padrões de quadro (atualmente, somente para hebraico)

    Todos os outros insights aparecem em inglês quando se usa uma ferramenta de tradução.

  • Idioma do Site – se o idioma pode ser selecionado para uso no site de Azure AI Video Indexer. Selecione o ícone Configurações e, em seguida, selecione o idioma na lista suspensa Configurações de idioma .

    Captura de tela mostrando um menu com as configurações do usuário, todas ativadas.

Idioma Código   Suportado
Idioma de origem
Suportado
idioma de origem (Arc)
Linguagem
identificação
Personalização
(modelo de linguagem)
Pronúncia
(modelo de linguagem)
Site
Tradução
Site
Idioma
Africâner af-ZA
Árabe (Israel) ar-IL
Árabe (Iraque) ar-IQ
Árabe (Jordânia) ar-JO
Árabe (Kuwait) ar-KW
Árabe (Líbano) ar-LB
Árabe (Omã) ar-OM
Árabe (Autoridade Palestina) ar-PS
Árabe (Catar) ar-QA
Árabe (Arábia Saudita) ar-SA
Árabe (Emirados Árabes Unidos) ar-AE
Árabe (Egito) ar-EG
Árabe Padrão Moderno (Barein) ar-BH
Árabe (República Árabe Síria) ar-SY
Armênia hy-AM
Bengalês bn-BD
Bósnio bs-Latn
Búlgaro bg-BG
Catalão ca-ES
Chinês (Cantonês tradicional) zh-HK
Chinês (Simplificado) zh-Hans
Chinês (Simplificado) zh-CK
Chinês (Tradicional) zh-Hans
Croata hr-HR
Tcheco cs-CZ
Dinamarquês da-DK
Holandês nl-NL
Inglês (Austrália) en-AU
Inglês (Reino Unido) en-GB
Inglês (Estados Unidos) pt-BR
Estoniano et-EE
Fijiano en-FJ
Filipinas fil-PH
Finlandês finlandês (fi-FI)
Francês fr-FR
Francês (Canadá) fr-CA
Alemão de-DE
Grego el-GR
Guzerate gu-IN
Haitiano fr-HT
Hebraico he-IL
Híndi hi-IN
Húngaro hu-HU
Islandês iS-IS
Indonésio id-ID
Irlandês ga-IE
Italiano it-IT
Japonês ja-JP
Kannada kn-IN
Suaíli sw-KE
Coreano ko-KR
Letão lv-LV
Lituano lt-LT
Malgaxe mg-MG
Malaio ms-MY
Malaiala ml-IN
Maltês Mt-MT
Norueguês nb-NO
Persa fa-IR
Polonês pl-PL
Português pt-BR
Português (Portugal) pt-PT
Romeno ro-RO
Russo ru-RU
Samoano en-WS
Sérvio (Cirílico) sr-Cyrl-RS
Sérvio (latino) sr-Latn-RS
Eslovaco sk-SK
Esloveno sl-SI
Espanhol es-ES
Espanhol (México) es-MX
Sueco sv-SE
Tâmil ta-IN
Télugo te-IN
Tailandês th-TH
Tonga to-TO
Turco tr-TR
Ucraniano uk-UA
Urdu ur-PK
Vietnamita vi-VN

Obter idiomas suportados por meio da API

Use a chamada à API Obter Idiomas Suportados para obter uma lista completa de idiomas suportados por área. Para obter mais informações, consulte Obter idiomas com suporte.

A API retorna uma lista de idiomas com suporte com os seguintes valores:

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • Idioma de origem com suporte:

    Se isSourceLanguage for falso, o idioma terá suporte somente para tradução. Se isSourceLanguage for true, o idioma terá suporte como fonte para transcrição, tradução e pesquisa.

  • Identificação do idioma (detecção automática):

    Se isAutoDetect for true, o idioma terá suporte para identificação de idioma (LID) e identificação multilíngue (MLID).

Identificação de idioma

Ao carregar um arquivo de mídia no Video Indexer, você pode especificar o idioma de origem do arquivo de mídia. Se estiver indexando um arquivo por meio do site do Video Indexer, ele poderá ser feito selecionando um idioma durante o upload do arquivo. Se você estiver enviando o trabalho de indexação por meio da API, isso será feito usando o parâmetro language. O idioma selecionado é então usado para gerar a transcrição do arquivo.

Se você não tiver certeza do idioma de origem do arquivo de mídia ou ele puder conter vários idiomas, o Video Indexer poderá detectar os idiomas falados. Se você selecionar a opção de detecção automática LID (linguagem única) ou MLID (vários idiomas) para o idioma de origem do arquivo de mídia, o idioma ou idiomas detectados serão usados para transcrever o arquivo de mídia. Para saber mais sobre LID e MLID, consulte Usar o Video Indexer de IA do Azure para identificar automaticamente idiomas falados, consulte Identificar automaticamente o idioma falado com o modelo de identificação de idioma e identificar e transcrever automaticamente o conteúdo de vários idiomas

Há um limite de 10 idiomas permitidos para identificação durante a indexação de um arquivo de mídia para LID e MLID. Veja a seguir os nove idiomas padrão de identificação de idioma (LID) e identificação de vários idiomas (MILD):

  • Alemão (de-DE)
  • Inglês Estados Unidos (en-US)
  • Espanhol (es-ES)
  • Francês (fr-FR)
  • Italiano (it-IT)
  • Japonês (ja-JP)
  • Português (pt-BR)
  • Russo (ru-RU)
  • Chinês (simplificado) (zh-Hans)

Como alterar a lista de idiomas padrão

Se você precisar usar idiomas para identificação que não são usados por padrão, poderá personalizar a lista para quaisquer 10 idiomas que ofereçam suporte à personalização por meio do site ou da API:

Use o site para alterar a lista

  1. Selecione a aba ID do Idioma em Personalização de Modelo. A lista de idiomas é específica para a conta do Video Indexer que você está usando e para o usuário conectado. A lista padrão de idiomas é salva por usuário em seu dispositivo local, por dispositivo e navegador. Como resultado, cada usuário pode configurar sua própria lista de idiomas identificados padrão.

  2. Use Adicionar idioma para pesquisar e adicionar mais idiomas. Se 10 idiomas já estiverem selecionados, primeiro você deve remover um dos idiomas detectados existentes antes de adicionar um novo.

    Captura de tela mostrando uma tabela mostrando todos os idiomas selecionados.

Usar a API para alterar a lista

Quando você carrega um arquivo, o modelo de linguagem do Video Indexer faz referência cruzada a nove idiomas por padrão. Se houver uma correspondência, o modelo gerará a transcrição do arquivo com o idioma detectado.

Use o parâmetro de idioma para especificar multi (MLID) ou auto (LID). Use o customLanguages parâmetro para especificar até 10 idiomas. (O parâmetro é usado somente quando o parâmetro de idioma é definido como multi ou auto.) Para saber mais sobre como usar a API, consulte Use a API do Video Indexer de IA do Azure.