Suporte a idiomas no Azure AI Video Indexer
Este artigo explica as opções de idioma do Video Indexer e fornece uma lista de suporte a idiomas para cada uma. Ele inclui o suporte a idiomas para recursos do Video Indexer, tradução, identificação de idioma, personalização e as configurações de idioma do site do Video Indexer.
Idiomas com suporte por cenário
Esta seção explica as opções de idioma do Video Indexer e tem uma tabela dos idiomas com suporte para cada um.
Importante
Todos os idiomas listados suportam tradução ao indexar por meio da API.
Explicações da coluna
Idioma de origem com suporte – o idioma falado no arquivo de mídia com suporte para transcrição, tradução e pesquisa.
Identificação de idioma – se o idioma pode ser detectado automaticamente pelo Video Indexer quando a identificação de idioma é usada para indexação. Para saber mais, confira Usar o Azure AI Video Indexer para identificar automaticamente os idiomas falados e a seção Identificação de Idioma .
Personalização (modelo de linguagem) – se a linguagem pode ser usada ao personalizar modelos de linguagem no Video Indexer. Para saber mais, confira Personalizar um modelo de linguagem no Azure AI Video Indexer.
Pronúncia (modelo de idioma) – se o idioma pode ser usado para criar um conjunto de dados de pronúncia como parte de um modelo de fala personalizado. Para saber mais, confira Personalizar um modelo de fala com o Azure AI Video Indexer.
Tradução de site – se o idioma tem suporte para tradução ao usar o site do Azure AI Video Indexer. Selecione o idioma traduzido no menu suspenso de idiomas.
Os seguintes insights são traduzidos:
- Transcrição
- Palavras-chave
- Tópicos
- Rótulos
- Padrões de quadro (somente para hebraico a partir de agora)
Todos os outros insights aparecem em inglês ao usar a tradução.
Idioma do site – se o idioma pode ser selecionado para uso no site do Azure AI Video Indexer. Selecione o ícone Configurações e, em seguida, selecione o idioma no menu suspenso Configurações de idioma.
Idioma | Código | Suportado Idioma de origem |
Linguagem identificação |
Personalização (modelo de linguagem) |
Pronúncia (modelo de linguagem) |
Local na rede Internet Tradução |
Local na rede Internet Idioma |
---|---|---|---|---|---|---|---|
Africâner | af-ZA | ✔ | |||||
Árabe (Israel) | ar-IL | ✔ | ✔ | ||||
Árabe (Iraque) | ar-IQ | ✔ | ✔ | ||||
Árabe (Jordânia) | ar-JO | ✔ | ✔ | ✔ | |||
Árabe (Kuwait) | ar-KW | ✔ | ✔ | ✔ | |||
Árabe (Líbano) | ar-LB | ✔ | ✔ | ||||
Árabe (Omã) | ar-OM | ✔ | ✔ | ✔ | |||
Árabe (Autoridade Palestina) | ar-PS | ✔ | ✔ | ||||
Árabe (Catar) | ar-QA | ✔ | ✔ | ✔ | |||
Árabe (Arábia Saudita) | ar-SA | ✔ | ✔ | ✔ | |||
Árabe (Emirados Árabes Unidos) | ar-AE | ✔ | ✔ | ✔ | |||
Árabe (Egito) | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Árabe Padrão Moderno (Barein) | ar-BH | ✔ | ✔ | ✔ | |||
Árabe (República Árabe Síria) | ar-SY | ✔ | ✔ | ✔ | |||
Armênia | hy-AM | ✔ | |||||
Bangla | bn-BD | ✔ | |||||
Bósnio | bs-Latn | ✔ | |||||
Búlgaro | bg-BG | ✔ | ✔ | ✔ | |||
Catalão | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Cantonês tradicional) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Simplificado) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Simplificado) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Tradicional) | zh-Hans | ✔ | |||||
Croata | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Tcheco | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Dinamarquês | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Holandês | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Inglês (Austrália) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglês (Reino Unido) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglês (Estados Unidos) | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estoniano | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fijiano | pt-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finlandês | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês (Canadá) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Alemão | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grego | el-GR | ✔ | ✔ | ✔ | |||
Guzerate | gu-IN | ✔ | ✔ | ✔ | |||
Haitiano | fr-HT | ✔ | |||||
Hebraico | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Híndi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Húngaro | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Islandês | iS-IS | ✔ | |||||
Indonésio | id-ID | ✔ | ✔ | ✔ | |||
Irlandês | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italiano | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonês | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
canarim | kn-IN | ✔ | ✔ | ||||
Suaíli | sw-KE | ✔ | |||||
Coreano | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Letão | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lituano | lt-LT | ✔ | ✔ | ✔ | |||
Malgaxe | mg-MG | ✔ | |||||
Malaio | ms-MY | ✔ | ✔ | ||||
Malaiala | ml-IN | ✔ | ✔ | ||||
Maltês | mt-MT | ✔ | |||||
Norueguês | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persa | fa-IR | ✔ | ✔ | ✔ | |||
Polonês | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Romeno | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russo | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoano | pt-WS | ||||||
Sérvio (Cirílico) | sr-Cyrl-RS | ✔ | |||||
Sérvio (latino) | sr-Latn-RS | ✔ | |||||
Eslovaco | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Esloveno | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Espanhol | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Espanhol (México) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Sueco | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tâmil | ta-IN | ✔ | ✔ | ✔ | |||
Télugo | te-IN | ✔ | ✔ | ||||
Tailandês | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tongan | para-PARA | ✔ | |||||
Turco | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ucraniano | uk-UA | ✔ | ✔ | ✔ | |||
Urdu | ur-PK | ✔ | |||||
Vietnamita | vi-VN | ✔ | ✔ | ✔ |
Obter idiomas suportados por meio da API
Use a chamada à API Obter Idiomas Suportados para obter uma lista completa de idiomas suportados por área. Para obter mais informações, consulte Obter idiomas com suporte.
A API retorna uma lista de idiomas com suporte com os seguintes valores:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Idioma de origem com suporte:
Se
isSourceLanguage
for false, o idioma terá suporte apenas para tradução. SeisSourceLanguage
for true, o idioma terá suporte como fonte para transcrição, tradução e pesquisa.Identificação do idioma (detecção automática):
Se
isAutoDetect
for true, o idioma terá suporte para identificação de idioma (LID) e identificação multilíngue (MLID).
Identificação de idioma
Ao carregar um arquivo de mídia no Video Indexer, você pode especificar o idioma de origem do arquivo de mídia. Se estiver indexando um arquivo por meio do site do Video Indexer, isso pode ser feito selecionando um idioma durante o carregamento do arquivo. Se você estiver enviando o trabalho de indexação por meio da API, isso será feito usando o parâmetro language. O idioma selecionado é então usado para gerar a transcrição do arquivo.
Se você não tiver certeza do idioma de origem do arquivo de mídia ou se ele puder conter vários idiomas, o Video Indexer poderá detectar os idiomas falados. Se você selecionar Detectar automaticamente um único idioma (LID) ou vários idiomas (MLID) para o idioma de origem do arquivo de mídia, o idioma ou idiomas detectados serão usados para transcrever o arquivo de mídia. Para saber mais sobre LID e MLID, consulte Usar o Azure AI Video Indexer para identificar automaticamente idiomas falados, consulte Identificar automaticamente o idioma falado com o modelo de identificação de idioma e Identificar e transcrever automaticamente conteúdo multilíngue
Há um limite de 10 idiomas permitidos para identificação durante a indexação de um arquivo de mídia para LID e MLID. A seguir estão os 9 idiomas padrão de identificação de idioma (LID) e identificação multilíngue (MILD):
- Alemão (de-DE)
- Inglês Estados Unidos (en-US)
- Espanhol (es-ES)
- Francês (fr-FR)
- Italiano (it-IT)
- Japonês (ja-JP)
- Português (pt-BR)
- Russo (ru-RU)
- Chinês (simplificado) (zh-Hans)
Como alterar a lista de idiomas padrão
Se você precisar usar idiomas para identificação que não são usados por padrão, poderá personalizar a lista para quaisquer 10 idiomas que ofereçam suporte à personalização por meio do site ou da API:
Use o site para alterar a lista
Selecione a guia ID do idioma em Personalização do modelo. A lista de idiomas é específica para a conta do Video Indexer que você está usando e para o usuário conectado. A lista padrão de idiomas é salva por usuário em seu dispositivo local, por dispositivo e navegador. Como resultado, cada usuário pode configurar sua própria lista de idiomas identificados padrão.
Use Adicionar idioma para pesquisar e adicionar mais idiomas. Se 10 idiomas já estiverem selecionados, primeiro você deve remover um dos idiomas detectados existentes antes de adicionar um novo.
Usar a API para alterar a lista
Quando você carrega um arquivo, o modelo de linguagem do Video Indexer faz referência cruzada a 9 idiomas por padrão. Se houver uma correspondência, o modelo gerará a transcrição do arquivo com o idioma detectado.
Use o parâmetro de idioma para especificar multi
os parâmetros (MLID) ou auto
(LID). Use o customLanguages
parâmetro para especificar até 10 idiomas. (O parâmetro é usado somente quando o parâmetro de idioma é definido como multi
ou auto
.) Para saber mais sobre como usar a API, consulte Usar a API do Azure AI Video Indexer.