Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo explica as opções de idioma do Video Indexer e fornece uma lista de suporte a idiomas para cada uma. Ele inclui o suporte a idiomas para recursos do Video Indexer, tradução, identificação de idioma, personalização e as configurações de idioma do site do Video Indexer.
Idiomas com suporte por cenário
Esta seção explica as opções de idioma do Video Indexer e tem uma tabela dos idiomas com suporte para cada um.
Importante
- Ao indexar com o Video Indexer do Azure, todos os idiomas listados dão suporte à tradução ao indexar por meio da API.
- Se houver suporte para indexação com o Video Indexer de IA do Azure habilitado pelo Arc, tanto por meio do aplicativo Web quanto da API, há suporte apenas para a tradução para o inglês.
Explicações da coluna
Idioma de origem com suporte – o idioma falado no arquivo de mídia com suporte para transcrição, tradução e pesquisa.
Identificação de idioma – se o idioma pode ser detectado automaticamente pelo Video Indexer quando a identificação de idioma é usada para indexação. Para saber mais, confira Usar o Video Indexer de IA do Azure para identificar automaticamente idiomas falados e a seção Identificação de Idiomas .
Personalização (modelo de linguagem) – se o idioma pode ser usado ao personalizar modelos de linguagem no Video Indexer. Para saber mais, consulte Personalizar um modelo de idioma no Video Indexer de IA do Azure.
Pronúncia (modelo de linguagem) – se o idioma pode ser usado para criar um conjunto de dados de pronúncia como parte de um modelo de fala personalizado. Para saber mais, consulte Personalizar um modelo de fala com o Video Indexer de IA do Azure.
Tradução do Site – se o idioma tem suporte para tradução ao usar o site do Azure AI Video Indexer. Selecione o idioma traduzido no menu suspenso de idiomas.
Os seguintes insights são traduzidos:
- Transcrição
- Palavras-chave
- Tópicos
- Rótulos
- Padrões de quadro (atualmente, somente para hebraico)
Todos os outros insights aparecem em inglês quando se usa uma ferramenta de tradução.
Idioma do Site – se o idioma pode ser selecionado para uso no site de Azure AI Video Indexer. Selecione o ícone Configurações e, em seguida, selecione o idioma na lista suspensa Configurações de idioma .
Idioma | Código |
Suportado Idioma de origem |
Suportado idioma de origem (Arc) |
Linguagem identificação |
Personalização (modelo de linguagem) |
Pronúncia (modelo de linguagem) |
Site Tradução |
Site Idioma |
---|---|---|---|---|---|---|---|---|
Africâner | af-ZA | ✔ | ||||||
Árabe (Israel) | ar-IL | ✔ | ✔ | ✔ | ||||
Árabe (Iraque) | ar-IQ | ✔ | ✔ | ✔ | ||||
Árabe (Jordânia) | ar-JO | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Kuwait) | ar-KW | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Líbano) | ar-LB | ✔ | ✔ | ✔ | ||||
Árabe (Omã) | ar-OM | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Autoridade Palestina) | ar-PS | ✔ | ✔ | ✔ | ||||
Árabe (Catar) | ar-QA | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Arábia Saudita) | ar-SA | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Emirados Árabes Unidos) | ar-AE | ✔ | ✔ | ✔ | ✔ | |||
Árabe (Egito) | ar-EG | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Árabe Padrão Moderno (Barein) | ar-BH | ✔ | ✔ | ✔ | ✔ | |||
Árabe (República Árabe Síria) | ar-SY | ✔ | ✔ | ✔ | ✔ | |||
Armênia | hy-AM | ✔ | ✔ | |||||
Bengalês | bn-BD | ✔ | ✔ | |||||
Bósnio | bs-Latn | ✔ | ||||||
Búlgaro | bg-BG | ✔ | ✔ | ✔ | ✔ | |||
Catalão | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Cantonês tradicional) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinês (Simplificado) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Simplificado) | zh-CK | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Chinês (Tradicional) | zh-Hans | ✔ | ✔ | |||||
Croata | hr-HR | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Tcheco | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Dinamarquês | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Holandês | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Inglês (Austrália) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglês (Reino Unido) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Inglês (Estados Unidos) | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estoniano | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fijiano | en-FJ | ✔ | ||||||
Filipinas | fil-PH | ✔ | ✔ | |||||
Finlandês | finlandês (fi-FI) | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Francês (Canadá) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Alemão | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grego | el-GR | ✔ | ✔ | ✔ | ✔ | |||
Guzerate | gu-IN | ✔ | ✔ | ✔ | ||||
Haitiano | fr-HT | ✔ | ||||||
Hebraico | he-IL | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Híndi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Húngaro | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Islandês | iS-IS | ✔ | ✔ | |||||
Indonésio | id-ID | ✔ | ✔ | ✔ | ✔ | |||
Irlandês | ga-IE | ✔ | ✔ | ✔ | ✔ | |||
Italiano | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonês | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannada | kn-IN | ✔ | ✔ | |||||
Suaíli | sw-KE | ✔ | ||||||
Coreano | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Letão | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lituano | lt-LT | ✔ | ✔ | ✔ | ✔ | |||
Malgaxe | mg-MG | ✔ | ||||||
Malaio | ms-MY | ✔ | ✔ | ✔ | ||||
Malaiala | ml-IN | ✔ | ✔ | ✔ | ||||
Maltês | Mt-MT | ✔ | ||||||
Norueguês | nb-NO | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Persa | fa-IR | ✔ | ✔ | ✔ | ✔ | |||
Polonês | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Português (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Romeno | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russo | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoano | en-WS | |||||||
Sérvio (Cirílico) | sr-Cyrl-RS | ✔ | ||||||
Sérvio (latino) | sr-Latn-RS | ✔ | ||||||
Eslovaco | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Esloveno | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Espanhol | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Espanhol (México) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Sueco | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tâmil | ta-IN | ✔ | ✔ | ✔ | ✔ | |||
Télugo | te-IN | ✔ | ✔ | ✔ | ||||
Tailandês | th-TH | ✔ | ✔ | ✔ | ✔ | ✔ | ||
Tonga | to-TO | ✔ | ||||||
Turco | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ucraniano | uk-UA | ✔ | ✔ | ✔ | ✔ | |||
Urdu | ur-PK | ✔ | ||||||
Vietnamita | vi-VN | ✔ | ✔ | ✔ | ✔ |
Obter idiomas suportados por meio da API
Use a chamada à API Obter Idiomas Suportados para obter uma lista completa de idiomas suportados por área. Para obter mais informações, consulte Obter idiomas com suporte.
A API retorna uma lista de idiomas com suporte com os seguintes valores:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Idioma de origem com suporte:
Se
isSourceLanguage
for falso, o idioma terá suporte somente para tradução. SeisSourceLanguage
for true, o idioma terá suporte como fonte para transcrição, tradução e pesquisa.Identificação do idioma (detecção automática):
Se
isAutoDetect
for true, o idioma terá suporte para identificação de idioma (LID) e identificação multilíngue (MLID).
Identificação de idioma
Ao carregar um arquivo de mídia no Video Indexer, você pode especificar o idioma de origem do arquivo de mídia. Se estiver indexando um arquivo por meio do site do Video Indexer, ele poderá ser feito selecionando um idioma durante o upload do arquivo. Se você estiver enviando o trabalho de indexação por meio da API, isso será feito usando o parâmetro language. O idioma selecionado é então usado para gerar a transcrição do arquivo.
Se você não tiver certeza do idioma de origem do arquivo de mídia ou ele puder conter vários idiomas, o Video Indexer poderá detectar os idiomas falados. Se você selecionar a opção de detecção automática LID (linguagem única) ou MLID (vários idiomas) para o idioma de origem do arquivo de mídia, o idioma ou idiomas detectados serão usados para transcrever o arquivo de mídia. Para saber mais sobre LID e MLID, consulte Usar o Video Indexer de IA do Azure para identificar automaticamente idiomas falados, consulte Identificar automaticamente o idioma falado com o modelo de identificação de idioma e identificar e transcrever automaticamente o conteúdo de vários idiomas
Há um limite de 10 idiomas permitidos para identificação durante a indexação de um arquivo de mídia para LID e MLID. Veja a seguir os nove idiomas padrão de identificação de idioma (LID) e identificação de vários idiomas (MILD):
- Alemão (de-DE)
- Inglês Estados Unidos (en-US)
- Espanhol (es-ES)
- Francês (fr-FR)
- Italiano (it-IT)
- Japonês (ja-JP)
- Português (pt-BR)
- Russo (ru-RU)
- Chinês (simplificado) (zh-Hans)
Como alterar a lista de idiomas padrão
Se você precisar usar idiomas para identificação que não são usados por padrão, poderá personalizar a lista para quaisquer 10 idiomas que ofereçam suporte à personalização por meio do site ou da API:
Use o site para alterar a lista
Selecione a aba ID do Idioma em Personalização de Modelo. A lista de idiomas é específica para a conta do Video Indexer que você está usando e para o usuário conectado. A lista padrão de idiomas é salva por usuário em seu dispositivo local, por dispositivo e navegador. Como resultado, cada usuário pode configurar sua própria lista de idiomas identificados padrão.
Use Adicionar idioma para pesquisar e adicionar mais idiomas. Se 10 idiomas já estiverem selecionados, primeiro você deve remover um dos idiomas detectados existentes antes de adicionar um novo.
Usar a API para alterar a lista
Quando você carrega um arquivo, o modelo de linguagem do Video Indexer faz referência cruzada a nove idiomas por padrão. Se houver uma correspondência, o modelo gerará a transcrição do arquivo com o idioma detectado.
Use o parâmetro de idioma para especificar multi
(MLID) ou auto
(LID). Use o customLanguages
parâmetro para especificar até 10 idiomas. (O parâmetro é usado somente quando o parâmetro de idioma é definido como multi
ou auto
.) Para saber mais sobre como usar a API, consulte Use a API do Video Indexer de IA do Azure.