Identificar automaticamente o idioma falado com o modelo de identificação de idioma
Importante
Devido ao anúncio da desativação dos Serviços de Mídia do Azure, o Indexador de Vídeo de IA do Azure anuncia ajustes de recursos do Indexador de Vídeo de IA do Azure. Consulte Alterações relacionadas à desativação do AMS (Serviço de Mídia do Azure) para entender o que isso significa para sua conta do Indexador de Vídeo de IA do Azure. Consulte o Guia de atualização e migração Preparando para a aposentadoria do AMS: VI.
O Indexador de Vídeo de IA do Azure dá suporte à identificação automática de idioma (LID), que é o processo de identificar automaticamente o idioma falado a partir do conteúdo de áudio. O arquivo de mídia é transcrito na língua identificada dominante.
Consulte a lista de idiomas suportados pelo Indexador de Vídeo de IA do Azure em idiomas suportados.
Certifique-se de revisar a seção Diretrizes e limitações .
Como escolher a identificação automática de idioma na indexação
Ao indexar ou reindexar um vídeo usando uma API, escolha a opção auto detect
no parâmetro sourceLanguage
.
Ao usar o portal, acesse os vídeos da sua Conta na home page do Indexador de Vídeo de IA do Azure e passe o mouse sobre o nome do vídeo que você deseja reindexar. No canto inferior direito, selecione o botão Reindexar . Na caixa de diálogo Reindexar vídeo, escolha a opção Detecção automática na caixa suspensa Idioma de origem do vídeo.
Saída do modelo
O Indexador de Vídeo de IA do Azure transcreve o vídeo de acordo com o idioma mais provável se a confiança para esse idioma for > 0.6
. Caso o idioma não seja identificado com confiança, ele vai supor que o idioma falado é o inglês.
O idioma dominante do modelo está disponível em insights JSON como o atributo sourceLanguage
(na opção raiz/vídeos/insights). Uma pontuação de confiança correspondente também está disponível no atributo sourceLanguageConfidence
.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Diretrizes e limitações
O sistema de LID (identificação de idioma) automático é compatível com os seguintes idiomas:
Consulte a lista de idiomas suportados pelo Indexador de Vídeo de IA do Azure em idiomas suportados.
- Se o áudio contiver idiomas diferentes da lista suportada, o resultado será inesperado.
- Se o Indexador de Vídeo de IA do Azure não conseguir identificar o idioma com uma confiança alta o suficiente (maior que 0,6), o idioma de fallback será o inglês.
- Atualmente, não há suporte para arquivos com áudio de idioma misto. Caso o áudio contenha idiomas mistos, o resultado será inesperado.
- O áudio de baixa qualidade pode afetar os resultados do modelo.
- O modelo exige que o áudio tenha pelo menos um minuto de fala.
- O modelo é projetado para reconhecer uma fala conversacional espontânea (não comandos de voz, canto e assim por diante).
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de