Identificar automaticamente o idioma falado com o modelo de identificação de idioma
Importante
Devido ao anúncio de desativação dos Serviços de Mídia do Azure, o Azure AI Video Indexer anuncia ajustes nos recursos do Azure AI Video Indexer. Consulte Alterações relacionadas à aposentadoria do Azure Media Service (AMS) para entender o que isso significa para sua conta do Azure AI Video Indexer. Consulte o guia Preparando para a aposentadoria do AMS: VI atualização e migração.
O Azure AI Video Indexer dá suporte à identificação automática de idioma (LID), que é o processo de identificar automaticamente o idioma falado a partir do conteúdo de áudio. O ficheiro multimédia é transcrito na língua identificada dominante.
Consulte a lista de idiomas suportados pelo Azure AI Video Indexer em idiomas suportados.
Certifique-se de revisar a seção Diretrizes e limitações .
Escolhendo a identificação automática de idioma na indexação
Ao indexar ou reindexar um vídeo usando a API, escolha a auto detect
sourceLanguage
opção no parâmetro.
Ao usar o portal, vá para os vídeos da sua Conta na home page do Azure AI Video Indexer e passe o mouse sobre o nome do vídeo que você deseja reindexar. No canto inferior direito, selecione o botão Reindexar . Na caixa de diálogo Reindexar vídeo, escolha Deteção automática na caixa suspensa Idioma de origem do vídeo.
Saída do modelo
O Azure AI Video Indexer transcreve o vídeo de acordo com o idioma mais provável se a confiança para esse idioma for > 0.6
. Se a língua não puder ser identificada com confiança, pressupõe que a língua falada é o inglês.
A linguagem dominante do modelo está disponível no JSON de insights como o sourceLanguage
atributo (em root/videos/insights). Uma pontuação de confiança correspondente também está disponível sob o sourceLanguageConfidence
atributo.
"insights": {
"version": "1.0.0.0",
"duration": "0:05:30.902",
"sourceLanguage": "fr-FR",
"language": "fr-FR",
"transcript": [...],
. . .
"sourceLanguageConfidence": 0.8563
}
Diretrizes e limitações
A identificação automática de idioma (LID) suporta os seguintes idiomas:
Consulte a lista de idiomas suportados pelo Azure AI Video Indexer em idiomas suportados.
- Se o áudio contiver idiomas diferentes da lista suportada, o resultado será inesperado.
- Se o Azure AI Video Indexer não conseguir identificar o idioma com uma confiança alta o suficiente (maior que 0,6), o idioma de fallback será o inglês.
- Atualmente, não há suporte para arquivos com áudio de idioma misto. Se o áudio contiver idiomas mistos, o resultado é inesperado.
- O áudio de baixa qualidade pode afetar os resultados do modelo.
- O modelo requer pelo menos um minuto de fala no áudio.
- O modelo é projetado para reconhecer uma fala conversacional espontânea (não comandos de voz, canto e assim por diante).
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários