Identificar automaticamente o idioma falado com o modelo de identificação de idioma

Importante

Devido ao anúncio da desativação dos Serviços de Mídia do Azure, o Indexador de Vídeo de IA do Azure anuncia ajustes de recursos do Indexador de Vídeo de IA do Azure. Consulte Alterações relacionadas à desativação do AMS (Serviço de Mídia do Azure) para entender o que isso significa para sua conta do Indexador de Vídeo de IA do Azure. Consulte o Guia de atualização e migração Preparando para a aposentadoria do AMS: VI.

O Indexador de Vídeo de IA do Azure dá suporte à identificação automática de idioma (LID), que é o processo de identificar automaticamente o idioma falado a partir do conteúdo de áudio. O arquivo de mídia é transcrito na língua identificada dominante.

Consulte a lista de idiomas suportados pelo Indexador de Vídeo de IA do Azure em idiomas suportados.

Certifique-se de revisar a seção Diretrizes e limitações .

Como escolher a identificação automática de idioma na indexação

Ao indexar ou reindexar um vídeo usando uma API, escolha a opção auto detect no parâmetro sourceLanguage.

Ao usar o portal, acesse os vídeos da sua Conta na home page do Indexador de Vídeo de IA do Azure e passe o mouse sobre o nome do vídeo que você deseja reindexar. No canto inferior direito, selecione o botão Reindexar . Na caixa de diálogo Reindexar vídeo, escolha a opção Detecção automática na caixa suspensa Idioma de origem do vídeo.

Captura de tela mostrando onde selecionar a detecção automática.

Saída do modelo

O Indexador de Vídeo de IA do Azure transcreve o vídeo de acordo com o idioma mais provável se a confiança para esse idioma for > 0.6. Caso o idioma não seja identificado com confiança, ele vai supor que o idioma falado é o inglês.

O idioma dominante do modelo está disponível em insights JSON como o atributo sourceLanguage (na opção raiz/vídeos/insights). Uma pontuação de confiança correspondente também está disponível no atributo sourceLanguageConfidence.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Diretrizes e limitações

O sistema de LID (identificação de idioma) automático é compatível com os seguintes idiomas:

Consulte a lista de idiomas suportados pelo Indexador de Vídeo de IA do Azure em idiomas suportados.

  • Se o áudio contiver idiomas diferentes da lista suportada, o resultado será inesperado.
  • Se o Indexador de Vídeo de IA do Azure não conseguir identificar o idioma com uma confiança alta o suficiente (maior que 0,6), o idioma de fallback será o inglês.
  • Atualmente, não há suporte para arquivos com áudio de idioma misto. Caso o áudio contenha idiomas mistos, o resultado será inesperado.
  • O áudio de baixa qualidade pode afetar os resultados do modelo.
  • O modelo exige que o áudio tenha pelo menos um minuto de fala.
  • O modelo é projetado para reconhecer uma fala conversacional espontânea (não comandos de voz, canto e assim por diante).