Identificar automaticamente o idioma falado com o modelo de identificação de idioma

Importante

Devido ao anúncio de desativação dos Serviços de Mídia do Azure, o Azure AI Video Indexer anuncia ajustes nos recursos do Azure AI Video Indexer. Consulte Alterações relacionadas à aposentadoria do Azure Media Service (AMS) para entender o que isso significa para sua conta do Azure AI Video Indexer. Consulte o guia Preparando para a aposentadoria do AMS: VI atualização e migração.

O Azure AI Video Indexer dá suporte à identificação automática de idioma (LID), que é o processo de identificar automaticamente o idioma falado a partir do conteúdo de áudio. O ficheiro multimédia é transcrito na língua identificada dominante.

Consulte a lista de idiomas suportados pelo Azure AI Video Indexer em idiomas suportados.

Certifique-se de revisar a seção Diretrizes e limitações .

Escolhendo a identificação automática de idioma na indexação

Ao indexar ou reindexar um vídeo usando a API, escolha a auto detectsourceLanguage opção no parâmetro.

Ao usar o portal, vá para os vídeos da sua Conta na home page do Azure AI Video Indexer e passe o mouse sobre o nome do vídeo que você deseja reindexar. No canto inferior direito, selecione o botão Reindexar . Na caixa de diálogo Reindexar vídeo, escolha Deteção automática na caixa suspensa Idioma de origem do vídeo.

Captura de tela mostrando onde selecionar a deteção automática.

Saída do modelo

O Azure AI Video Indexer transcreve o vídeo de acordo com o idioma mais provável se a confiança para esse idioma for > 0.6. Se a língua não puder ser identificada com confiança, pressupõe que a língua falada é o inglês.

A linguagem dominante do modelo está disponível no JSON de insights como o sourceLanguage atributo (em root/videos/insights). Uma pontuação de confiança correspondente também está disponível sob o sourceLanguageConfidence atributo.

"insights": {
        "version": "1.0.0.0",
        "duration": "0:05:30.902",
        "sourceLanguage": "fr-FR",
        "language": "fr-FR",
        "transcript": [...],
        . . .
        "sourceLanguageConfidence": 0.8563
      }

Diretrizes e limitações

A identificação automática de idioma (LID) suporta os seguintes idiomas:

Consulte a lista de idiomas suportados pelo Azure AI Video Indexer em idiomas suportados.

  • Se o áudio contiver idiomas diferentes da lista suportada, o resultado será inesperado.
  • Se o Azure AI Video Indexer não conseguir identificar o idioma com uma confiança alta o suficiente (maior que 0,6), o idioma de fallback será o inglês.
  • Atualmente, não há suporte para arquivos com áudio de idioma misto. Se o áudio contiver idiomas mistos, o resultado é inesperado.
  • O áudio de baixa qualidade pode afetar os resultados do modelo.
  • O modelo requer pelo menos um minuto de fala no áudio.
  • O modelo é projetado para reconhecer uma fala conversacional espontânea (não comandos de voz, canto e assim por diante).