Personalizar um modelo de linguagem com o Azure AI Video Indexer

Importante

Devido ao anúncio de desativação dos Serviços de Mídia do Azure, o Azure AI Video Indexer anuncia ajustes nos recursos do Azure AI Video Indexer. Consulte Alterações relacionadas à aposentadoria do Azure Media Service (AMS) para entender o que isso significa para sua conta do Azure AI Video Indexer. Consulte o guia Preparando para a aposentadoria do AMS: VI atualização e migração.

O Azure AI Video Indexer suporta o reconhecimento automático de voz através da integração com o Serviço de Voz Personalizado da Microsoft. Você pode personalizar o modelo de idioma carregando texto de adaptação. Este texto vem do domínio cujo vocabulário você gostaria que o motor usasse para adaptar. Depois de treinar seu modelo, novas palavras que aparecem no texto de adaptação são reconhecidas, assumindo a pronúncia padrão, e o modelo de linguagem aprende novas sequências prováveis de palavras. Consulte a lista de idiomas suportados pelo Azure AI Video Indexer em idiomas suportados.

Por exemplo, "Kubernetes" (no contexto do serviço Kubernetes do Azure) é uma palavra altamente específica. Como a palavra é nova no Azure AI Video Indexer, ela é reconhecida como "comunidades". Você precisa treinar o modelo para reconhecê-lo como "Kubernetes". Em outros casos, as palavras existem, mas o modelo de linguagem não espera que elas apareçam em um determinado contexto. Por exemplo, "serviço de contêiner" não é uma sequência de 2 palavras que um modelo de linguagem não especializado reconheceria como um conjunto específico de palavras.

Há duas maneiras de personalizar um modelo de linguagem:

  • Opção 1: Edite a transcrição gerada pelo Azure AI Video Indexer. Ao editar e corrigir a transcrição, você está treinando um modelo de linguagem para fornecer melhores resultados no futuro.
  • Opção 2: Carregue o(s) ficheiro(s) de texto para treinar o modelo linguístico. O arquivo de upload pode conter uma lista de palavras como você gostaria que elas aparecessem na transcrição do Video Indexer ou as palavras relevantes incluídas naturalmente em frases e parágrafos. À medida que melhores resultados são alcançados com esta última abordagem, recomenda-se que o arquivo de upload contenha frases completas ou parágrafos relacionados ao seu conteúdo.

Importante

Não inclua no arquivo de upload as palavras ou frases como atualmente transcritas incorretamente (por exemplo, "comunidades"), pois isso negará o impacto pretendido. Inclua apenas as palavras como você gostaria que elas aparecessem (por exemplo, "Kubernetes").

Práticas recomendadas para modelos de linguagem personalizados

O Azure AI Video Indexer aprende com base nas probabilidades de combinações de palavras, para aprender melhor:

  • Dê exemplos reais suficientes de frases como elas seriam faladas.
  • Coloque apenas uma frase por linha, não mais. Caso contrário, o sistema aprenderá probabilidades entre frases.
  • Não há problema em colocar uma palavra como frase para impulsionar a palavra contra outras, mas o sistema aprende melhor com frases completas.
  • Ao introduzir novas palavras ou siglas, se possível, dê o maior número possível de exemplos de uso em uma frase completa para dar o máximo de contexto possível ao sistema.
  • Tente colocar várias opções de adaptação, e veja como elas funcionam para você.
  • Evite repetir a mesma frase várias vezes. Isso pode criar preconceito contra o resto da entrada.
  • Evite incluir símbolos incomuns (~, # @% &), pois eles serão descartados. As frases em que aparecem também serão descartadas.
  • Evite colocar entradas muito grandes, como centenas de milhares de frases, porque isso diluirá o efeito do impulsionamento.