Ditado – MRTK2

O ditado permite que os usuários gravem clipes de áudio e obtenham uma transcrição. Para usá-lo, verifique se um sistema de ditado está registrado no Perfil do Sistema de Entrada. O Provedor de Entrada de Ditado do Windows é o sistema de ditado fornecido pronto para uso, mas sistemas de ditado alternativos podem ser criados implementando IMixedRealityDictationSystem.

Requisitos

O sistema de ditado usa DictationRecognizer do Unity, que usa as APIs de fala subjacentes do Windows para lidar com o ditado. Observe que isso implica que esse recurso só está presente em plataformas baseadas no Windows.

O uso do sistema de ditado requer os recursos de aplicativo "Cliente da Internet" e "Microfone" na seção PlayerSettings - Capabilities. Consulte Windows Mixed Reality Documentação para obter mais detalhes sobre a entrada de voz no Unity.

Configuração

Provedor de dados

Depois de configurar um serviço de ditado, você pode usar o DictationHandler script para iniciar e parar as sessões de gravação e obter os resultados da transcrição por meio do UnityEvents.

Manipulador de ditado
  • A hipótese de ditado é gerada à medida que o usuário fala com transcrições antecipadas e aproximadas do áudio capturado até agora.
  • O Resultado do Ditado é gerado no final de cada frase (ou seja, quando o usuário pausa) com a transcrição final do áudio capturado até agora.
  • O ditado Concluído é gerado no final da sessão de gravação com a transcrição completa e final do áudio.
  • Erro de ditado é gerado para informar sobre erros no serviço de ditado. A transcrição nesse caso contém uma descrição do erro.

Cena de exemplo

A cena de ditado em MRTK/Examples/Demos/Input/Scenes/Dictation mostra o DictationHandler script em uso. Se você precisar de mais controle, poderá estender esse script ou criar sua própria implementação IMixedRealityDictationHandler para receber eventos de ditado diretamente.

Demonstração de ditado