Ditado – MRTK2

O ditado permite que os utilizadores gravem clips de áudio e obtenham uma transcrição. Para utilizá-lo, certifique-se de que um sistema de ditado está registado no Perfil do Sistema de Entrada. O Fornecedor de Entrada de Ditado do Windows é o sistema de ditado fornecido de forma inicial, mas podem ser criados sistemas de ditado alternativos ao implementar o IMixedRealityDictationSystem.

Requisitos

O sistema de ditado utiliza o DictationRecognizer do Unity, que utiliza as APIs de voz do Windows subjacentes para processar o ditado. Tenha em atenção que isto implica que esta funcionalidade só está presente em plataformas baseadas no Windows.

A utilização do sistema de Ditado requer as capacidades da aplicação "Cliente da Internet" e "Microfone" na secção PlayerSettings - Capabilities. Veja Windows Mixed Reality Documentação para obter mais detalhes sobre a entrada de voz no Unity.

Configuração

Fornecedor de dados

Assim que tiver um serviço de ditado configurado, pode utilizar o DictationHandler script para iniciar e parar sessões de gravação e obter os resultados da transcrição através do UnityEvents.

Processador de Ditado
  • A Hipótese de Ditado é levantada à medida que o utilizador fala com transcrições precoces e aproximadas do áudio capturado até agora.
  • O Resultado do Ditado é gerado no final de cada frase (ou seja, quando o utilizador é colocado em pausa) com a transcrição final do áudio capturado até agora.
  • O Ditado Concluído é gerado no final da sessão de gravação com a transcrição completa e final do áudio.
  • O Erro de Ditado é gerado para informar sobre os erros no serviço de ditado. A transcrição neste caso contém uma descrição do erro.

Cenário de exemplo

A cena do ditado em MRTK/Examples/Demos/Input/Scenes/Dictation mostra o DictationHandler script em utilização. Se precisar de mais controlo, pode expandir este script ou criar a sua própria implementação IMixedRealityDictationHandler para receber eventos de ditado diretamente.

Demonstração do Ditado