Ditado – MRTK2

Artigo
07/12/2023

O ditado permite que os utilizadores gravem clips de áudio e obtenham uma transcrição. Para utilizá-lo, certifique-se de que um sistema de ditado está registado no Perfil do Sistema de Entrada. O Fornecedor de Entrada de Ditado do Windows é o sistema de ditado fornecido de forma inicial, mas podem ser criados sistemas de ditado alternativos ao implementar o IMixedRealityDictationSystem.

Requisitos

O sistema de ditado utiliza o DictationRecognizer do Unity, que utiliza as APIs de voz do Windows subjacentes para processar o ditado. Tenha em atenção que isto implica que esta funcionalidade só está presente em plataformas baseadas no Windows.

A utilização do sistema de Ditado requer as capacidades da aplicação "Cliente da Internet" e "Microfone" na secção PlayerSettings - Capabilities. Veja Windows Mixed Reality Documentação para obter mais detalhes sobre a entrada de voz no Unity.

Configuração

Assim que tiver um serviço de ditado configurado, pode utilizar o DictationHandler script para iniciar e parar sessões de gravação e obter os resultados da transcrição através do UnityEvents.

A Hipótese de Ditado é levantada à medida que o utilizador fala com transcrições precoces e aproximadas do áudio capturado até agora.
O Resultado do Ditado é gerado no final de cada frase (ou seja, quando o utilizador é colocado em pausa) com a transcrição final do áudio capturado até agora.
O Ditado Concluído é gerado no final da sessão de gravação com a transcrição completa e final do áudio.
O Erro de Ditado é gerado para informar sobre os erros no serviço de ditado. A transcrição neste caso contém uma descrição do erro.

Cenário de exemplo

A cena do ditado em MRTK/Examples/Demos/Input/Scenes/Dictation mostra o DictationHandler script em utilização. Se precisar de mais controlo, pode expandir este script ou criar a sua própria implementação IMixedRealityDictationHandler para receber eventos de ditado diretamente.

Ditado – MRTK2

Requisitos

Configuração

Cenário de exemplo

Recursos adicionais