Comando de voz

Ao usar comandos de voz, o foco normalmente é usado como o mecanismo de direcionamento, seja como um ponteiro ("selecionar") ou para direcionar seu comando para um aplicativo ("consulte, diga isso"). Obviamente, alguns comandos de voz não exigem um alvo, como "Ir para o início" ou "Ei, Cortana".

Suporte a dispositivos

Recurso HoloLens (1ª geração) HoloLens 2 Headsets imersivos
Comando de voz ✔️ ✔️ ✔️ (com o headset anexado)

Como usar a voz

Considere a adição de comandos de voz em qualquer experiência que você criar. A voz é uma maneira poderosa e conveniente de controlar o sistema e os aplicativos. Como os usuários falam com uma variedade de dialetos e sotaques, a escolha adequada das palavras garantirá que os comandos sejam interpretados de maneira inequívoca.

Práticas recomendadas

A seguir, algumas práticas que auxiliarão em um reconhecimento de fala perfeito.

  • Use comandos concisos - quando possível, escolha palavras com duas ou mais sílabas. Palavras com uma sílaba tendem a empregar sons de vogais diferentes quando faladas por pessoas com sotaques diferentes. Exemplo: "Reproduzir vídeo" é melhor que "Reproduzir o vídeo selecionado no momento"
  • Usar vocabulário simples - Exemplo: "Mostrar observação" é melhor que "Mostrar cartaz"
  • Certifique-se de que os comandos não sejam destrutivos - certifique-se de que as ações que podem ser executadas por um comando de voz não sejam destrutivas e possam ser facilmente desfeitas caso outra pessoa falando nas proximidades do usuário acidentalmente acione um comando.
  • Evite comandos com sons semelhantes - evite registrar vários comandos de fala muito semelhantes. Exemplo: "Mostrar mais" e "Mostrar repositório" pode ser muito semelhante.
  • Cancele o registro do aplicativo quando não estiver em uso - quando seu aplicativo não estiver em um estado em que um determinado comando de fala seja válido, considere cancelar seu registro para evitar a confusão com outros comandos.
  • Teste com sotaques diferentes - teste seu aplicativo com usuários que tenham sotaques diferentes.
  • Mantenha a consistência nos comandos de voz - se "Voltar" vai para a página anterior, mantenha esse comportamento em seus aplicativos.
  • Evite usar comandos do sistema - os comandos de voz a seguir são reservados para o sistema. Eles não devem ser usados pelos aplicativos.
    • "Ei, Cortana!"
    • "Selecionar"

"Selecionar"

Dizer "selecionar" a qualquer momento ativará tudo o que o cursor estiver apontando.

Observação: em HoloLens 2, o cursor de foco precisa primeiro ser invocado dizendo a palavra "selecionar". Diga "selecionar" novamente para ativar. Para ocultar o cursor de foco, basta usar as mãos para airtap ou tocar em um objeto.

Veja e diga

O Windows Mixed Reality utiliza um modelo de voz "veja e diga", no qual os rótulos dos botões são idênticos aos comandos de voz associados. Como não há dissonância entre o rótulo e o comando de voz, os usuários tem melhor noção do que dizer para controlar o sistema. Para reforçar isso, ao olhar fixo para um botão, uma "dica de espera de voz" é exibida para comunicar quais botões estão habilitados para voz.

See it say it example 1

See it say it example 2
Exemplos de "veja e diga"

Vantagens da voz

A entrada de voz é uma maneira natural de comunicarmos nossas intenções. A voz é especialmente boa em passagens de interface porque pode ajudar os usuários a cortar várias etapas de uma interface (um usuário pode dizer "voltar" ao olhar para uma página da Web, em vez de ter que subir e clicar no botão Voltar no aplicativo). Essa pequena economia de tempo tem um efeito emocional poderoso na percepção da experiência de um usuário e lhes dá uma pequena quantidade de superpotência. Usar voz também é um método de entrada conveniente quando temos os braços cheios ou são multitarefas. Em dispositivos em que a digitação em um teclado é difícil, o ditado de voz pode ser uma maneira eficiente e alternativa de entrada. Por fim, em alguns casos, quando o intervalo de precisão para o olhar e o gesto são limitados, o Voice pode ser o único método confiável de entrada de um usuário.

Como o uso da voz pode beneficiar o usuário?

  • Reduz o tempo - deve tornar o objetivo final mais eficiente.
  • Minimiza o esforço - deve tornar as tarefas mais fluídas e simples.
  • Reduz a carga cognitiva - é intuitivo e fácil de lembrar e aprender.
  • É socialmente aceitável - deve estar de acordo com as normas sociais em termos de comportamento.
  • É rotineiro - a voz pode facilmente se tornar um comportamento habitual.

Desvantagens da voz

A voz também tem algumas desvantagens. O controle refinado é uma delas. (por exemplo, um usuário pode dizer "mais alto", mas não pode dizer quanto. "Um pouco" é difícil de quantificar. Também é difícil mover ou dimensionar objetos usando a voz (ela não oferece granularidade de controle). A voz também pode ser imperfeita. Às vezes, um sistema de voz ouve incorretamente ou não consegue ouvir um comando. Contornar esses erros é um desafio em qualquer interface. Por fim, a voz pode não ser socialmente aceitável em locais públicos. Há algumas coisas que os usuários não podem ou não devem dizer. Essas limitações permitem usar a fala para sua melhor função.

Estados de retorno de voz

Quando a voz é aplicada corretamente, o usuário sabe o que pode dizer e obtém um retorno claro, e o sistema o ouve corretamente. Esses dois sinais fazem o usuário se sentir seguro para usar a Voz como uma entrada primária. A seguir, um diagrama mostrando o que acontece com o cursor quando a entrada de voz é reconhecida e como ele comunica isso ao usuário.

Voice feedback states for cursor
Estados de retorno de voz para cursor

As principais coisas que os usuários devem saber sobre "fala" na realidade misturada

  • Diga "Selecionar" ao focalizar um botão (você pode usar esse comando em qualquer lugar para clicar em um botão).
  • Você pode dizer o nome do rótulo de um botão da barra de aplicativos em alguns aplicativos para realizar uma ação. Por exemplo, olhando para um aplicativo, um usuário pode dizer o comando "Remover" para remover o aplicativo do mundo (isso economiza tempo, pois você não precisa clicar nele com a mão).
  • Você pode iniciar Cortana escutando dizendo "Hey Cortana". Você pode fazer perguntas a ela ("Hey Cortana, quão alta é a torre Eiffel?"), dizer a ela para abrir um aplicativo ("Hey Cortana, abrir Netflix"), ou dizer-lhe para trazer o Menu Iniciar ("Hey Cortana, leve-me para casa") e muito mais.

Perguntas e preocupações comuns dos usuários em relação à voz

  • O que posso dizer?
  • Como saberei que o sistema me ouviu corretamente?
    • O sistema não entende corretamente meus comandos de voz.
    • Ele não reage quando dou um comando de voz.
  • Ele reage de maneira errada quando dou um comando de voz.
  • Como direcionar minha voz a um aplicativo específico ou a um comando de aplicativo?
  • Posso usar a voz para comandar as coisas no quadro holográfico do HoloLens?

Confira também