음성 인식 컨트롤

완료됨

음성 합성 같은 음성 인식은 최초 도입 이후 크게 개선되었습니다. 음성 인식은 완벽하지는 않지만 액세스 가능한 환경을 만드는 유용한 도구일 수 있습니다.

다음 몇 단원에서 학습할 내용은 다음과 같습니다.

  • 일반 Windows 음성 인식이 받아쓰기에 맞춰지는지 알아봅니다. 사용할 수 있지만 계산 입력 속도가 느립니다.
  • 음성 인식 시스템의 특정 인스턴스가 자연스럽게 들리는 입력을 해설할 수 있는지 알아봅니다.
  • 음성 제어는 재미있고 유용합니다.
  • 음성 인식에는 해당 컨텍스트가 ‘필요’합니다. "sine" 및 "sign"과 같은 단어는 동일하게 들리고 컨텍스트로만 구별됩니다.
  • 음성 인식을 사용하도록 설정하기 전에 일부 권한이 필요한지 알아봅니다.

음성 인식

마이크와 스피커가 있는 헤드셋이 개발 컴퓨터에 연결되어 있는지 확인합니다. 인식할 음성이 없으면 음성 인식을 테스트하기 어렵습니다.

기본 Windows 음성 인식 도구

코드를 추가로 변경하지 않고 Windows 음성 인식 도구가 계산기에서 어떻게 작동하는지 확인해 보겠습니다.

  1. Windows 검색 창에서 "음성 인식"을 입력합니다. 표시되는 창에서 음성 인식 시작을 선택합니다. 음성 인식 시스템이 켜지거나 꺼지는 시간을 보여 주는 작은 그래픽이 표시됩니다. 마이크 아이콘을 선택하면 수신 중 텍스트가 표시됩니다.

Windows is listening.

  1. 계산기를 실행하고, 계산기에 포커스가 있는지 확인하고, 계산을 말해 봅니다. 숫자를 어떻게 독특하게 말해야 하는지 확인합니다. 741은 “칠백 사십 일”로 말하는 것이 아니라 “칠”, 일시 중지, “사”, 일시 중지, “일”로 말해야 합니다. “곱하기 2”를 말한 후 “같음”을 말해 결과를 계산합니다.

  2. 10진수인 “3.14”를 말해 보세요. 숫자를 얼마나 느리게 말해야 하고 “점”이 10진수를 제대로 표시하는지 확인합니다.

  3. 인식 시스템은 이전에 설정된 AutomationProperites.Name 항목을 인식합니다. “Sine”이라고 말해 Sin 단추를 트리거하고, “제곱”을 말해 ^ 단추를 트리거할 수 있습니다.

  4. 숫자를 계산기 메모리에 저장해 보세요(디스플레이에 숫자만 포함되는 경우에만 사용할 수 있음). 헤더 텍스트를 말해서 토글 스위치를 켜고 꺼 보세요.

  5. 상수를 입력하려면 먼저 "상수 표시"라고 말합니다. 그런 다음, 상수를 선택하고 계산에 추가하려면 상수를 분명히 식별하는 단어 앞에 “두 번 클릭”이라고 말합니다. 예를 들어 "두 번 클릭 피트를 미터로"를 시도하면 상수 값(0.3048)이 계산에 추가됩니다. 경우에 따라 단어를 여러 번 분명하게 말해야 합니다.

참고

사용자가 의도한 단추를 음성 인식기가 인식하지 못하지만 두 개 이상의 단추가 비슷한 경우에는 해당 단추가 연결된 번호와 함께 강조 표시되고 “확인” 뒤에 숫자 중 하나를 말하는 옵션이 제공됩니다.

표준 음성 인식으로 재생하면 해당 기능과 단점이 잘 보입니다. 일부 앱에서는 이것이 필요하거나 원하는 모든 것일 수 있습니다. 하지만 계산기의 경우 ”454를 0.66의 아크 코사인으로 나눈 값은 무엇입니까”와 같이 일시 중지 없이 전체 문장을 말합니다. 이 문장은 개별 단추와 일치하지 않으므로, 기본 Windows 인식 시스템에서 이 문장을 처리할 수 없습니다. 이 환경을 개선하기 위해 재미있는 작업을 해보겠습니다.