Dyktowanie — MRTK2
Dyktowanie umożliwia użytkownikom nagrywanie klipów audio i uzyskiwanie transkrypcji. Aby go użyć, upewnij się, że system dyktowania jest zarejestrowany w profilu systemu wejściowego. Dostawca danych wejściowych dyktowania systemu Windows to system dyktowania dostarczany z pudełka, ale alternatywne systemy dyktowania można utworzyć implementowanie .IMixedRealityDictationSystem
Wymagania
System dyktowania używa DictationRecognizer aparatu Unity, który używa podstawowych interfejsów API rozpoznawania mowy systemu Windows do obsługi dyktowania. Należy pamiętać, że oznacza to, że ta funkcja jest obecna tylko na platformach opartych na systemie Windows.
Użycie systemu Dyktowania wymaga możliwości aplikacji "Klient internetowy" i "Mikrofon" w sekcji PlayerSettings — Capabilities (Funkcje). Aby uzyskać więcej informacji na temat danych wejściowych głosowych w środowisku Unity, zobacz dokumentację Windows Mixed Reality.
Konfiguracja
Po skonfigurowaniu usługi dyktowania możesz użyć skryptu DictationHandler
do uruchamiania i zatrzymywania sesji nagrywania oraz uzyskiwania wyników transkrypcji za pośrednictwem aparatu UnityEvents.
- Hipoteza dyktowania jest wywoływana , gdy użytkownik mówi z wczesnymi, szorstkimi transkrypcjami dźwięku przechwyconego do tej pory.
- Wynik dyktowania jest zgłaszany na końcu każdego zdania (tj. gdy użytkownik wstrzymuje się) z ostateczną transkrypcją dźwięku przechwyconego do tej pory.
- Dictation Complete jest wywoływany na końcu sesji nagrywania z pełną, ostateczną transkrypcją dźwięku.
- Błąd dyktowania jest zgłaszany w celu informowania o błędach w usłudze dyktowania. Transkrypcja w tym przypadku zawiera opis błędu.
Przykładowa scena
Scena DictationHandler
dyktowania w programie MRTK/Examples/Demos/Input/Scenes/Dictation
pokazuje używany skrypt. Jeśli potrzebujesz większej kontroli, możesz rozszerzyć ten skrypt lub utworzyć własne wdrożenie IMixedRealityDictationHandler
w celu bezpośredniego odbierania zdarzeń dyktowania.