ディクテーション — MRTK2

ディクテーションにより、ユーザーはオーディオクリップを録音し、文字起こしを取得できます。 これを使用するには、ディクテーションシステムが入力システム プロファイルに登録されていることを確認してください。 Windows ディクテーション入力プロバイダーは、すぐに使用できるディクテーションシステムですが、IMixedRealityDictationSystemを実装して代替のディクテーションシステムを作成できます。

必要条件

ディクテーション システムでは、Unity の DictationRecognizer を使用しており、このシステム自体がディクテーションを処理するために基礎となる Windows 音声 API を使用しています。 これは、この機能がWindowsベースのプラットフォームにのみ存在することを意味することに注意してください。

ディクテーション システムを使用するには、 PlayerSettings-Capabilities セクションの「InternetClient」と「Microphone」の両方のアプリケーション機能が必要です。 Unity での音声入力の詳細については、Windows Mixed Reality のドキュメントを参照してください。

構成

データ プロバイダー

ディクテーション サービスを設定したら、DictationHandlerスクリプトを使用して、セッションの記録を開始および停止し、UnityEvents を介して文字起こしの結果を取得できます。

ディクテーション ハンドラー
  • ディクテーションの仮説は、これまでにキャプチャされたオーディオの初期の大まかな書き起こしをユーザーが話したときに発生します。
  • ディクテーション結果は、各文の終わり(つまり、ユーザーが一時停止したとき)に発生し、これまでにキャプチャされた音声の最終的な文字起こしが行われます。
  • ディクテーション完了は、録音セッションの最後に、オーディオの完全な最終的な文字起こしとともに発生します。
  • ディクテーションエラーは、ディクテーションサービスのエラーを通知するために生成します。 この場合の文字起こしには、エラーの説明が含まれています。

シーンの例

MRTK/Examples/Demos/Input/Scenes/Dictationディクテーションシーンは、使用中のDictationHandlerスクリプトを示しています。 さらにコントロールが必要な場合は、このスクリプトを拡張するか、独自の実装IMixedRealityDictationHandlerを作成して、ディクテーションイベントを直接受信することができます。

ディクテーション デモ