イントロダクション
このモジュールでは、HoloLens での Azure Speech Services の使用を調べる Mixed Reality アプリケーションを作成します。 Azure Speech Services は、音声テキスト変換、テキスト読み上げ、音声翻訳を 1 つの Azure サブスクリプションに統合したものです。
音声を他の言語に翻訳できるアプリケーションを構築することが期待されるシナリオを想像してみてください。 その機能をアプリケーションに組み込む簡単な概要が必要であり、Azure Speech Services で提供できます。
このモジュールが完了すると、デバイスのマイクを使用して、リアルタイムで音声をテキストに文字起こしできるようになります。 さらに、音声を他の言語に翻訳し、意図認識機能を使用して、人工知能を使用して音声コマンドを理解できるようになります。
このチュートリアルの完成した例については、こちらをご覧ください。
学習目標
- Azure Speech Services と HoloLens 2 アプリケーションを統合する方法について説明します
- 音声認識を使用してテキストを文字起こしする方法について説明します
- Azure 音声認識を使用してコマンドを実行する方法について説明します
- Azure 音声翻訳を統合する方法について説明します
- Language Studio ポータルで意図、エンティティ、発話を設定する方法について説明します
- アプリケーションで意図と自然言語の理解を実装する方法について説明します
[前提条件]
- 正しいツールで構成された Windows 10 PC。
- Windows 10 SDK 10.0.18362.0 以降。
- Unity 2021.3 以降がインストールされ、ユニバーサル Windows プラットフォーム ビルド サポート モジュールが追加された Unity Hub。
- Unity モジュールで Mixed Reality プロジェクトを設定します。
- Mixed Reality Feature Tool