はじめに
このモジュールでは、Mixed Reality アプリケーションを作成して、HoloLens で Azure Speech Services を使用する方法について説明します。 Azure Speech Services は、音声テキスト変換、テキスト読み上げ、音声翻訳を 1 つの Azure サブスクリプションに統合したものです。
音声を他の言語に翻訳できるアプリケーションを構築する必要があるシナリオについて考えます。 その機能をアプリケーションに組み込むための簡単な概要が必要です。Azure Speech Services ではそれを提供できます。
このモジュールを完了すると、デバイスのマイクを使用してリアルタイムで音声をテキストに文字起こしできるようになります。 さらに、音声を他の言語に変換でき、意図認識機能を利用し、人工知能を使用して音声コマンドを理解できるようになります。
このチュートリアルの完成した例については、こちらで確認できます。
学習の目的
- Azure Speech Services と HoloLens 2 アプリケーションを統合する方法を学習する
- 音声認識を使用して文字に起こす方法を学習する
- Azure 音声認識を使用してコマンドを実行する方法を学習する
- Azure Speech Translation を統合する方法を学習する
- Language Studio ポータルで意図、エンティティ、発話を設定する方法を学習する
- アプリケーションに意図と自然言語理解を実装する方法を学習する
前提条件
- 正しいツールで構成された Windows 10 PC。
- Windows 10 SDK 10.0.18362.0 以降。
- Unity 2021.3.X 以降がインストールされ、ユニバーサル Windows プラットフォーム ビルド サポート モジュールが追加された Unity Hub。
- Unity モジュールで Mixed Reality プロジェクトを設定する。
- Mixed Reality Feature Tool。