はじめに

完了

Azure AI 音声には、音声対応アプリケーションを構築するために使用できる API が用意されています。 これには、次のものが含まれます。

  • 音声テキスト変換: "音声認識" を有効にして、アプリケーションで音声入力を受け入れることができるようにする API。
  • テキスト読み上げ: "音声合成" を有効にして、アプリケーションで音声出力を提供できるようにする API。
  • Speech Translation: 音声入力を複数の言語に翻訳するために使用できる API。
  • Speaker Recognition: アプリケーションで音声に基づいて個々の話者を認識できるようにする API。
  • 意図認識: 会話言語理解と統合して、音声入力の意味論的意味を判断する API。

このモジュールでは、すべての音声対応アプリケーションのコア機能である音声認識と音声合成に焦点を当てます。

このモジュールでは、次の方法を学習します。

  • Azure AI 音声サービス用に Azure リソースをプロビジョニングする
  • 音声テキスト変換 API を使用して音声認識を実装する
  • テキスト読み上げ API を使用して音声合成を実装する
  • オーディオ形式と音声を構成する
  • 音声合成マークアップ言語 (SSML) を使用する

このモジュール内のユニットには、Azure AI 音声に関する重要な概念情報と、サポートされているソフトウェア開発キット (SDK) の 1 つによって、その API を使用する方法が含まれています。その後、ハンズオン演習内で Azure AI 音声を試すことができます。 ハンズオン演習を完了するには、Microsoft Azure サブスクリプションが必要です。 アカウントを取得済みでない場合は、https://azure.com/free から無料評価版にサインアップできます。