Direct Line Speech とは

Direct Line Speech は、柔軟で拡張可能な音声アシスタントを作成するための堅牢なエンドツーエンドのソリューションです。 これは、Bot Framework とその Direct Line Speech チャネル (音声によるボットとの対話のために最適化されています) を利用しています。

音声アシスタントはユーザーの音声を聞き取り、応答としてアクションを実行します (多くの場合は音声で応答します)。 これは、音声テキスト変換を使用してユーザーの音声を文字に変換し、そのテキストの自然言語理解に対してアクションを実行します。 このアクションには、多くの場合、テキスト読み上げで生成されたアシスタントからの音声出力が含まれます。

Direct Line Speech は、音声アシスタントのための最高レベルのカスタマイズと精緻化を提供します。 これは、タスクの完了または指示と制御が目的の、自由形式な、自然な、またはその 2 つの性質を持った会話のシナリオ向けに設計されています。 このような高度の柔軟性はさらなる複雑化を伴います。 自然言語入力を使用して十分に定義されたタスクを扱うシナリオでは、Custom Commands を検討します。

Direct Line Speech では、次のロケールがサポートされます: ar-egar-saca-esda-dkde-deen-auen-caen-gben-inen-nzen-uses-eses-mxfi-fifr-cafr-frgu-inhi-inhu-huit-itja-jpko-krmr-innb-nonl-nlpl-plpt-brpt-ptru-rusv-seta-inte-inth-thtr-trzh-cnzh-hkzh-tw

Direct Line Speech の使用を開始する

Direct Line Speech を使用して音声アシスタントを作成するには、Azure portal で Speech リソースと Azure Bot リソースを作成します。 次に、Direct Line Speech チャネルにボットを接続します。

Conceptual diagram of the Direct Line Speech orchestration service flow

Direct Line Speech を使用して簡単な音声アシスタントを作成するための完全なステップ形式ガイドについては、Speech SDK と Direct Line Speech チャネルを使用してボットを音声対応にするチュートリアルを参照してください。

また、コードを実行し、API を迅速に学習できるように設計されたクイックスタートも用意しています。 以下の表は、音声アシスタントのクイックスタートの一覧を言語とプラットフォーム別に整理して示しています。

クイック スタート プラットフォーム API リファレンス
C#、UWP Windows [参照]
Java Windows、macOS、Linux [参照]
Java Android [参照]

サンプル コード

音声アシスタントを作成するためのサンプル コードは GitHub から入手できます。 これらのサンプルは、いくつかの一般的なプログラミング言語でアシスタントに接続するためのクライアント アプリケーションに対応しています。

カスタマイズ

音声サービスを使用して構築された音声アシスタントでは、音声変換テキスト読み上げ、およびカスタム キーワードの選択に利用できるさまざまなカスタム オプションを使用できます。

Note

カスタマイズのオプションは、言語やロケールによって異なります (サポートされる言語に関するページを参照してください)。

Direct Line Speech と音声アシスタントのための関連する機能は、仮想アシスタント ソリューションとエンタープライズ テンプレートに最適な補足機能です。 Direct Line Speech は互換性のあるどのボットでも機能しますが、これらのリソースでは、高品質の会話エクスペリエンスを実現するための再利用可能なベースラインと、すぐに開始するための一般的なサポート スキルとモデルが提供されます。

リファレンス ドキュメント

次の手順