必要な拡張機能を展開する
音声対応の Microsoft Copilot Studio エージェントの基本動作は、従来のエージェントとさほど変わりません。 設計の点では、エージェントを作成する際に何も変える必要はなく、 トピックやエンティティなどの要素は同じ方法で設計されます。 主な違いは、テキストベースの手段を通じて顧客とやり取りを行うのではなく、エージェントでは音声での会話を通じて顧客とやり取りする点です。 このプロセスが意図したとおり行われるには、すべてが正常に処理されるように、環境に複数の拡張機能をインストールする必要があります。
エージェントで音声機能を設定する場合は、いくつかの構成を行う必要があります。 すべての音声設定は 設定>音声 の順に移動して行います。 初期状態のエージェントは音声向けに最適化されていません。 音声向けに最適化するを選択すると、追加の音声機能を利用できます。
音声向けに最適化するを有効にすると、次の設定を更新できます。
音声をプライマリ作成モードとして使用する:
エージェントのデータで精度を高める: エージェントのコンテンツに基づいた音声に固有のデータを、音声認識モデルに追加できます。 これによりエージェントの公開にかかる時間が長くなります。
タイムアウト:
DTMF: さまざまな設定が含まれており、エージェントがダイヤル パッドから入力を受け取る方法を定義できます。 変更するべき設定は 2 つあります:
桁間のタイムアウト: ユーザーが最大入力長を満たさなかった場合に、このタイムアウト制限が適用されます。 これが適用されるのは複数桁の DTMF 入力のみです。
終了のタイムアウト: ユーザーが最大入力長を満たして、終了キーを押さなかった場合に、このタイムアウト制限が適用されます。 これが適用されるのは複数桁の DTMF 入力のみです。
無音の検出: エンドユーザーによる入力が検出されない場合にエージェントが応答する方法を指定できます。 この設定はバイナリであり、有効または無効にすることができます。
音声の収集: エージェントが入力データの検出と収集を行う時間に制限を設定できます。 次の設定が含まれます。
発話終了のタイムアウト: ユーザーが発話中や発話後に沈黙した場合に、このタイムアウト制限が適用されます。 このタイムアウト制限を超えて沈黙が続いた場合、エージェントはユーザーが話し終えたと見なして動作します。
音声認識のタイムアウト: ユーザーが話し始めてからエージェントがユーザーの入力を許可するまでの時間が、このタイムアウト制限で決定されます。
遅延のメッセージング: 予想よりもバックグラウンド操作に時間がかかる場合に、ユーザーに遅延メッセージを通知する方法とタイミングを選択できます。 次の設定が含まれます。
メッセージ送信の遅延: バックグラウンド操作要求が開始された後、エージェントが遅延メッセージの配信まで待機する時間が、この設定で決定されます。
最小再生時間: メッセージの再生中にバックグラウンド操作が完了した場合でも、少なくともこの期間は遅延メッセージが再生されます。
音声の感度: 音声の感度レベルを制御します。 低く設定すると、より多くのバックグラウンド ノイズが除去されます。 高い設定は静かな環境に適しています。