次の方法で共有


Copilot Studio Kit を使用してエージェント テストを強化する

Power CAT Copilot Studio Kit は、エージェントの応答を確認できるユーザーフレンドリーなアプリケーションです。 また、一括作成や更新のために Excel のエクスポートやインポートなどのネイティブ機能も含まれています。

構成、実行、分析

Copilot Studio API (Direct Line API) に対するテストを構成して実行し、予想される結果に対するエージェントの応答を評価します。

結果を強化するには、会話トランスクリプト レコード (トリガーされた正確なトピック名や意図認識スコアなど) を分析して、Azure Application Insights と Dataverse から追加のデータ ポイントを取得します。

AI が生成した回答は本質的に非決定論的であり、プロンプトを使用して、生成された回答をサンプル回答または検証手順と比較します。

Azure Application Insights、AI Builder、Dataverse など、Copilot Studio Direct Line API のテストと分析に関連する Azure および Power Platform コンポーネントを示す図。

テストの種類

このツールでは、次の種類のテストがサポートされています。

  • 応答マッチ
  • アダプティブ カードなどの添付ファイル
  • トピックの一致 (Dataverse が必要)
  • 生成的な回答 (回答が生成されなかった理由の詳細については、応答分析と Application Insights に AI Builder が必要)
  • 複数ターンのテストの種類は、特殊なテストの種類です。 これは、同じ会話コンテキストで指定された順序で実行される 標準 型の一連のテスト ケースで構成されます。 マルチターン テストを使用して、シナリオをエンドツーエンドでテストし、生成オーケストレーションを使用してカスタム エージェントをテストします。
  • プランの検証を使用すると、作成者は、生成オーケストレーションを使用するカスタム エージェントに想定されるツールが含まれることを検証できます。 このテストの種類では、エージェントの言うことを評価するのではなく、エージェントの動的プランに、事前に決定されたしきい値に予想されるツール (ツール、アクション、接続されたエージェント) が含まれていることが確認されます。

テストの種類の詳細については、「 Copilot Studio Kit でテストを構成する」を参照してください。

すべてのテスト実行の成功率と待機時間を示す図を含む、テスト実行の結果の詳細のスクリーンショット。

次のステップ