デプロイ用に AI エージェントを適応および拡張する

8 分

前のユニットの実装パターンは、ビルドするすべてのエージェントに適用されます。ただし、シナリオによって要件が異なります。顧客向けのエージェントには会話型の細かい制御とプライバシーの制御が必要ですが、内部運用エージェントは信頼性とコンプライアンスを要求します。このユニットでは、これら 2 つのカテゴリのデプロイに対してエージェントの構成と動作を調整する方法について説明します。

顧客向けエージェント

カスタマーサポートやセールスアシスタントなど、エンドユーザーと直接やり取りするエージェントは、会話の品質、パーソナル化、プライバシーに特別な注意を払う必要があります。

会話の品質

システムプロンプトは、エージェントの通信方法を制御するための主要なツールです。目的のトーン、スタイル、応答の長さを定義します。

トーンとスタイル: 「フレンドリーでプロフェッショナルな方法で対応する」や「シンプルな言語を使用して技術的な専門用語を避ける」などのガイドラインを含めます。サポートエージェントの場合、共感的なトーンが適切に機能します。セールスアシスタントの場合は、より有益なトーンが適している可能性があります。
質問の明確化: 要求が推測ではなくあいまいな場合に明確化を求めるようエージェントに指示します。例: "ユーザーの要求が不明な場合は、アクションを実行する前に、丁寧な明確な質問をしてください"。
応答の長さ: "ユーザーが詳細を要求しない限り、応答を 3 つの文の下に保持する" という簡潔な応答を維持するようにエージェントをガイドします。

これらのガイドラインは、反復的に調整できます。エージェントとの会話フローをテストし、結果に基づいてシステムプロンプトを調整します。

パーソナル化とデータのプライバシー

顧客向けのエージェントは、注文履歴やアカウントの詳細などの個人データにアクセスすることがよくあります。パーソナル化とプライバシー保護のバランスを取る:

ユーザーコンテキストの挿入: セッションが開始されたら、システムプロンプトまたは初期コンテキストを通じて関連するユーザー情報を挿入します。たとえば、エージェントがパーソナライズされたサービスを提供できるように、ユーザーの名前、アカウント層、最近の注文履歴を含めます。
プライバシーに関する手順: 明示的なルールをシステムプロンプトに追加します。"ログインユーザーのアカウントデータについてのみ説明します。内部参照コードや機密性の高いシステム情報は表示しないでください。"
ツールでのデータ最小化: ツールが機密情報 (完全なアドレスなど) を取得する場合は、ツールハンドラーの応答をフィルター処理して、エージェントに必要なもの (配送先の市区町村など) のみを返します。

ナレッジ統合

多くの場合、サポート担当者やセールスエージェントは、AI モデルのトレーニングデータを超える製品情報、FAQ、またはポリシードキュメントにアクセスする必要があります。 Retrieval-Augmented 生成 (RAG) パターンは、エージェントに検索ツールを提供することで、この要件に対処します。

ドキュメントや FAQ システムに対してクエリを実行する search_knowledge_base(query) などのツールを定義します。
製品またはポリシーの質問に回答するときに、このツールを使用するようにエージェントに (システムプロンプトで) 指示します。
古い応答を回避するために、ナレッジベースを最新の状態に保ちます。

このアプローチでは、モデルのトレーニングデータに依存するのではなく、実際のドキュメント内のエージェントの回答が根拠となり、不正確な応答が減少します。

人間への引き継ぎ

適切に構成されたエージェントでも、解決できない状況が発生します。明確なエスカレーションパスを作成します。

エージェントが収集したすべてのコンテキストを持つ人間の代表者に会話を転送する escalate_to_human(reason) ツールを提供します。
要求を解決できない場合、またはユーザーが明示的に人間を要求した場合に、このツールを使用するようにエージェントに指示します。
初期デプロイ時に、顧客に到達する前に、人間のレビューキューを通じてエージェントの応答をルーティングすることを検討し、エージェントの品質に対する信頼を構築します。

バックオフィスおよび自律エージェント

財務の自動化、サプライチェーン管理、IT 運用エージェントなど、バックグラウンドで運用するエージェントは、会話品質よりも信頼性、精度、エンタープライズシステムとの統合に優先順位を付けます。

決定性と検証

エンタープライズプロセスでは、予測可能な動作が重要です。

構造化された出力: エージェントがシステム入力用の自由形式のテキストではなく、特定のフィールド値を提供するようにツールインターフェイスを設計します。たとえば、エージェントは、エントリ全体をテキストとして生成するのではなく、 create_journal_entry(account, amount, description) ツールに構造化パラメーターを渡すようにします。
コード内の計算: AI モデルに依存するのではなく、任意の数学演算にツールを使用します。 calculate_tax(amount, rate) ツールは信頼性の高い結果を生成しますが、モデルでは算術エラーが発生する可能性があります。
履歴検証: デプロイの前に、既知の履歴データに対してエージェントを実行し、その決定を人間が行ったことと比較します。不一致は、しきい値と手順を調整するのに役立ちます。

スケジュールとトリガー

対話型エージェントとは異なり、バックオフィスエージェントは多くの場合、ユーザー入力ではなくイベントまたはスケジュールによって開始されます。

スケジュールされたタスク: cron ジョブまたはスケジュールされたサービスは、GitHub Copilot SDK セッションを作成し、コンテキスト ("毎日の請求書調整の実行" など) を提供し、エージェントを実行できるようにします。
イベントドリブン: 監視アラートまたは Webhook によってセッションの作成がトリガーされ、イベントの詳細が入力として送信されます。通常、各イベントは、コンテキストの混在を防ぐために独自のセッションを取得します。
ステートレス実行: 独立したセッションで各タスクまたはイベントを処理します。この方法では、関連のない操作間の繰り越しの混乱を回避できます。

エンタープライズシステム統合

バックオフィスエージェントは、API とデータベースと頻繁にやり取りします。ツールハンドラーに堅牢性を組み込みます。

再試行とタイムアウト: 外部システムを呼び出すツールハンドラーに指数バックオフを使用して再試行ロジックを実装します。
トランザクションの安全性: エージェントが複数の関連する書き込みを実行する場合は、ステップごとに個別のツールではなく、完全なトランザクションをアトミックに処理する 1 つのツールを使用することを検討してください。
最小特権アクセス: エージェントの API 呼び出しに対する最小限のアクセス許可を持つサービスアカウントを使用します。この方法では、予期しない動作の影響が制限されます。
監査ログ: エージェントが実行したすべてのアクション (呼び出されたツール、渡されたパラメーター、返された結果など) をログに記録します。アクションをエージェント開始としてマークする識別子を含めます。

人間による監視

自律エージェントには、依然として人間のセーフティネットが必要です。

アラート: エージェントがトレーニングの外部で状況が発生した場合、または複数回試行しても問題が解決しない場合に使用できる notify_manager(issue) ツールを提供します。
定期的なレビュー: 特に早期デプロイ中に、ドメインの専門家がエージェントの決定を定期的に確認します。
手動オーバーライド: エージェントを自律実行からアドバイザリモードにすばやく変更できる機能フラグまたはモードスイッチを実装します。このモードでは、推奨事項はログに記録されますが、アクションは実行されません。

パフォーマンスとコストに関する考慮事項

エージェントが頻繁に実行される場合、または大量のエージェントを処理する場合は、次の点を考慮してください。

モデルの選択: より高速で安価なモデルをルーチンタスクに使用し、複雑な推論のためにより能力の高いモデルを予約します。 SDK を使用すると、セッションごとにモデルを構成できます。
バッチ処理: エージェントが多数の項目を処理する必要がある場合は、アイテムごとに個別のセッションを作成するのではなく、1 つのセッション内で作業をフレーム化します。
マルチエージェントパターン: 複雑なワークフローの場合は、構成とツールセットが異なる複数のセッション間で責任を分割することを検討してください。 1 つのエージェントが分析を処理し、別のエージェントが実行を処理し、アプリケーション間で調整を行う場合があります。

概要

さまざまなデプロイシナリオに合わせて AI エージェントを調整するには、ユースケースに合わせて会話スタイル、ツールセット、運用パターンを調整する必要があります。顧客向けのエージェントは、プライバシーを維持しながら会話の品質とパーソナル化を優先しますが、バックオフィスのエージェントは信頼性、統合、自律運用に重点を置いています。これらの考慮事項を念頭に置いてエージェントを設計することで、任意のコンテキストでその有効性とビジネス価値を最大化できます。次のユニットでは、GitHub Copilot SDK を使用してこれらの適応を実際に実装する方法について説明します。

フィードバック

このページはお役に立ちましたか?