エージェントは、コア能力を拡張する専門的なツールを装備することでより強力になります。 Copilot Studioは主に3つのエージェントツールカテゴリーを提供しています:
この記事では、各ツールタイプがどのように機能し、いつ使用すべきか、そしてそれらがどのようにしてより有能で効率的なエージェントを構築するのに役立つかを探ります。 また、コンピュータ利用シナリオ向けのホスティングマシンと持ち込みマシンの違い、そして従来のロボティックプロセスオートメーション(RPA)とエージェント使用コンピュータ(CUA)のどちらを選ぶかのガイダンスも学びます。
AIプロンプトを使って応答を生成する
AIプロンプトは一連の指示を使ってAIモデルから応答を生成します。 これらの指示により多くのテキストや文書を挿入するための変数を含めることができます。 出力は通常、プレーンテキストまたはJSON形式で提供されます。 Copilot Studioに組み込まれているか、Microsoft Foundry経由で展開した任意のAIモデルを選択して応答を生成することができます。
エージェントツールとして、またはトピック内からプロンプトを呼び出すことができます。 すべてのプロンプトはプロンプトライブラリに保存され、アプリケーションのライフサイクル管理、ロールベースのアクセス制御、共有をサポートします。
エージェントに特定のタスクを実行するためのプロンプトの使用方法について詳しく学びましょう。
AIプロンプトを使うべきか、オーケストレーターを使うべきかを見極めましょう
Copilot Studioで構築されたすべてのエージェントは、オー ケストレーター を使ってシステム命令、ユーザー入力、コンテキスト情報に基づいてツール、トピック、知識を選択して応答方法を決定します。 オーケストレーターは生成オーケストレーションのエンジンであり、エージェントのツールや記述を使ってアクションを計画し、応答を構成します。
オーケストレーター駆動の応答は AIプロンプトに似ているように見えますが、両者は異なる目的を持っています。 AIプロンプトは、モデル設定をより深くコントロールできる独立したプロンプトベースのアクションです。
AIプロンプトは 、Microsoft Foundryで利用可能なモデルを含む、より幅広いモデルをサポートしています。 また、 Dataverseのグラウンディング、 ファイル入力、 コードインタプリタなどの機能もサポートしています。
オーケストレーターは固定されたシステムプロンプトとツールの説明を用いて、特定のリクエストに適した構成要素を選択します。 メイカーはオーケストレーターのシステムプロンプトを編集できませんが、 エージェントの指示を通じてその挙動に影響を与えることは可能です。
AIプロンプトはフォーマット、制約、論理を完全に制御できるため、細かく調整された出力や高度に構造化された出力が必要なシナリオに最適な選択肢となります。 例えば、単純なフォーマット(「これらの正確な言葉を使ってABAB構造の韻を踏む詩を書く」)を超えたスタイルのコントロールが必要な場合は、プロンプトの方が適しています。
オーケストレーターは、テキストから単一の名前を抽出するなどの簡単な作業に適しています。 複雑な抽出にはAIプロンプトを使いましょう。 例えば、長いレポートから複数のエンティティを引き出し、それらをドメイン固有の関係(例えば保険報告書から複数の名前を抽出し、事故の一方に関わる自動車修理サービスのオーナーを特定するなど)にリンクさせるなどです。
オーケストレーターとAIプロンプトのどちらを選ぶかは、必要なカスタマイズのレベルによって異なります。 モデルの挙動や出力を正確に制御したいなら、AIプロンプトを選びましょう。 一般的な推論、ツール選択、軽量なフォーマットで十分な場合には、オーケストレーターが適切な選択です。
MCPを使ってエージェントツールを統合する
モデルコンテキストプロトコル(MCP)は、AIモデルが外部ツール、データソース、ユーザー環境と一貫性があり拡張可能な方法でやり取りするために使用する汎用インターフェースです。
これに対し、Power Platformコネクタは各アクションとその入力を記述し、新しい定義が利用可能になるたびに更新する必要があります。 各ツールごとにカスタムコーディングや統合を行うのは複雑でスケーラビリティが低いです。
Outlook、Dataverse、GitHubなどのMicrosoftサービスや、SalesforceやJIRAなどのサードパーティサービスには、Copilot Studioに付属するMCPサーバーを活用してください。 存在しないサービス用にカスタムMCPサーバーを構築しましょう。
MCPの利点には以下が含まれます:
- AIモデルの標準化されたコンテキスト
- Copilot Studioとのシームレスな統合
- 開発者の効率とユーザー体験の向上
- ガバナンス、監視、拡張性
MCPサーバーを実装する前に、以下の制限を考慮してください:
- ツールの説明を、いつ呼び出すかの文脈を増やして豊かにすることはできません。
- トピックはMCPサーバーを直接呼び出すことはできません。
MCPを使うタイミングを理解する
Copilot Studioでも複数の統合アプローチを用いて同じ結果を得ることができます。 モデルコンテキストプロトコル(MCP)サーバーを使うべきか、Power Platformコネクタや直接のREST API呼び出しのような単純な選択肢を使うべきかを理解することが重要です。
クライアントごとの設定を避け、複数のエージェントにツールやリソースを公開できる標準化され中央管理の方法が必要な場合はMCPを使いましょう。 MCPサーバーはツールやリソースを公開し、エージェントが自動的に発見し、バージョンを付け、一貫して使用できる。なぜなら、MCPサーバーがツールの記述や入力を定義しているからだ。 対照的に、APIを直接追加する場合は、その目的を手動で説明し、エージェントごとに入力を定義する必要があります。
MCPは特に上流APIが頻繁に変わる場合に価値があります。 APIを利用するすべてのエージェントを更新する代わりに、MCPサーバー上で定義を一度変更すれば、すべてのエージェントが更新されたバージョンを自動的に使用し、再公開しません。 MCPサーバーが存在しない場合や、迅速にプロトタイピングを行っている場合、APIを直接呼び出す方が速く、MCPライフサイクル全体を導入するためのセットアップオーバーヘッドを避けられます。
MCP を使用するには、生成オーケストレーションを有効にする必要があります。 詳しくは「 How is MCP Work?」をご覧ください。
コンピュータ使用ツールを使ってデスクトップのプロセスを自動化
コンピュータ使用ツールを使うことで、エージェントは自動化スクリプトやAPIを必要とせずにコンピュータを操作できます。 スクリプトやAPIを使う代わりに、プロンプトを使ってエージェントを設定します。 エージェントは目標を達成する最善の方法を決定します。 プロセス中、エージェントは各ステップでスクリーンショットを撮り、分析して次のアクションを決定し、そのアクションを実行し、このサイクルをタスク完了まで繰り返します。 エージェントが撮影したスクリーンショットや理由付けの手順は、ラン履歴の一部として公開されています。
エージェントがコンピュータ利用ツールから恩恵を受ける一般的なシナリオには以下のようなものがあります:
- データ入力:入ってくるCSVファイルの各行について、SAPで販売注文を作成し、生成された注文IDをファイルに戻します。
- データ抽出:各サプライヤーポータルにアクセスし、リスト上のSKUを検索し、価格、在庫、リードタイムを抽出し、タイムスタンプ付きの結果をデータベースに挿入します。
- アプリ間で:デスクトップファイナンスクライアントからその日の取引をエクスポートし、QuickBooksを操作して各エントリーを正しい口座に投稿します。
ホストされたマシンと自分のマシンを持ち込むことの区別
エージェントはMicrosoftがホストするマシンや持ち込み(BYO)マシンでコンピュータ使用ツールを呼び出すことができます。 ホストマシンはIT設定や請求なしで即座に利用可能です。 これらは、Entra加入されていない事前プロビジョニング済みのWindows 365クラウドPCの共有プールに属しています。 BYOマシンは顧客自身の仮想ネットワーク内で事前にプロビジョニングされなければなりません。 Power AutomateでBYOマシンの登録と管理が必要です。
生産シナリオではBYOマシンを使いましょう。 Microsoft Entra IDに対応し、Intuneに登録しており、ウェブとデスクトップの自動化の両方のユースケースをサポートしています。 機能は限られているため、プロトタイピングにはホスティングマシンのみを使用してください。 ユーザーごとに同時に利用できるクラウドPCは1台のみで、需要に応じて使用を制限することができます。
詳細については、「 コンピューターの使用場所を構成する」を参照してください。
ロボットプロセス自動化(RPA)とエージェントを使ったコンピュータ(CUA)
ロボティックプロセスオートメーション(RPA)は 、スクリプトを用いてコンピュータを自動化することです。 CUAと同じ多くのシナリオに適用できます。 しかし、RPAとCUAの違いを理解することが重要です。
| 特徴 | RPA | CUA |
|---|---|---|
| 自動化の種類 | ルールベース | LLM駆動 |
| 相互作用法 | UIツリー | Vision |
| オーサリング | 複雑な文字 | 自然言語命令 |
| 意思決定 | あらかじめ定められたルール | 自律的な視覚ベースの意思決定 |
| 柔軟性 | 柔軟性の制限 | 高い柔軟性 |
| エラー処理 | 静的エラー処理 | 視覚的フィードバックに基づく自己補正 |
RPAを使用する場合:
- 一般利用可能(GA)機能のみが許可されています。
- ユーザーインターフェースは安定しています。 スクリーン、フィールド、セレクターはほとんど変わりません。
- ルールは明確です。 ルールで決定を記録できます。
- スピードが重要です。 大量に。 一秒一秒が大切です。
- RPAチームが所有しています。 チームは既存のRPA開発および管理知識を持っています。
CUAを利用する場合:
- ユーザーインターフェースは大きく変化します。 複数のアプリを扱い、頻繁にリデザインを行います。
- 急いで必要だ。 RPAチームのバックログは満杯です。
- ユーザーインターフェースは重要です。 この作業は、画面上に表示されるチャート、色、動的なレイアウトなどによって決まります。
- 決定は曖昧です。 エージェントは理屈をつけ、次のステップを選ぶか、自己修正しなければなりません。