前のページでは、エージェントが機能するツール (関数の呼び出し、API のクエリ、Web の検索) について説明しました。 しかし、より多くのエージェントを構築すると、ツール、命令、および参照資料の同じクラスターが一緒に表示され続けるというパターンが現れます。 "経費明細書の提出" 機能は、単なるツールではなく、検証スクリプト、一連のポリシー ドキュメント、フォームに入力する方法の詳細な手順、使用制限に関する知識です。 このバンドルをエージェントからエージェントにコピー貼り付けすると、同期が失われます。
スキル がこの問題を解決します。 スキルは、命令、参照資料、およびオプションのスクリプトを 1 つのユニットにバンドルするポータブル パッケージであり、任意のエージェントがオンデマンドで検出して読み込むことができます。 スキルは オープンな仕様 に従い、エージェント、チーム、さらには製品間で再利用できます。
使用タイミング
次の場合にエージェントにスキルを追加します。
- 論理的に一緒に属する 関連する知識 (命令、参照ドキュメント、スクリプト) のクラスターがあります (たとえば、"経費報告書" や "コード レビュー ガイドライン")。
- 複数のエージェント には同じドメインの専門知識が必要であり、重複した手順ではなく、単一の信頼できるソースが必要です。
- 自己完結型パッケージとして、チーム、プロジェクト、または組織間でエージェント機能を 共有し、配布 したいと考えています。
- コンテキストを効率的に管理する必要があります。スキルは段階的な開示を使用するため、エージェントは必要なときに必要な詳細のみを読み込みます。
考慮事項
| 考慮事項 | 詳細情報 |
|---|---|
| 再 利用 | スキルは自己完結型パッケージです。 作成後、任意のエージェントが利用できます。コピー&ペーストの必要も、コピー間のズレもありません。 |
| コンテキスト効率 | スキルは段階的な開示を使用します。エージェントには簡単な説明 (約 100 トークン) が事前に表示され、関連する場合にのみ完全な命令が読み込まれます。 スキルが不要な場合、コンテキスト ウィンドウはコンパクトに保たれます。 |
| 抽象化コスト | スキルは、ツールの上に抽象化レイヤーを追加します。 1 つのスタンドアロン関数ツールの場合、スキル ラッパーを追加するオーバーヘッドは不要です。 |
| 設計作業 | スキルの境界について事前に考える必要があります。スキル内に属するものと外部に留るもの。 境界が悪いと、スキルが広すぎる (コンテキストを無駄にする) か、狭すぎる (バンドルの利点を失う) 可能性があります。 |
スキルとツールの違い
ツールとスキルは補完的であり、競合しません。 違いを理解することは、それぞれに到達するタイミングを決定するのに役立ちます。
ツールは単一の呼び出し可能なアクションであり、名前、説明、およびパラメーター スキーマを持つ 1 つの関数です。 モデルがツールが必要であると判断すると、構造化された呼び出しが生成され、Agent Framework によって実行され、結果がモデルに戻ります。 ツールは、エージェントの動作のアトムです。
スキルはドメインの専門知識のパッケージです。 次のものが含まれます。
- 手順 — 詳細なガイダンス、決定ルール、およびドメインへのアプローチ 方法 をエージェントに指示する例。
- 参考資料 — ポリシー ドキュメント、FAQ、テンプレート、およびエージェントがオンデマンドで参照できるその他の知識。
- スクリプト — エージェントが実行して特定の操作を実行できる実行可能コード (たとえば、経費データをポリシー ルールに照らしてチェックする検証スクリプト)。
主な違いは、スコープの 1 つです。ツールは、エージェントに 1 つのアクションを実行する機能を提供します。スキルは、 エージェントにドメイン全体を処理するための知識とリソースを提供します。
| ツール | Skill | |
|---|---|---|
| 提供される内容 | 1 つの呼び出し可能なアクション | 手順 + 参考資料 + 省略可能なスクリプト |
| エージェントが使用する方法 | 動作する必要があるときに呼び出す | 関連するタスクが発生したときに読み込み、命令を読み取り、スクリプトを呼び出したり、リソースを参照したりする可能性があります |
| コンテキスト コスト | ツール スキーマは常にプロンプトに表示されます | プロンプトには、スキル名と説明 (最大 100 個のトークン) のみが表示されます。フル コンテンツがオンデマンドで読み込まれる |
| 移植性 | 登録するエージェントに関連付けられている | 互換性のあるエージェントが検出できる自己完結型パッケージ |
| 最適な用途 | 個々のアクション (データベースのクエリ、電子メールの送信) | ドメインの専門知識 (経費ポリシー、コード レビュー ガイドライン、オンボード手順) |
ヒント
ツールは 動詞 (検索、予約、検証) と考え、スキルは 専門知識 (旅行予約の知識、経費ポリシーの知識) と考えてください。 エージェントは、ツールを使用して行動し、スキルを使用して行動する方法を知っています。
スキルのしくみ: 段階的開示
スキルはコンテキスト効率を高めるために設計されています。 プロンプトにすべてを事前に挿入する代わりに、スキルは 3 段階のパターンを使用します。
┌──────────────────────────────────────────────────────────────────┐
│ Stage 1: Advertise │
│ Agent sees skill names and descriptions (~100 tokens each) │
│ in its system prompt at the start of every run. │
└──────────────┬───────────────────────────────────────────────────┘
▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│ Stage 2: Load │
│ Agent calls load_skill to get the full instructions │
│ (< 5000 tokens recommended). │
└──────────────┬───────────────────────────────────────────────────┘
▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│ Stage 3: Read resources │
│ Agent calls read_skill_resource to fetch supplementary files │
│ (FAQs, templates, reference docs) only when needed. │
└──────────────────────────────────────────────────────────────────┘
このパターンは、10 個の登録スキルを持つエージェントが、50,000 ではなく、約 1,000 トークンのコンテキスト オーバーヘッドを支払うことを意味します。 エージェントは、現在のタスクが要求した場合にのみ、その知識を深めます。
さらに、スキルはツール インフラストラクチャの上に構築されます。 Agent Framework は、エージェントのシステム プロンプトで使用可能なスキルをアドバタイズした後、 load_skill と read_skill_resource をツール呼び出しとして公開し、エージェントが呼び出してコンテンツを段階的に読み込みます。
ヒント
スキルの構造、セットアップ、およびコード例の詳細については、 エージェントスキル リファレンスを参照してください。
スキルを使用する場合と他のパターンを使用する場合の考え方
エージェントの能力が高まるにつれて、その動作を整理するいくつかの方法があります。 スキルとツールの比較を次に示します。
| パターン | 最適な用途 | 例 |
|---|---|---|
| 個々のツール | 共有コンテキストを必要としない 1 回限りのアクション |
get_weather関数ツール |
| スキル | 指示、参考文献、およびオプションのスクリプトを用いたドメインエキスパートの知識 | ポリシー ドキュメント、検証スクリプト、およびステップ バイ ステップのファイリング手順を含む "expense-report" スキル |
よくある落とし穴
| 落とし穴 | ガイダンス |
|---|---|
| 過度に幅広いスキル | 会計、税金、経費報告書、給与をカバーしようとする“財務全般に関する”と呼ばれるスキルは、指示が長すぎて焦点が定まっていません。 スキルを 1 つのドメインに集中させます。 |
| セキュリティ レビューのスキップ | スキル命令はエージェントのコンテキストに挿入され、スクリプトはコードを実行します。 サード パーティの依存関係などのスキルを扱います。デプロイする前に、スキルを確認してください。 スキル リファレンスの セキュリティのベスト プラクティス を参照してください。 |
| プログレッシブ 開示の無視 |
SKILL.mdの長さが 2,000 行の場合、エージェントはスキルの読み込み時に高いコンテキスト コストを支払います。 手順を簡潔にし、詳細な参照資料を個別のリソース ファイルに移動して、段階的な開示を最大限に活用します。 |
次のステップ
エージェントにツールとスキルが用意されたら、次の手順では、 ガード レール、ログ記録、コンテンツ フィルタリングなどのクロスカット動作を追加します。この動作は、エージェントのコア ロジックを変更することなく、すべての操作に適用されます。
より深く進む:
- エージェント スキル — セットアップ、コード例、スクリプト、およびセキュリティ ガイダンスに関する完全なリファレンス
- エージェントスキル仕様 — スキルの背後にあるオープンスタンダード
- ツールの概要 - すべてのツールの種類とプロバイダーのサポート マトリックス