スキルの追加

前のページでは、エージェントが機能するツール (関数の呼び出し、API のクエリ、Web の検索) について説明しました。しかし、より多くのエージェントを構築すると、ツール、命令、および参照資料の同じクラスターが一緒に表示され続けるというパターンが現れます。 "経費明細書の提出" 機能は、単なるツールではなく、検証スクリプト、一連のポリシードキュメント、フォームに入力する方法の詳細な手順、使用制限に関する知識です。このバンドルをエージェントからエージェントにコピー貼り付けすると、同期が失われます。

スキル がこの問題を解決します。スキルは、命令、参照資料、およびオプションのスクリプトを 1 つのユニットにバンドルするポータブルパッケージであり、任意のエージェントがオンデマンドで検出して読み込むことができます。スキルはオープンな仕様に従い、エージェント、チーム、さらには製品間で再利用できます。

使用タイミング

次の場合にエージェントにスキルを追加します。

論理的に一緒に属する 関連する知識 (命令、参照ドキュメント、スクリプト) のクラスターがあります (たとえば、"経費報告書" や "コードレビューガイドライン")。
複数のエージェント には同じドメインの専門知識が必要であり、重複した手順ではなく、単一の信頼できるソースが必要です。
自己完結型パッケージとして、チーム、プロジェクト、または組織間でエージェント機能を 共有し、配布 したいと考えています。
コンテキストを効率的に管理する必要があります。スキルは段階的な開示を使用するため、エージェントは必要なときに必要な詳細のみを読み込みます。

考慮事項

考慮事項	詳細情報
再利用	スキルは自己完結型パッケージです。作成後、任意のエージェントが利用できます。コピー＆ペーストの必要も、コピー間のズレもありません。
コンテキスト効率	スキルは段階的な開示を使用します。エージェントには簡単な説明 (約 100 トークン) が事前に表示され、関連する場合にのみ完全な命令が読み込まれます。スキルが不要な場合、コンテキストウィンドウはコンパクトに保たれます。
抽象化コスト	スキルは、ツールの上に抽象化レイヤーを追加します。 1 つのスタンドアロン関数ツールの場合、スキルラッパーを追加するオーバーヘッドは不要です。
設計作業	スキルの境界について事前に考える必要があります。スキル内に属するものと外部に留るもの。境界が悪いと、スキルが広すぎる (コンテキストを無駄にする) か、狭すぎる (バンドルの利点を失う) 可能性があります。

スキルとツールの違い

ツールとスキルは補完的であり、競合しません。違いを理解することは、それぞれに到達するタイミングを決定するのに役立ちます。

ツールは単一の呼び出し可能なアクションであり、名前、説明、およびパラメータースキーマを持つ 1 つの関数です。モデルがツールが必要であると判断すると、構造化された呼び出しが生成され、Agent Framework によって実行され、結果がモデルに戻ります。ツールは、エージェントの動作のアトムです。

スキルはドメインの専門知識のパッケージです。次のものが含まれます。

手順 — 詳細なガイダンス、決定ルール、およびドメインへのアプローチ方法をエージェントに指示する例。
参考資料 — ポリシードキュメント、FAQ、テンプレート、およびエージェントがオンデマンドで参照できるその他の知識。
スクリプト — エージェントが実行して特定の操作を実行できる実行可能コード (たとえば、経費データをポリシールールに照らしてチェックする検証スクリプト)。

主な違いは、スコープの 1 つです。ツールは、エージェントに 1 つのアクションを実行する機能を提供します。スキルは、 エージェントにドメイン全体を処理するための知識とリソースを提供します。

	ツール	Skill
提供される内容	1 つの呼び出し可能なアクション	手順 + 参考資料 + 省略可能なスクリプト
エージェントが使用する方法	動作する必要があるときに呼び出す	関連するタスクが発生したときに読み込み、命令を読み取り、スクリプトを呼び出したり、リソースを参照したりする可能性があります
コンテキストコスト	ツールスキーマは常にプロンプトに表示されます	プロンプトには、スキル名と説明 (最大 100 個のトークン) のみが表示されます。フルコンテンツがオンデマンドで読み込まれる
移植性	登録するエージェントに関連付けられている	互換性のあるエージェントが検出できる自己完結型パッケージ
最適な用途	個々のアクション (データベースのクエリ、電子メールの送信)	ドメインの専門知識 (経費ポリシー、コードレビューガイドライン、オンボード手順)

ヒント

ツールは動詞 (検索、予約、検証) と考え、スキルは 専門知識 (旅行予約の知識、経費ポリシーの知識) と考えてください。エージェントは、ツールを使用して行動し、スキルを使用して行動する方法を知っています。

スキルのしくみ: 段階的開示

スキルはコンテキスト効率を高めるために設計されています。プロンプトにすべてを事前に挿入する代わりに、スキルは 3 段階のパターンを使用します。

┌──────────────────────────────────────────────────────────────────┐
│  Stage 1: Advertise                                              │
│  Agent sees skill names and descriptions (~100 tokens each)      │
│  in its system prompt at the start of every run.                 │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 2: Load                                                   │
│  Agent calls load_skill to get the full instructions             │
│  (< 5000 tokens recommended).                                   │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 3: Read resources                                         │
│  Agent calls read_skill_resource to fetch supplementary files    │
│  (FAQs, templates, reference docs) only when needed.            │
└──────────────────────────────────────────────────────────────────┘

このパターンは、10 個の登録スキルを持つエージェントが、50,000 ではなく、約 1,000 トークンのコンテキストオーバーヘッドを支払うことを意味します。エージェントは、現在のタスクが要求した場合にのみ、その知識を深めます。

さらに、スキルはツールインフラストラクチャの上に構築されます。 Agent Framework は、エージェントのシステムプロンプトで使用可能なスキルをアドバタイズした後、 load_skill と read_skill_resource をツール呼び出しとして公開し、エージェントが呼び出してコンテンツを段階的に読み込みます。

ヒント

スキルの構造、セットアップ、およびコード例の詳細については、エージェントスキルリファレンスを参照してください。

スキルを使用する場合と他のパターンを使用する場合の考え方

エージェントの能力が高まるにつれて、その動作を整理するいくつかの方法があります。スキルとツールの比較を次に示します。

パターン	最適な用途	例
個々のツール	共有コンテキストを必要としない 1 回限りのアクション	`get_weather`関数ツール
スキル	指示、参考文献、およびオプションのスクリプトを用いたドメインエキスパートの知識	ポリシードキュメント、検証スクリプト、およびステップバイステップのファイリング手順を含む "expense-report" スキル

よくある落とし穴

落とし穴	ガイダンス
過度に幅広いスキル	会計、税金、経費報告書、給与をカバーしようとする“財務全般に関する”と呼ばれるスキルは、指示が長すぎて焦点が定まっていません。スキルを 1 つのドメインに集中させます。
セキュリティレビューのスキップ	スキル命令はエージェントのコンテキストに挿入され、スクリプトはコードを実行します。サードパーティの依存関係などのスキルを扱います。デプロイする前に、スキルを確認してください。スキルリファレンスのセキュリティのベストプラクティスを参照してください。
プログレッシブ開示の無視	`SKILL.md`の長さが 2,000 行の場合、エージェントはスキルの読み込み時に高いコンテキストコストを支払います。手順を簡潔にし、詳細な参照資料を個別のリソースファイルに移動して、段階的な開示を最大限に活用します。

次のステップ

エージェントにツールとスキルが用意されたら、次の手順では、 ガード レール、ログ記録、コンテンツフィルタリングなどのクロスカット動作を追加します。この動作は、エージェントのコアロジックを変更することなく、すべての操作に適用されます。

ミドルウェアの追加

より深く進む:

エージェントスキル — セットアップ、コード例、スクリプト、およびセキュリティガイダンスに関する完全なリファレンス
エージェントスキル仕様 — スキルの背後にあるオープンスタンダード
ツールの概要 - すべてのツールの種類とプロバイダーのサポートマトリックス

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-10