次の方法で共有


スキルの追加

前のページでは、エージェントが機能するツール (関数の呼び出し、API のクエリ、Web の検索) について説明しました。 しかし、より多くのエージェントを構築すると、ツール、命令、および参照資料の同じクラスターが一緒に表示され続けるというパターンが現れます。 "経費明細書の提出" 機能は、単なるツールではなく、検証スクリプト、一連のポリシー ドキュメント、フォームに入力する方法の詳細な手順、使用制限に関する知識です。 このバンドルをエージェントからエージェントにコピー貼り付けすると、同期が失われます。

スキル がこの問題を解決します。 スキルは、命令、参照資料、およびオプションのスクリプトを 1 つのユニットにバンドルするポータブル パッケージであり、任意のエージェントがオンデマンドで検出して読み込むことができます。 スキルは オープンな仕様 に従い、エージェント、チーム、さらには製品間で再利用できます。

使用タイミング

次の場合にエージェントにスキルを追加します。

  • 論理的に一緒に属する 関連する知識 (命令、参照ドキュメント、スクリプト) のクラスターがあります (たとえば、"経費報告書" や "コード レビュー ガイドライン")。
  • 複数のエージェント には同じドメインの専門知識が必要であり、重複した手順ではなく、単一の信頼できるソースが必要です。
  • 自己完結型パッケージとして、チーム、プロジェクト、または組織間でエージェント機能を 共有し、配布 したいと考えています。
  • コンテキストを効率的に管理する必要があります。スキルは段階的な開示を使用するため、エージェントは必要なときに必要な詳細のみを読み込みます。

考慮事項

考慮事項 詳細情報
再 利用 スキルは自己完結型パッケージです。 作成後、任意のエージェントが利用できます。コピー&ペーストの必要も、コピー間のズレもありません。
コンテキスト効率 スキルは段階的な開示を使用します。エージェントには簡単な説明 (約 100 トークン) が事前に表示され、関連する場合にのみ完全な命令が読み込まれます。 スキルが不要な場合、コンテキスト ウィンドウはコンパクトに保たれます。
抽象化コスト スキルは、ツールの上に抽象化レイヤーを追加します。 1 つのスタンドアロン関数ツールの場合、スキル ラッパーを追加するオーバーヘッドは不要です。
設計作業 スキルの境界について事前に考える必要があります。スキル内に属するものと外部に留るもの。 境界が悪いと、スキルが広すぎる (コンテキストを無駄にする) か、狭すぎる (バンドルの利点を失う) 可能性があります。

スキルとツールの違い

ツールとスキルは補完的であり、競合しません。 違いを理解することは、それぞれに到達するタイミングを決定するのに役立ちます。

ツールは単一の呼び出し可能なアクションであり、名前、説明、およびパラメーター スキーマを持つ 1 つの関数です。 モデルがツールが必要であると判断すると、構造化された呼び出しが生成され、Agent Framework によって実行され、結果がモデルに戻ります。 ツールは、エージェントの動作のアトムです。

スキルはドメインの専門知識のパッケージです。 次のものが含まれます。

  • 手順 — 詳細なガイダンス、決定ルール、およびドメインへのアプローチ 方法 をエージェントに指示する例。
  • 参考資料 — ポリシー ドキュメント、FAQ、テンプレート、およびエージェントがオンデマンドで参照できるその他の知識。
  • スクリプト — エージェントが実行して特定の操作を実行できる実行可能コード (たとえば、経費データをポリシー ルールに照らしてチェックする検証スクリプト)。

主な違いは、スコープの 1 つです。ツールは、エージェントに 1 つのアクションを実行する機能を提供します。スキルは、 エージェントにドメイン全体を処理するための知識とリソースを提供します。

ツール Skill
提供される内容 1 つの呼び出し可能なアクション 手順 + 参考資料 + 省略可能なスクリプト
エージェントが使用する方法 動作する必要があるときに呼び出す 関連するタスクが発生したときに読み込み、命令を読み取り、スクリプトを呼び出したり、リソースを参照したりする可能性があります
コンテキスト コスト ツール スキーマは常にプロンプトに表示されます プロンプトには、スキル名と説明 (最大 100 個のトークン) のみが表示されます。フル コンテンツがオンデマンドで読み込まれる
移植性 登録するエージェントに関連付けられている 互換性のあるエージェントが検出できる自己完結型パッケージ
最適な用途 個々のアクション (データベースのクエリ、電子メールの送信) ドメインの専門知識 (経費ポリシー、コード レビュー ガイドライン、オンボード手順)

ヒント

ツールは 動詞 (検索、予約、検証) と考え、スキルは 専門知識 (旅行予約の知識、経費ポリシーの知識) と考えてください。 エージェントは、ツールを使用して行動し、スキルを使用して行動する方法を知っています。

スキルのしくみ: 段階的開示

スキルはコンテキスト効率を高めるために設計されています。 プロンプトにすべてを事前に挿入する代わりに、スキルは 3 段階のパターンを使用します。

┌──────────────────────────────────────────────────────────────────┐
│  Stage 1: Advertise                                              │
│  Agent sees skill names and descriptions (~100 tokens each)      │
│  in its system prompt at the start of every run.                 │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 2: Load                                                   │
│  Agent calls load_skill to get the full instructions             │
│  (< 5000 tokens recommended).                                   │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 3: Read resources                                         │
│  Agent calls read_skill_resource to fetch supplementary files    │
│  (FAQs, templates, reference docs) only when needed.            │
└──────────────────────────────────────────────────────────────────┘

このパターンは、10 個の登録スキルを持つエージェントが、50,000 ではなく、約 1,000 トークンのコンテキスト オーバーヘッドを支払うことを意味します。 エージェントは、現在のタスクが要求した場合にのみ、その知識を深めます。

さらに、スキルはツール インフラストラクチャの上に構築されます。 Agent Framework は、エージェントのシステム プロンプトで使用可能なスキルをアドバタイズした後、 load_skillread_skill_resource をツール呼び出しとして公開し、エージェントが呼び出してコンテンツを段階的に読み込みます。

ヒント

スキルの構造、セットアップ、およびコード例の詳細については、 エージェントスキル リファレンスを参照してください。

スキルを使用する場合と他のパターンを使用する場合の考え方

エージェントの能力が高まるにつれて、その動作を整理するいくつかの方法があります。 スキルとツールの比較を次に示します。

パターン 最適な用途
個々のツール 共有コンテキストを必要としない 1 回限りのアクション get_weather関数ツール
スキル 指示、参考文献、およびオプションのスクリプトを用いたドメインエキスパートの知識 ポリシー ドキュメント、検証スクリプト、およびステップ バイ ステップのファイリング手順を含む "expense-report" スキル

よくある落とし穴

落とし穴 ガイダンス
過度に幅広いスキル 会計、税金、経費報告書、給与をカバーしようとする“財務全般に関する”と呼ばれるスキルは、指示が長すぎて焦点が定まっていません。 スキルを 1 つのドメインに集中させます。
セキュリティ レビューのスキップ スキル命令はエージェントのコンテキストに挿入され、スクリプトはコードを実行します。 サード パーティの依存関係などのスキルを扱います。デプロイする前に、スキルを確認してください。 スキル リファレンスの セキュリティのベスト プラクティス を参照してください。
プログレッシブ 開示の無視 SKILL.mdの長さが 2,000 行の場合、エージェントはスキルの読み込み時に高いコンテキスト コストを支払います。 手順を簡潔にし、詳細な参照資料を個別のリソース ファイルに移動して、段階的な開示を最大限に活用します。

次のステップ

エージェントにツールとスキルが用意されたら、次の手順では、 ガード レール、ログ記録、コンテンツ フィルタリングなどのクロスカット動作を追加します。この動作は、エージェントのコア ロジックを変更することなく、すべての操作に適用されます。

より深く進む: