Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
La page précédente a montré comment les outils permettent aux agents d’agir : appel de fonctions, interrogation d’API, recherche sur le web. Mais à mesure que vous créez davantage d’agents, un modèle apparaît : le même cluster d’outils, d’instructions et de documents de référence continue de s’afficher ensemble. Une fonctionnalité « fichier d’un rapport de dépenses » n’est pas seulement un outil : il s’agit d’un script de validation, d’un ensemble de documents de stratégie, d’instructions pas à pas sur la façon de remplir le formulaire et de connaître les limites de dépense. Vous finissez par copier-coller ce paquet d’un agent à l’autre, et il perd sa synchronisation.
Les compétences résolvent ce problème. Une compétence est un package portable qui regroupe des instructions, des documents de référence et des scripts facultatifs dans une unité unique que n’importe quel agent peut découvrir et charger à la demande. Les compétences suivent une spécification ouverte afin qu’elles soient réutilisables entre les agents, les équipes et même les produits.
Cas d’utilisation :
Ajoutez des compétences à votre agent quand :
- Vous disposez d’un cluster de connaissances connexes ( instructions, documents de référence et scripts) qui appartiennent logiquement ensemble (par exemple, « notes de frais » ou « instructions de révision de code »).
- Plusieurs agents ont besoin de la même expertise de domaine et vous souhaitez une seule source de vérité plutôt que des instructions dupliquées.
- Vous souhaitez partager et distribuer des fonctionnalités d’agent entre les équipes, les projets ou les organisations en tant que packages autonomes.
- Vous devez gérer efficacement le contexte : les compétences utilisent la divulgation progressive afin que les agents chargent uniquement les détails dont ils ont besoin, quand ils en ont besoin.
Considérations
| Point à considérer | Détails |
|---|---|
| Réutilisabilité | Une compétence est un package autonome. Une fois créé, n’importe quel agent peut le récupérer : aucun copier-coller, aucune dérive entre les copies. |
| Efficacité du contexte | Les fonctionnalités utilisent la divulgation progressive : l’agent voit une brève description (~100 tokens) et charge des instructions complètes uniquement lorsque c'est pertinent. Cela permet à la fenêtre de contexte de rester allégée lorsque la compétence n'est pas nécessaire. |
| Coût d’abstraction | Les compétences ajoutent une couche d’abstraction au-dessus des outils. Pour un outil de fonction autonome unique, l’ajout d’une enveloppe de compétences n’est pas nécessaire. |
| Effort de conception | Vous devez réfléchir aux limites des compétences avant : ce qui appartient à l’intérieur de la compétence et ce qui reste à l’extérieur. Les limites médiocres entraînent des compétences trop larges (perte de contexte) ou trop étroites (perte de l’avantage de regroupement). |
Différences entre les compétences et les outils
Les outils et les compétences sont complémentaires, et ne sont pas concurrents. Comprendre la distinction vous aide à décider quand atteindre chacun d’eux.
Un outil est une action appelante unique : une fonction avec un nom, une description et un schéma de paramètre. Lorsque le modèle décide qu’un outil est nécessaire, il génère un appel structuré, Agent Framework l’exécute et le résultat revient au modèle. Les outils sont les atomes de comportement de l’agent.
Une compétence est un ensemble d’expertise dans le domaine. Il peut inclure :
- Instructions : instructions pas à pas, règles de décision et exemples qui indiquent à l’agent comment aborder un domaine.
- Documents de référence : documents de stratégie, FAQ, modèles et autres connaissances que l’agent peut consulter à la demande.
- Scripts : code exécutable que l’agent peut exécuter pour effectuer des opérations spécifiques (par exemple, un script de validation qui vérifie les données de frais par rapport aux règles de stratégie).
La principale différence est l’une des étendues : un outil donne à l’agent la possibilité d’effectuer une action ; une compétence donne à l’agent les connaissances et les ressources nécessaires pour gérer un domaine entier.
| Outil | Compétence | |
|---|---|---|
| Ce qu’il fournit | Une seule action pouvant être appelée | Instructions + documentation de référence + scripts facultatifs |
| Comment l'agent l'utilise | Appelle-le quand il doit agir | Charge-le lorsqu’il rencontre une tâche pertinente, lit des instructions et peut appeler des scripts ou consulter des ressources |
| Coût de contexte | Le schéma de l’outil est toujours dans l’invite | Seuls le nom et la description de la compétence (~100 jetons) se trouvent dans l’invite ; le contenu complet est chargé à la demande |
| Portabilité | Lié à l’agent qui l’inscrit | Package autonome que n’importe quel agent compatible peut découvrir |
| Idéal pour | Actions individuelles (interroger une base de données, envoyer un e-mail) | Expertise du domaine (stratégies de dépenses, instructions d’examen du code, procédures d’intégration) |
Conseil / Astuce
Considérez les outils comme des verbes (recherche, livre, validation) et des compétences en tant qu’expertise (connaissances sur les réservations de voyages, connaissances relatives aux dépenses). Un agent utilise des outils pour agir et des compétences pour savoir agir.
Fonctionnement des compétences : divulgation progressive
Les compétences sont conçues pour être efficaces dans le contexte. Plutôt que d’injecter tout dans l’invite à l’avance, les fonctionnalités utilisent un processus en trois étapes :
┌──────────────────────────────────────────────────────────────────┐
│ Stage 1: Advertise │
│ Agent sees skill names and descriptions (~100 tokens each) │
│ in its system prompt at the start of every run. │
└──────────────┬───────────────────────────────────────────────────┘
▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│ Stage 2: Load │
│ Agent calls load_skill to get the full instructions │
│ (< 5000 tokens recommended). │
└──────────────┬───────────────────────────────────────────────────┘
▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│ Stage 3: Read resources │
│ Agent calls read_skill_resource to fetch supplementary files │
│ (FAQs, templates, reference docs) only when needed. │
└──────────────────────────────────────────────────────────────────┘
Ce modèle signifie qu’un agent possédant 10 compétences inscrites paie environ 1 000 jetons de surcharge de contexte au lieu de 50 000. L’agent n’approfondit ses connaissances que lorsque la tâche actuelle l’exige.
En outre, les compétences sont basées sur l’infrastructure des outils. Agent Framework publie les compétences disponibles dans l'invite système de l'agent, puis expose load_skill et read_skill_resource en tant qu'outils que l'agent appelle pour charger progressivement le contenu.
Conseil / Astuce
Pour plus d’informations sur la structure des compétences, la configuration et les exemples de code, consultez la référence des compétences de l’agent .
Quand utiliser des compétences et d’autres modèles
À mesure que votre agent devient plus compétent, vous avez plusieurs façons d'organiser son comportement. Voici comment comparer les compétences aux outils :
| Modèle | Idéal pour | Exemple |
|---|---|---|
| Outils individuels | Actions ponctuelles qui n’ont pas besoin de contexte partagé | Outil de fonction get_weather |
| Compétences | Expertise du domaine avec des instructions, des références et des scripts facultatifs | Fonctionnalité « note de frais » avec des documents de politique, des scripts de validation et des instructions de dépôt étape par étape |
Pièges courants
| Piège | Conseils |
|---|---|
| Compétences trop étendues | Une compétence appelée « tout-sur-la-finance » qui tente de couvrir la comptabilité, les impôts, les rapports de dépenses et la paie aura des instructions trop longues et peu ciblées. Gardez les compétences axées sur un domaine. |
| Ignorer la révision de sécurité | Les instructions de compétence sont injectées dans le contexte de l’agent et les scripts exécutent du code. Traitez les compétences comme les dépendances tierces : examinez-les avant de les déployer. Consultez les meilleures pratiques de sécurité dans la référence des compétences. |
| Ignorer la divulgation progressive | Si votre SKILL.md compte 2 000 lignes, l'agent supporte un coût élevé en termes de contexte lorsqu'il charge la compétence. Conservez des instructions concises et déplacez des documents de référence détaillés pour séparer les fichiers de ressources afin de tirer pleinement parti de la divulgation progressive. |
Étapes suivantes
Une fois que votre agent dispose d’outils et de compétences, l’étape suivante consiste à ajouter des intergiciels tels que des mesures de protection, la journalisation et le filtrage de contenu, qui s’appliquent à chaque interaction sans modifier la logique principale de votre agent.
Aller plus loin :
- Compétences de l’agent : référence complète avec l’installation, les exemples de code, les scripts et les conseils de sécurité
- Spécification des compétences de l’agent : la norme ouverte derrière les compétences
- Vue d’ensemble des outils : matrice de prise en charge de tous les types d’outils et fournisseurs