Aggiunta di competenze

Nella pagina precedente è stato illustrato come gli strumenti consentono agli agenti di agire, chiamando funzioni, eseguendo query sulle API, eseguendo ricerche nel Web. Tuttavia, man mano che si creano più agenti, emerge un modello: lo stesso cluster di strumenti, istruzioni e materiale di riferimento continua a essere visualizzato insieme. Una funzionalità di "file a expense report" non è solo uno strumento, ovvero uno script di convalida, un set di documenti dei criteri, istruzioni dettagliate su come compilare il modulo e conoscere i limiti di spesa. Si finisce per copiare e incollare questo bundle da un agente all'altro e si perde la sincronizzazione.

Le competenze risolveranno questo problema. Una competenza è un pacchetto portatile che aggrega istruzioni, materiale di riferimento e script facoltativi in una singola unità che qualsiasi agente può individuare e caricare su richiesta. Le competenze seguono una specifica aperta in modo che siano riutilizzabili tra agenti, team e persino prodotti.

Quando usare questa opzione

Aggiungere competenze all'agente quando:

  • Si dispone di un cluster di informazioni correlate , istruzioni, documenti di riferimento e script, che appartengono logicamente (ad esempio, "expense reporting" o "linee guida per la revisione del codice").
  • Più agenti necessitano della stessa esperienza di dominio e si vuole una singola fonte di verità anziché istruzioni duplicate.
  • Si vogliono condividere e distribuire le funzionalità degli agenti tra team, progetti o organizzazioni come pacchetti autonomi.
  • È necessario gestire il contesto in modo efficiente : le competenze usano la divulgazione progressiva in modo che gli agenti carichino solo i dettagli necessari, quando ne hanno bisogno.

Considerazioni

Considerazione dettagli
riutilizzabilità Una competenza è un pacchetto autonomo. Una volta creato, qualsiasi agente può gestirlo senza problemi: senza necessità di copiare e incollare, nessuna discrepanza tra le copie.
Efficienza del contesto Le capacità utilizzano la divulgazione graduale: l'agente visualizza una breve descrizione (~100 token) iniziale e carica istruzioni complete solo quando necessario. In questo modo la finestra di contesto è congruente quando la funzionalità non è necessaria.
Costo astrazione Le competenze aggiungono un livello di astrazione sopra gli strumenti. Per un singolo strumento di funzione autonomo, l'aggiunta di un wrapper di abilità rappresenta un sovraccarico superfluo.
Attività di progettazione È necessario considerare i limiti delle competenze in anticipo: ciò che appartiene all'interno della competenza e ciò che rimane all'esterno. Confini poco chiari portano a competenze troppo ampie (con spreco di contesto) o troppo strette (perdita del vantaggio del raggruppamento).

Differenze tra le competenze e gli strumenti

Gli strumenti e le competenze sono complementari, non concorrenti. La comprensione della distinzione consente di decidere quando raggiungere ognuno di essi.

Uno strumento è una singola azione chiamabile, ovvero una funzione con un nome, una descrizione e uno schema dei parametri. Quando il modello decide che è necessario uno strumento, genera una chiamata strutturata, Agent Framework lo esegue e il risultato torna al modello. Gli strumenti sono gli atomi del comportamento dell'agente.

Una competenza è un pacchetto di competenze di dominio. Può includere:

  • Istruzioni : indicazioni dettagliate, regole decisionali ed esempi che indicano all'agente come avvicinarsi a un dominio.
  • Materiale di riferimento : documenti dei criteri, domande frequenti, modelli e altre informazioni che l'agente può consultare su richiesta.
  • Script : codice eseguibile che l'agente può eseguire per eseguire operazioni specifiche, ad esempio uno script di convalida che controlla i dati delle spese rispetto alle regole dei criteri.

La differenza principale è uno degli ambiti: uno strumento offre all'agente la possibilità di eseguire un'azione; una competenza fornisce all'agente le informazioni e le risorse per gestire un intero dominio.

Strumento Competenza
Elementi forniti Una singola azione chiamabile Istruzioni + materiale di riferimento + script facoltativi
Come l'agente lo utilizza Lo invoca quando deve intervenire Lo carica quando rileva un'attività pertinente, legge le istruzioni e può chiamare script o consultare le risorse
Costo del contesto Lo schema dello strumento è sempre nel prompt Solo il nome e la descrizione della competenza (~100 token) sono nel prompt; il contenuto completo viene caricato su richiesta
Portabilità Legato all'agente che lo registra Pacchetto autonomo che qualsiasi agente compatibile può individuare
Ideale per Singole azioni (eseguire query su un database, inviare un messaggio di posta elettronica) Competenza del dominio (criteri di spesa, linee guida per la revisione del codice, procedure di onboarding)

Suggerimento

Considera gli strumenti come verbi (ricerca, libro, convalida) e competenze come competenze (conoscenza della prenotazione di viaggi, conoscenza dei criteri di spesa). Un agente usa strumenti per agire e competenze per sapere come agire.

Come funzionano le competenze: divulgazione progressiva

Le competenze sono progettate per essere efficienti in contesti diversi. Invece di inserire tutto nella richiesta iniziale, le funzioni usano un modello a tre fasi.

┌──────────────────────────────────────────────────────────────────┐
│  Stage 1: Advertise                                              │
│  Agent sees skill names and descriptions (~100 tokens each)      │
│  in its system prompt at the start of every run.                 │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 2: Load                                                   │
│  Agent calls load_skill to get the full instructions             │
│  (< 5000 tokens recommended).                                   │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 3: Read resources                                         │
│  Agent calls read_skill_resource to fetch supplementary files    │
│  (FAQs, templates, reference docs) only when needed.            │
└──────────────────────────────────────────────────────────────────┘

Questo modello significa che un agente con 10 competenze registrate paga circa 1.000 token di overhead del contesto, non 50.000. L'agente approfondisce le proprie conoscenze solo quando l'attività corrente lo richiede.

Inoltre, le competenze sono basate sull'infrastruttura degli strumenti. Agent Framework annuncia le competenze disponibili nel prompt di sistema dell'agente, quindi espone load_skill e read_skill_resource come chiamate di strumenti che l'agente richiama per caricare progressivamente il contenuto.

Suggerimento

Per informazioni dettagliate sulla struttura delle competenze, la configurazione e gli esempi di codice, vedere le informazioni di riferimento sulle competenze dell'agente .

Quando usare le competenze e altri modelli

Man mano che l'agente aumenta le capacità, è possibile organizzarne il comportamento in diversi modi. Ecco come confrontare le competenze con gli strumenti:

Modello Ideale per Esempio
Singoli strumenti Azioni una tantum che non necessitano di contesto condiviso Uno strumento funzionale get_weather
Abilità Esperienza del dominio con istruzioni, riferimenti e script facoltativi Un'abilità per i "rapporti spese" con documentazione delle politiche, script di convalida e istruzioni dettagliate per la presentazione

Inconvenienti comuni

Trappola Linee guida
Competenze eccessivamente ampie Una competenza denominata "tutto sul campo finanziario" che cerca di coprire contabilità, imposte, note spese e retribuzioni avrà istruzioni troppo lunghe e non incentrate. Mantenere le competenze incentrate su un dominio.
Ignorare la verifica della sicurezza Le istruzioni per le competenze vengono inserite nel contesto dell'agente e gli script eseguono codice. Considerare le competenze come le dipendenze di terze parti, esaminarle prima della distribuzione. Vedere le procedure consigliate per la sicurezza nelle informazioni di riferimento sulle competenze.
Ignorare la divulgazione progressiva Se il tuo SKILL.md è di 2.000 righe, l'agente paga un costo di contesto elevato quando carica lo skill. Mantenere le istruzioni concise e spostare materiale di riferimento dettagliato per separare i file di risorse per sfruttare appieno la divulgazione progressiva.

Passaggi successivi

Una volta che l'agente ha strumenti e competenze, il passaggio successivo consiste nell'aggiungere middleware , ovvero comportamenti trasversali come guardrail, registrazione e filtro del contenuto che si applicano a ogni interazione senza modificare la logica di base dell'agente.

Approfondimento: