Agregar aptitudes

En la página anterior se mostró cómo las herramientas permiten a los agentes actuar: llamar a funciones, consultar API y buscar en la web. Pero a medida que crea más agentes, surge un patrón: el mismo clúster de herramientas, instrucciones y material de referencia sigue apareciendo juntos. Una funcionalidad de "archivo de un informe de gastos" no es solo una herramienta: es un script de validación, un conjunto de documentos de directiva, instrucciones paso a paso sobre cómo rellenar el formulario y conocimientos sobre los límites de gasto. Terminas copiando y pegando este paquete de un agente a otro y se desincroniza.

Las aptitudes resuelven este problema. Una aptitud es un paquete portátil que agrupa instrucciones, material de referencia y scripts opcionales en una sola unidad que cualquier agente puede detectar y cargar a petición. Las aptitudes siguen una especificación abierta para que sean reutilizables entre agentes, equipos e incluso productos.

Cuándo usar esto

Agregue habilidades al agente cuando:

Tienes un clúster de conocimientos relacionados (instrucciones, documentos de referencia y scripts) que pertenecen lógicamente juntos, (por ejemplo, "informes de gastos" o "directrices de revisión de código").
Varios agentes necesitan la misma experiencia en el dominio y quiere una única fuente de verdad en lugar de instrucciones duplicadas.
Quiere compartir y distribuir funcionalidades de agente entre equipos, proyectos u organizaciones como paquetes independientes.
Debe administrar el contexto de forma eficaz : las aptitudes usan la divulgación progresiva, por lo que los agentes solo cargan los detalles que necesitan, cuando lo necesitan.

Consideraciones

Consideración	Detalles
Reusabilidad	Una aptitud es un paquete independiente. Una vez creado, cualquier agente puede hacerlo suyo, sin necesidad de copiar y pegar, sin desfase entre copias.
Eficiencia del contexto	Divulgación progresiva de habilidades: el agente ve una breve descripción (~100 tokens) inicial y carga instrucciones completas solo cuando es pertinente. Esto mantiene la ventana de contexto ligera cuando no se requiere la habilidad.
Costo de abstracción	Las aptitudes agregan una capa de abstracción sobre las herramientas. Para una sola herramienta de función independiente, agregar un contenedor de aptitudes es una sobrecarga innecesaria.
Esfuerzo de diseño	Debe pensar en los límites de habilidades por adelantado: qué pertenece dentro de la habilidad y qué permanece fuera. Los límites deficientes conducen a habilidades demasiado amplias (desperdiciando el contexto) o demasiado estrechas (perdiendo el beneficio de agrupamiento).

Diferencias entre las aptitudes y las herramientas

Las herramientas y las aptitudes son complementarias, no compiten. Comprender la distinción le ayuda a decidir cuál utilizar en cada caso.

Una herramienta es una sola acción invocable: una función con un nombre, una descripción y un esquema de parámetros. Cuando el modelo decide que se necesita una herramienta, genera una llamada estructurada, Agent Framework la ejecuta y el resultado vuelve al modelo. Las herramientas son los átomos del comportamiento del agente.

Una aptitud es un paquete de conocimientos sobre dominios. Puede incluir:

Instrucciones: instrucciones paso a paso, reglas de decisión y ejemplos que indican al agente cómo abordar un dominio.
Material de referencia: documentos de directiva, preguntas frecuentes, plantillas y otros conocimientos que el agente puede consultar a petición.
Scripts : código ejecutable que el agente puede ejecutar para realizar operaciones específicas (por ejemplo, un script de validación que comprueba los datos de gastos con las reglas de directiva).

La diferencia clave es uno de los ámbitos: una herramienta proporciona al agente la capacidad de realizar una acción; una aptitud proporciona al agente el conocimiento y los recursos para controlar un dominio completo.

	Herramienta	Habilidad
Qué proporciona	Una única acción invocable	Instrucciones + material de referencia + scripts opcionales
Cómo lo usa el agente	Lo llama cuando necesita actuar	Lo carga cuando encuentra una tarea pertinente, lee instrucciones y puede llamar a scripts o consultar recursos.
Costo del contexto	El esquema de la herramienta siempre está en la inducción	Solo el nombre y la descripción de la habilidad (~100 tokens) están en el mensaje; el contenido completo se carga bajo demanda.
Portabilidad	Vinculado al agente que lo registra	Paquete independiente que cualquier agente compatible puede detectar
Más adecuado para	Acciones individuales (consultar una base de datos, enviar un correo electrónico)	Experiencia en el dominio (directivas de gastos, directrices de revisión de código, procedimientos de incorporación)

Sugerencia

Piense en herramientas como verbos (buscar, reservar, validar) y habilidades como pericia (conocimiento de reserva de viajes, conocimiento de la política de gastos). Un agente usa herramientas para actuar y aptitudes para saber cómo actuar.

Cómo funcionan las aptitudes: divulgación progresiva

Las aptitudes están diseñadas para ser eficaces en el contexto. En lugar de insertar todo en el aviso inicial, las aptitudes usan un patrón de tres fases:

┌──────────────────────────────────────────────────────────────────┐
│  Stage 1: Advertise                                              │
│  Agent sees skill names and descriptions (~100 tokens each)      │
│  in its system prompt at the start of every run.                 │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (task matches a skill's domain)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 2: Load                                                   │
│  Agent calls load_skill to get the full instructions             │
│  (< 5000 tokens recommended).                                   │
└──────────────┬───────────────────────────────────────────────────┘
               ▼ (agent needs more detail)
┌──────────────────────────────────────────────────────────────────┐
│  Stage 3: Read resources                                         │
│  Agent calls read_skill_resource to fetch supplementary files    │
│  (FAQs, templates, reference docs) only when needed.            │
└──────────────────────────────────────────────────────────────────┘

Este patrón significa que un agente con 10 habilidades registradas paga aproximadamente 1.000 tokens como sobrecarga de contexto, no 50.000. El agente solo profundiza su conocimiento cuando la tarea actual lo exige.

Además, las aptitudes se basan en la infraestructura de herramientas. Agent Framework anuncia las aptitudes disponibles en el símbolo del sistema del agente y, a continuación, expone load_skill y read_skill_resource como llamadas de herramienta que el agente invoca para cargar el contenido progresivamente.

Sugerencia

Para obtener los detalles completos sobre la estructura de aptitudes, la configuración y los ejemplos de código, consulte la referencia de aptitudes del agente .

Cuándo usar aptitudes frente a otros patrones

A medida que el agente crece más capaz, tiene varias maneras de organizar su comportamiento. Este es el modo en que las aptitudes se comparan con las herramientas:

Modelo	Más adecuado para	Ejemplo
Herramientas individuales	Acciones únicas que no necesitan contexto compartido	Herramienta de función `get_weather`
Habilidades	Experiencia en el dominio con instrucciones, referencias y scripts opcionales	Una función de "informe de gastos" con documentación de políticas, scripts de validación e instrucciones detalladas para la presentación paso a paso.

Dificultades habituales

Problema	Instrucciones
Aptitudes demasiado amplias	Una aptitud denominada "todo sobre finanzas" que intenta cubrir contabilidad, impuestos, informes de gastos y nóminas tendrá instrucciones demasiado largas y sin centrar. Mantenga las aptitudes centradas en un dominio.
Omitir la revisión de seguridad	Las instrucciones de aptitud se insertan en el contexto del agente y los scripts ejecutan código. Tratar aptitudes como dependencias de terceros: reviselas antes de implementarlas. Consulte los procedimientos recomendados de seguridad en la referencia de aptitudes.
Omitir la divulgación progresiva	Si su `SKILL.md` es de 2,000 líneas de longitud, el agente paga un elevado costo de contexto cuando carga la habilidad. Mantenga las instrucciones concisas y mueva material de referencia detallado a archivos de recursos independientes para aprovechar al máximo la divulgación progresiva.

Pasos siguientes

Una vez que el agente tenga herramientas y aptitudes, el siguiente paso es agregar middleware : comportamientos transversales, como límites de protección, registro y filtrado de contenido que se aplican a cada interacción sin modificar la lógica principal del agente.

Adición de middleware

Vaya más profundamente:

Aptitudes del agente : referencia completa con la configuración, ejemplos de código, scripts e instrucciones de seguridad
Especificación de aptitudes del agente : el estándar abierto detrás de las aptitudes
Información general sobre las herramientas : todos los tipos de herramientas y la matriz de compatibilidad de proveedores

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-10