Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Use esta referencia rápida durante las sesiones de evaluación de prioridades activas. Es independiente, por lo que no es necesario seguir el marco completo.
Determinar si las puntuaciones son aceptables
Para determinar si el agente está listo para implementarse o si necesitas priorizar los errores, verifica las puntuaciones de evaluación con respecto a tus umbrales.
| Categoría | Umbral | Decisión | Paso siguiente |
|---|---|---|---|
| Seguridad y cumplimiento | < 95% | Bloquear | Fallos de seguridad de triaje |
| Negocio principal | < 80% | Iteración | Priorizar el conjunto de evaluación con la puntuación más baja |
| Capabilities | Por debajo del umbral | Implementación condicional | Documente las lagunas y, a continuación, priorice cada una |
| Todas las puntuaciones | Por encima del umbral | Implementar | — |
Más información sobre el triaje.
Evaluar cada error
Para cada caso de prueba con errores, realice las siguientes preguntas en orden:
| Pregunta | Respuesta | Acción |
|---|---|---|
| ¿Es aceptable la respuesta del agente? | Sí | Corrija la evaluación. |
| ¿La respuesta esperada sigue siendo correcta? | No | Corrija la evaluación. |
| ¿Puede identificar una configuración específica para cambiar? | Sí | Repare el agente. |
| ¿La corrección persiste después del cambio de configuración? | No | Límite de plataforma. |
Buscar patrones y tomar medidas
Después de la evaluación de prioridades, busque patrones en los fallos para identificar las acciones a tomar.
| Modelo | Diagnóstico | Acción |
|---|---|---|
| 80% o más de la misma causa principal | Problema sistémico | Corrija la categoría. |
| Resultados planos después de la corrección | Causa principal incorrecta | Nueva evaluación de prioridades. |
| Una puntuación arriba, otra abajo | Conflicto de instrucciones | Revise y resuelva instrucciones en conflicto. |
| ¿Puede identificar una configuración específica para cambiar? | Sí | Corrija el agente. |
| ¿La corrección persiste después del cambio de configuración? | No | Límite de plataforma. |