OptimizationTaskResult interface
Resultado de evaluación por tarea para un solo candidato.
Propiedades
| composite_score | Puntuación compuesta que suma todas las puntuaciones de los evaluadores. |
| duration_seconds | Segundos de reloj de pared para la ejecución de agente de esta tarea. |
| error_message | Mensaje de error si la tarea falló durante la ejecución. |
| passed | Si la tarea cumplía el umbral de aprobado. |
| query | La consulta/entrada del usuario para la tarea. |
| rationales | Razonamiento por evaluador por nombre del evaluador. |
| response | Texto de respuesta de agente en bruto. |
| run_id | Identificador de la ejecución del agente que produjo este resultado. |
| scores | Las puntuaciones por evaluador se ajustan al nombre del evaluador. |
| task_name | Nombre de la tarea (del conjunto de datos). |
| tokens | Total de tokens consumidos durante la ejecución del agente para esta tarea. |
Detalles de las propiedades
composite_score
Puntuación compuesta que suma todas las puntuaciones de los evaluadores.
composite_score: number
Valor de propiedad
number
duration_seconds
Segundos de reloj de pared para la ejecución de agente de esta tarea.
duration_seconds: number
Valor de propiedad
number
error_message
Mensaje de error si la tarea falló durante la ejecución.
error_message?: string
Valor de propiedad
string
passed
Si la tarea cumplía el umbral de aprobado.
passed: boolean
Valor de propiedad
boolean
query
La consulta/entrada del usuario para la tarea.
query?: string
Valor de propiedad
string
rationales
Razonamiento por evaluador por nombre del evaluador.
rationales?: Record<string, string>
Valor de propiedad
Record<string, string>
response
Texto de respuesta de agente en bruto.
response?: string
Valor de propiedad
string
run_id
Identificador de la ejecución del agente que produjo este resultado.
run_id?: string
Valor de propiedad
string
scores
Las puntuaciones por evaluador se ajustan al nombre del evaluador.
scores: Record<string, number>
Valor de propiedad
Record<string, number>
task_name
Nombre de la tarea (del conjunto de datos).
task_name: string
Valor de propiedad
string
tokens
Total de tokens consumidos durante la ejecución del agente para esta tarea.
tokens: number
Valor de propiedad
number