OptimizationTaskResult interface

Resultado de evaluación por tarea para un solo candidato.

Propiedades

composite_score

Puntuación compuesta que suma todas las puntuaciones de los evaluadores.

duration_seconds

Segundos de reloj de pared para la ejecución de agente de esta tarea.

error_message

Mensaje de error si la tarea falló durante la ejecución.

passed

Si la tarea cumplía el umbral de aprobado.

query

La consulta/entrada del usuario para la tarea.

rationales

Razonamiento por evaluador por nombre del evaluador.

response

Texto de respuesta de agente en bruto.

run_id

Identificador de la ejecución del agente que produjo este resultado.

scores

Las puntuaciones por evaluador se ajustan al nombre del evaluador.

task_name

Nombre de la tarea (del conjunto de datos).

tokens

Total de tokens consumidos durante la ejecución del agente para esta tarea.

Detalles de las propiedades

composite_score

Puntuación compuesta que suma todas las puntuaciones de los evaluadores.

composite_score: number

Valor de propiedad

number

duration_seconds

Segundos de reloj de pared para la ejecución de agente de esta tarea.

duration_seconds: number

Valor de propiedad

number

error_message

Mensaje de error si la tarea falló durante la ejecución.

error_message?: string

Valor de propiedad

string

passed

Si la tarea cumplía el umbral de aprobado.

passed: boolean

Valor de propiedad

boolean

query

La consulta/entrada del usuario para la tarea.

query?: string

Valor de propiedad

string

rationales

Razonamiento por evaluador por nombre del evaluador.

rationales?: Record<string, string>

Valor de propiedad

Record<string, string>

response

Texto de respuesta de agente en bruto.

response?: string

Valor de propiedad

string

run_id

Identificador de la ejecución del agente que produjo este resultado.

run_id?: string

Valor de propiedad

string

scores

Las puntuaciones por evaluador se ajustan al nombre del evaluador.

scores: Record<string, number>

Valor de propiedad

Record<string, number>

task_name

Nombre de la tarea (del conjunto de datos).

task_name: string

Valor de propiedad

string

tokens

Total de tokens consumidos durante la ejecución del agente para esta tarea.

tokens: number

Valor de propiedad

number