OptimizationCandidate interface

Zagregowany wynik oceny dla konfiguracji pojedynczego kandydata na agenta we wszystkich zadaniach.

Właściwości

avg_score

Średni wynik złożony ze wszystkich zadań.

avg_tokens

Średnie zużycie tokenów we wszystkich zadaniach.

candidate_id

Identyfikator kandydata przypisany serwerowi. Użycie z podpunktami końcowymi GET /candidates/{id}.

config

Konfiguracja agenta, która stworzyła tego kandydata.

eval_id

Identyfikator oceny odlewni używany do oceny tego kandydata.

eval_run_id

Identyfikator wyniku oceny odlewni dla wyniku tego kandydata.

is_pareto_optimal

Niezależnie od tego, czy kandydat znajduje się na granicy Pareto (wynik kontra koszt).

mutations

Co zostało zmutowane względem punktu wyjścia (np. {system_prompt: 'nowy prompt'}).

name

Imię wyświetlające kandydata (np. 'baseline', 'instruction-v2').

pass_rate

Ułamek zadań, które spełniły próg zaliczenia.

promotion

Metadane promocyjne. Nieważne, jeśli kandydat nie został awansowany.

task_scores

Indywidualne oceny na poziomie zadania.

Szczegóły właściwości

avg_score

Średni wynik złożony ze wszystkich zadań.

avg_score: number

Wartość właściwości

number

avg_tokens

Średnie zużycie tokenów we wszystkich zadaniach.

avg_tokens: number

Wartość właściwości

number

candidate_id

Identyfikator kandydata przypisany serwerowi. Użycie z podpunktami końcowymi GET /candidates/{id}.

candidate_id?: string

Wartość właściwości

string

config

Konfiguracja agenta, która stworzyła tego kandydata.

config: OptimizationAgentDefinition

Wartość właściwości

eval_id

Identyfikator oceny odlewni używany do oceny tego kandydata.

eval_id?: string

Wartość właściwości

string

eval_run_id

Identyfikator wyniku oceny odlewni dla wyniku tego kandydata.

eval_run_id?: string

Wartość właściwości

string

is_pareto_optimal

Niezależnie od tego, czy kandydat znajduje się na granicy Pareto (wynik kontra koszt).

is_pareto_optimal: boolean

Wartość właściwości

boolean

mutations

Co zostało zmutowane względem punktu wyjścia (np. {system_prompt: 'nowy prompt'}).

mutations: Record<string, any>

Wartość właściwości

Record<string, any>

name

Imię wyświetlające kandydata (np. 'baseline', 'instruction-v2').

name: string

Wartość właściwości

string

pass_rate

Ułamek zadań, które spełniły próg zaliczenia.

pass_rate: number

Wartość właściwości

number

promotion

Metadane promocyjne. Nieważne, jeśli kandydat nie został awansowany.

promotion?: PromotionInfo

Wartość właściwości

task_scores

Indywidualne oceny na poziomie zadania.

task_scores: OptimizationTaskResult[]

Wartość właściwości