RubricBasedEvaluatorDefinition interface
Rubrik tabanlı değerlendirici tanımı — oluşturan API tarafından üretilen boyutları depolar. Hem kalite hem de güvenlik değerlendiricileri için kullanılır.
- Extends
Özellikler
| dimensions | Boyutlar seti — LLM jüri üyesinin kullandığı puan planı. Kalite değerlendiriciler, 'general_quality' (always_applicable: doğru) adlı düzenlenemeyen bir kalıntı boyutunu içerir; Güvenlik değerlendiricileri arasında 'general_policy_compliance' yer alır. İkisi de aynı Boyut yapısını kullanır. |
| pass_threshold | Toplam rubrik puanı için geçiş/başarısız eşiği, yayımlanan |
| type | Ayrımcı olası değerler: kod, prompt, rubrik |
Devralınan Özellikler
| data_schema | Değerlendiricinin giriş verileri için JSON şeması (Taslak 2020-12). Bu tür, özellikler, gerekli gibi parametreleri içerir. |
| init_parameters | Değerlendiricinin giriş parametreleri için JSON şeması (Taslak 2020-12). Bu tür, özellikler, gerekli gibi parametreleri içerir. |
| metrics | Bu değerlendirici tarafından üretilen çıkış ölçümlerinin listesi |
Özellik Ayrıntıları
dimensions
Boyutlar seti — LLM jüri üyesinin kullandığı puan planı. Kalite değerlendiriciler, 'general_quality' (always_applicable: doğru) adlı düzenlenemeyen bir kalıntı boyutunu içerir; Güvenlik değerlendiricileri arasında 'general_policy_compliance' yer alır. İkisi de aynı Boyut yapısını kullanır.
dimensions: Dimension[]
Özellik Değeri
pass_threshold
Toplam rubrik puanı için geçiş/başarısız eşiği, yayımlanan score0.0-1.0 normalize edilmiş ölçekte . Çalışma süresi ağırlıklı ortalama bu değeri karşıladığında veya aştığında, sonuç olur pass. Varsayılan olarak 0.5 (ham 1-5 ağırlıklı ortalama 3.0'a eşdeğer). 'Herhangi bir boyut 1 puan aldı → başarısız oldu' kuralı bu eşik ne olursa olsun geçerlidir.
pass_threshold?: number
Özellik Değeri
number
type
Ayrımcı olası değerler: kod, prompt, rubrik
type: "rubric"
Özellik Değeri
"rubric"
Devralınan Özellik Detayları
data_schema
init_parameters
metrics
Bu değerlendirici tarafından üretilen çıkış ölçümlerinin listesi
metrics?: Record<string, EvaluatorMetric>
Özellik Değeri
Record<string, EvaluatorMetric>
EvaluatorDefinition.metrics'tendevralındı