BanditPolicy interface
Определяет политику раннего завершения на основе критериев slack, частоты и интервала задержки для оценки
- Extends
Свойства
| policy |
Полиморфная дискриминация, указывающая различные типы этого объекта, может быть |
| slack |
Абсолютное расстояние, допустимое от оптимального выполнения. |
| slack |
Соотношение допустимого расстояния от оптимального выполнения. |
Унаследованные свойства
| delay |
Количество интервалов, с помощью которых необходимо отложить первую оценку. |
| evaluation |
Интервал (количество запусков) между оценками политики. |
Сведения о свойстве
policyType
Полиморфная дискриминация, указывающая различные типы этого объекта, может быть
policyType: "Bandit"
Значение свойства
"Bandit"
slackAmount
Абсолютное расстояние, допустимое от оптимального выполнения.
slackAmount?: number
Значение свойства
number
slackFactor
Соотношение допустимого расстояния от оптимального выполнения.
slackFactor?: number
Значение свойства
number
Сведения об унаследованном свойстве
delayEvaluation
Количество интервалов, с помощью которых необходимо отложить первую оценку.
delayEvaluation?: number
Значение свойства
number
наследуется отEarlyTerminationPolicy.delayEvaluation
evaluationInterval
Интервал (количество запусков) между оценками политики.
evaluationInterval?: number
Значение свойства
number
наследуется отEarlyTerminationPolicy.evaluationInterval