BanditPolicy interface
余裕期間の条件に基づいて早期終了ポリシーを定義し、評価の頻度と遅延間隔を定義します。
- Extends
プロパティ
| policy |
ポリモーフィック識別子。このオブジェクトは、さまざまな型を指定します。 |
| slack |
最高のパフォーマンスを発揮する実行から許容される絶対距離。 |
| slack |
最もパフォーマンスの高い実行からの許容距離の比率。 |
継承されたプロパティ
| delay |
最初の評価を遅らせる間隔の数。 |
| evaluation |
ポリシー評価間の間隔 (実行回数)。 |
プロパティの詳細
policyType
ポリモーフィック識別子。このオブジェクトは、さまざまな型を指定します。
policyType: "Bandit"
プロパティ値
"Bandit"
slackAmount
最高のパフォーマンスを発揮する実行から許容される絶対距離。
slackAmount?: number
プロパティ値
number
slackFactor
最もパフォーマンスの高い実行からの許容距離の比率。
slackFactor?: number
プロパティ値
number
継承されたプロパティの詳細
delayEvaluation
最初の評価を遅らせる間隔の数。
delayEvaluation?: number
プロパティ値
number
evaluationInterval
ポリシー評価間の間隔 (実行回数)。
evaluationInterval?: number
プロパティ値
number