PolicyResultSummaryOutput interface
プロパティ
| aggregate |
集計の時間枠。 たとえば、PT5M (5 分) です。 時刻形式の詳細については、http://en.wikipedia.org/wiki/ISO_8601#Durations を参照してください。 |
| average |
平均報酬。 |
| confidence |
ポリシー評価のガウス信頼区間。 |
| ips |
IPS 推定器の分母。 |
| ips |
IPS 推定器の分子。 |
| non |
ポリシー評価の 0 以外の値の確率。 |
| snips |
SNIPS 推定器の分母。 |
| sum |
ポリシー評価結果の 2 乗の合計。 |
| time |
集計のタイムスタンプ。 |
プロパティの詳細
aggregateTimeWindow
集計の時間枠。 たとえば、PT5M (5 分) です。 時刻形式の詳細については、http://en.wikipedia.org/wiki/ISO_8601#Durations を参照してください。
aggregateTimeWindow: string
プロパティ値
string
averageReward
平均報酬。
averageReward: number
プロパティ値
number
confidenceInterval
ポリシー評価のガウス信頼区間。
confidenceInterval?: number
プロパティ値
number
ipsEstimatorDenominator
IPS 推定器の分母。
ipsEstimatorDenominator: number
プロパティ値
number
ipsEstimatorNumerator
IPS 推定器の分子。
ipsEstimatorNumerator: number
プロパティ値
number
nonZeroProbability
ポリシー評価の 0 以外の値の確率。
nonZeroProbability?: number
プロパティ値
number
snipsEstimatorDenominator
SNIPS 推定器の分母。
snipsEstimatorDenominator: number
プロパティ値
number
sumOfSquares
ポリシー評価結果の 2 乗の合計。
sumOfSquares?: number
プロパティ値
number
timeStamp
集計のタイムスタンプ。
timeStamp: string
プロパティ値
string