次の方法で共有


PolicyResultTotalSummaryOutput interface

Extends

継承されたプロパティ

aggregateTimeWindow

集計の時間枠。 たとえば、PT5M (5 分) です。 時刻形式の詳細については、http://en.wikipedia.org/wiki/ISO_8601#Durations を参照してください。

averageReward

平均報酬。

confidenceInterval

ポリシー評価のガウス信頼区間。

ipsEstimatorDenominator

IPS 推定器の分母。

ipsEstimatorNumerator

IPS 推定器の分子。

nonZeroProbability

ポリシー評価の 0 以外の値の確率。

snipsEstimatorDenominator

SNIPS 推定器の分母。

sumOfSquares

ポリシー評価結果の 2 乗の合計。

timeStamp

集計のタイムスタンプ。

継承されたプロパティの詳細

aggregateTimeWindow

集計の時間枠。 たとえば、PT5M (5 分) です。 時刻形式の詳細については、http://en.wikipedia.org/wiki/ISO_8601#Durations を参照してください。

aggregateTimeWindow: string

プロパティ値

string

承元PolicyResultSummaryOutput.aggregateTimeWindow

averageReward

平均報酬。

averageReward: number

プロパティ値

number

承元PolicyResultSummaryOutput.averageReward

confidenceInterval

ポリシー評価のガウス信頼区間。

confidenceInterval?: number

プロパティ値

number

承元PolicyResultSummaryOutput.confidenceInterval

ipsEstimatorDenominator

IPS 推定器の分母。

ipsEstimatorDenominator: number

プロパティ値

number

承元PolicyResultSummaryOutput.ipsEstimatorDenominator

ipsEstimatorNumerator

IPS 推定器の分子。

ipsEstimatorNumerator: number

プロパティ値

number

承元PolicyResultSummaryOutput.ipsEstimatorNumerator

nonZeroProbability

ポリシー評価の 0 以外の値の確率。

nonZeroProbability?: number

プロパティ値

number

承元PolicyResultSummaryOutput.nonZeroProbability

snipsEstimatorDenominator

SNIPS 推定器の分母。

snipsEstimatorDenominator: number

プロパティ値

number

承元PolicyResultSummaryOutput.snipsEstimatorDenominator

sumOfSquares

ポリシー評価結果の 2 乗の合計。

sumOfSquares?: number

プロパティ値

number

承元PolicyResultSummaryOutput.sumOfSquares

timeStamp

集計のタイムスタンプ。

timeStamp: string

プロパティ値

string

承元PolicyResultSummaryOutput.timeStamp