次の方法で共有


FastForestBinaryFeaturizationEstimator クラス

定義

IEstimator<TTransformer>入力特徴ベクトルをツリーベースの特徴に変換する 。

public sealed class FastForestBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastForestBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastForestBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
継承
FastForestBinaryFeaturizationEstimator

注釈

入力列と出力列

入力ラベル列データは Boolean にする必要があります。 入力特徴列データは、 の既知のサイズの Singleベクターである必要があります。

この推定器は、次の列を出力します。

出力列の名前 列の型 説明
Trees 既知のサイズの ベクトル Single すべてのツリーの出力値。 そのサイズは、ツリー アンサンブル モデルのツリーの合計数と同じです。
Leaves 既知のサイズの ベクトル Single 入力特徴ベクトルが入るすべての葉の ID に対する 0 から 1 のベクトル表現。 そのサイズは、ツリー アンサンブル モデルの総リーフ数です。
Paths 既知のサイズの ベクトル Single 入力特徴ベクトルがリーフに到達するために渡されたパスへの 0 から 1 のベクトル表現。 そのサイズは、ツリー アンサンブル モデル内の非リーフ ノードの数です。

これらの出力列はすべて省略可能であり、ユーザーは名前を変更できます。 スキップされた列の名前を null に設定して、生成されないようにしてください。

予測の詳細

この推定器は、ツリー アンサンブル モデルから複数の出力列を生成します。 モデルに含まれるデシジョン ツリーは 1 つだけであるとします。

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

入力特徴ベクトルが に Leaf -1分類されるとします。 出力 Trees は、唯一の値が によって Leaf -1運ばれる決定値である 1 要素ベクトルである場合があります。 出力 Leaves は 0 から 1 のベクトルです。 到達したリーフが$i $-th ($-(i+1)$ によってインデックス付けされているため、最初のリーフが Leaf -1) ツリーのリーフである場合、 の$i$番目の値 Leaves は 1 になり、その他のすべての値は 0 になります。 出力 Paths は、リーフに到達する前に渡されたノードの 0 から 1 の表現です。 の $i$-th 要素 Paths は、$i$番目のノード ($i$でインデックス付き) に触れるかどうかを示します。 たとえば、 に達すると Leaf -1 、 として Paths$[1, 1, 0, 0]$ になります。 複数のツリーがある場合、この推定器は、すべてのツリーから's、Leaves's、Paths'sを連結Treesするだけです(最初のツリーの情報は連結されたベクトルの最初に来ます)。

使用例へのリンクについては、「関連項目」セクションを参照してください。

メソッド

Fit(IDataView)

TreeEnsembleModelParametersinput呼び出InputColumnNameされた列を 3 つの出力列にマップする を生成します。

(継承元 TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator は、 に 3 つの float-vector 列を inputSchema追加します。 特徴ベクトル列を指定すると、追加される列は、すべてのツリーの予測値、特徴ベクトルが分類されるリーフ ID、およびそれらの葉へのパスです。

(継承元 TreeEnsembleFeaturizationEstimatorBase)

拡張メソッド

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

"キャッシュ チェックポイント" をエスティメーター チェーンに追加します。 これにより、ダウンストリーム推定器がキャッシュされたデータに対してトレーニングされます。 複数のデータ パスを受け取るトレーナーの前にキャッシュ チェックポイントを作成すると便利です。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

推定器を指定すると、デリゲートが呼び出されると Fit(IDataView) 呼び出されるラップ オブジェクトを返します。 多くの場合、推定器は適合した内容に関する情報を返すことが重要です。そのため Fit(IDataView) 、メソッドは一般的 ITransformerな ではなく、特に型指定されたオブジェクトを返します。 ただし、同時に、 IEstimator<TTransformer> 多くのオブジェクトを含むパイプラインに形成されることがよくあります。そのため、トランスフォーマーを取得する推定器がこのチェーンのどこかに埋もれている場所を介して EstimatorChain<TLastTransformer> 、推定器のチェーンを構築する必要がある場合があります。 このシナリオでは、このメソッドを使用して、fit が呼び出されると呼び出されるデリゲートをアタッチできます。

適用対象

こちらもご覧ください